Регрессионный анализ экспериментальных данных Филева


МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
Федеральное государственное автономное образовательное учреждение высшего профессионального образования
“НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ “МИСиС”
Институт ИТАСУ
Кафедра Автоматизации
Курсовая работа по дисциплине “Метрологическое обеспечение систем автоматизации”
на тему “Регрессионный анализ экспериментальных данных”
Группа МАТПП-17-2-2
Студент Филева А.В. Преподаватель Сириченко А.В.
Москва, 2017 г.
Содержание
TOC \o "1-3" \h \z \u Условие задачи PAGEREF _Toc496380116 \h 3Теоретическое введение PAGEREF _Toc496380117 \h 4Решение PAGEREF _Toc496380118 \h 5Вывод PAGEREF _Toc496380119 \h 14Список используемой литературы PAGEREF _Toc496380120 \h 14
Условие задачиПрочность Y (кг/см2) бетона при испытании цилиндрических образцов в зависимости от отношения X = h / a высоты h к диаметру a оказалась равной:
X 1,5 2,9 3 3,1 3,2 3,4 3,5 3,6 4,2
Y 580 618 658 670 662 699 717 775 786
На основании опытных данных требуется:
1. Построить корреляционное поле. По характеру расположения точек в корреляционном поле подобрать вид функции регрессии.
2. Написать уравнение функции регрессии.
3. Определить тесноту корреляционной связи между рассматриваемыми признаками.
4. Проверить адекватность модели.
5. Построить линию регрессии в системе координат.
Теоретическое введениеРегрессионный анализ - это метод установления аналитического выражения стохастической зависимости между исследуемыми признаками. Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из xi, и имеет вид:

где у - зависимая переменная (она всегда одна);
хi - независимые переменные (факторы) (их может быть несколько).
Если независимая переменная одна - это простой регрессионный анализ. Если же их несколько (п 2), то такой анализ называется многофакторным.
В ходе регрессионного анализа решаются две основные задачи:
построение уравнения регрессии, т.е. нахождение вида зависимости между результатным показателем и независимыми факторами x1, x2, …, xn.
оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.
Применяется регрессионный анализ главным образом для планирования, а также для разработки нормативной базы.
В отличие от корреляционного анализа, который только отвечает на вопрос, существует ли связь между анализируемыми признаками, регрессионный анализ дает и ее формализованное выражение. Кроме того, если корреляционный анализ изучает любую взаимосвязь факторов, то регрессионный - одностороннюю зависимость, т.е. связь, показывающую, каким образом изменение факторных признаков влияет на признак результативный.
Регрессионный анализ - один из наиболее разработанных методов математической статистики. Строго говоря, для реализации регрессионного анализа необходимо выполнение ряда специальных требований (в частности, xl,x2,...,xn; y должны быть независимыми, нормально распределенными случайными величинами с постоянными дисперсиями). В реальной жизни строгое соответствие требованиям регрессионного и корреляционного анализа встречается очень редко, однако оба эти метода весьма распространены в экономических исследованиях. Зависимости в экономике могут быть не только прямыми, но и обратными и нелинейными. 

РешениеРешение поставленной задачи будет производится с помощью программного обеспечения Microsoft Office, а именно средствами приложения Excel.
На основании исходных данных построим корреляционное поле:

Рисунок 1 Корреляционное поле
Исходя из характера расположения точек, можно предположить, что наилучшим образом данную зависимость будет описывать степенная или логарифмическая регрессионная функция. Для проверки данного предположения сформируем гипотезы о форме связи и произведём расчёт параметров для четырёх различных типов функций:
Линейной
Степенной
Логарифмический
Показательной
а) Линейная парная регрессия рассчитывается по следующей формуле:
ŷ = b∙x+aДля расчёта параметров a и b используем формулы:
a = y - b∙xb =yx-y∙xx2-x2Где y,x – средние значения велечин, представленные в Таблице 1.
Таблица 1
Линейная регрессия y = bx+a
  X Y X2 XY
1 1,5 580 2,25 870
2 2,9 618 8,41 1792,2
3 3 658 9 1974
4 3,1 670 9,61 2077
5 3,2 662 10,24 2118,4
6 3,4 699 11,56 2376,6
7 3,5 717 12,25 2509,5
8 3,6 775 12,96 2790
9 4,2 786 17,64 3301,2
Среднее 3,155556 685 10,43556 2200,989
Вычислим значения коэффициентов регрессии a и b:
b= 2200,989-3,15*68510,44-3,15*3,15=82,49a=685-82,49*3,15=424,69Следовательно линейное уравнение регрессии будет выглядеть следующим образом:
ŷ=424,69+82,49x
Рисунок 2 Линейная парная регрессия
б) Степенная парная регрессия рассчитывается по следующей формуле:
ŷ = a∙xbДля определения параметров a и b необходимо линеаризировать его, для чего логарифмируем его правую и левую части:
lgŷ=lga+b∙lgxОбозначим ŷ*=lgŷ, a*=lga, x*=lgx
Тогда:
ŷ = b∙x*+a*Для расчёта параметров a и b используем формулы:
b =y*x*-y*∙x*x*2-x*2a*= y* - b∙x*Таблица 2
  X Y X*=lg(x) Y*=lg(y) X*2 X*Y*
1 1,5 580 0,176 2,763 0,031 0,487
2 2,9 618 0,462 2,791 0,214 1,291
3 3 658 0,477 2,818 0,228 1,345
4 3,1 670 0,491 2,826 0,241 1,389
5 3,2 662 0,505 2,821 0,255 1,425
6 3,4 699 0,531 2,844 0,282 1,512
7 3,5 717 0,544 2,856 0,296 1,554
8 3,6 775 0,556 2,889 0,309 1,607
9 4,2 786 0,623 2,895 0,388 1,805
Среднее 3,156 685,000 0,485 2,834 0,249 1,379
Вычислим значения коэффициентов регрессии a и b:
b =1,379-0,485∙2,8340,249-0,485∙0,485=0,291a* =2,834-0,291*0,485=2,693a=10a*=102.693=492,618Следовательно степенное уравнение регрессии будет выглядеть следующим образом:
ŷ=0,291∙x2,693+2,693
Рисунок 3 Степенная парная регрессия
в) Уравнение логарифмической регрессии имеет следующий вид:
ŷ = a+b∙lgxДля определения параметров a и b обозначим lgx=x* и представим уравнение в следующем виде:
ŷ = a+b∙x*Для расчёта параметров a и b используем формулы:
b =yx*-y∙x*x*2-x*2a= y - b∙x*Таблица 3
  X Y X*=lg(x) X*2 X*Y
1 1,5 580 0,176 0,031 102,133
2 2,9 618 0,462397998 0,213811908 285,76
3 3 658 0,477 0,228 313,946
4 3,1 670 0,491 0,241 329,212
5 3,2 662 0,505 0,255 334,409
6 3,4 699 0,531 0,282 371,504
7 3,5 717 0,544 0,296 390,097
8 3,6 775 0,556 0,309 431,134
9 4,2 786 0,623 0,388 489,874
Среднее 3,156 685 0,485 0,249 338,675
Вычислим значения коэффициентов регрессии a и b:
b =338,675-685∙0,4850,249-0,485*0,485=447,58a =685-447,58*0,485=467,81Следовательно логарифмическое уравнение регрессии будет выглядеть следующим образом:
ŷ=467,81+447,58lgx
Рисунок 4 Логарифмическая регрессия
г) Уравнение логарифмической регрессии имеет следующий вид:
ŷ = a∙bxДля определения параметров a и b необходимо линеаризировать его, для чего прологарифмируем правую и левую части уравнения:
lgŷ=lg(a+bx)=lga+x∙lgbОбозначим ŷ*=lgŷ, a*=lga, b*=lgb
Тогда:
ŷ* =a*+b*∙xДля расчёта параметров a и b используем формулы:
b* =y*x-y*∙xx2-x2a*= y* - b*∙xТаблица 4
  X Y Y*=lg(y) X2 XY*
1 1,5 580 2,763 2,25 4,145
2 2,9 618 2,791 8,41 8,094
3 3 658 2,818 9 8,455
4 3,1 670 2,826 9,61 8,761
5 3,2 662 2,821 10,24 9,027
6 3,4 699 2,844 11,56 9,671
7 3,5 717 2,856 12,25 9,994
8 3,6 775 2,889 12,96 10,401
9 4,2 786 2,895 17,64 12,161
Среднее 3,156 685,000 2,834 10,436 8,968
Вычислим значения коэффициентов регрессии a и b:
b =8,968-2,834∙3,15610,436-3,156∙3,156=0,05b=10b*=100,05=1,13a* =2,834-0,053*3,156=2,666a=10a*=102.666=463,406Следовательно степенное уравнение регрессии будет выглядеть следующим образом:
ŷ=2,666∙0,05x
Рисунок 5 Показательная регрессия
Оценка тесноты связи с помощью показателей корреляции и детерминации
а) Коэффициент корреляции для линейной регрессии определяется по формуле:
rxy =yx-y∙xσy∙σxГде σy=y2-y2; σx=x2-x2.Тогда:
σx=10,435-3,15*3,15=0,69σy=473282,6-685*685=63,69rxy =2200,989-3,155∙6850,69*63,69=0,895Коэффициент детерминации для линейной регрессии рассчитывается по формуле:
R2=rxy2=0,8952=0,802б) Коэффициент корреляции для степенной регрессии определяется по формуле:
ρyx =1-σe2σy2Где
σe=e2-e2=(y-ŷ)2nТогда:
σe=4,46∙10-4-0∙0=4,46∙10-4σy=8,032-2,834*2,834=0,04ρyx=1-4,46∙10-40,042=0,853Коэффициент детерминации для степенной регрессии рассчитывается по формуле:
R2=ρyx2=0,8532=0,728
в) Коэффициент корреляции для логарифмической регрессии определяется по формуле:
rxy =yx*-y∙x*σy∙σx*Где σy=y2-y2; σx*=x*2-x*2.Тогда:
σx=0,249-0,485*0,485=0,118σy=473282,556-685*685=63,699rxy =338,675-685*0,4850,118*63,699=0,833Коэффициент детерминации для логарифмической регрессии рассчитывается по формуле:
R2=rxy2=0,8332=0,693г) Коэффициент корреляции для показательной регрессии определяется по формуле:
ρyx =1-σe2σy2Где
σe=e2-e2=(y-ŷ)2nТогда:
σe=2,83∙10-4-0∙0=2,83∙10-4σy=8,032-2,834*2,834=0,04ρyx=1-1-2,83∙10-40,042=0,909Коэффициент детерминации для показательной регрессии рассчитывается по формуле:
R2=ρyx2=0,9092=0,827
Оценка статистической надёжности результатов регрессионного моделирования с помощью F-критерия Фишера.
Определим значение фактического Fфакт:
а) для линейной
Fфакт.=R21-R2∙n-2=0,8021-0,0,802∙8-2=28,3б) для степенной
Fфакт.=R21-R2∙n-2=0,1271-0,127∙8-2=18,69в) для логарифмической
Fфакт.=R21-R2∙n-2=0,6931-0,693∙8-2=15,786г) для показательнойFфакт.=R21-R2∙n-2=0,8271-0,827∙8-2=33,469Fтабл. При уровне значимости α = 0,05, при одной независимой переменной равен 5,59. Все полученные показатели превышают табличное значение F-критерия Фишера, значит вероятность нулевой гипотезы ниже заданного уровня. Отсюда можно сделать вывод, что все уравнения статистически значимы, т.е. признаётся надёжность уравнений регрессии. Т.к. наибольшее значение коэффициента детерминации имеет степенная функция, то она подходит наилучшим образом для регрессионной модели.
ВыводВ работе был проведён анализ исходных данных, а так же произведён расчёт параметров четырёх вариантов регрессионных моделей разного вида и выбран оптимальный.
Список используемой литературыЭконометрика: Учебное пособие. – Комсомольск-на-Амуре: ГОУВПО «КнАГТУ», 2005 – 138с.
Эконометрика: Учебник/Под ре. И.И. Елисеевой. _М.; Финансы и статистика, 2002 – 344с.

Приложенные файлы

  • docx 2110120
    Размер файла: 64 kB Загрузок: 0

Добавить комментарий