Лекции Дежурко

Министерство образования республики Беларусь

УО Белорусский государственный университет







Л.Ф.Дежурко






Эконометрика




Учебно-методическое пособие
Для студентов всех специальностей















Минск 2009



Содержание курса


Тема 1. Основные понятия эконометрики
Определение эконометрики и ее задачи.
Типы данных.
Терминология
Классификация экономических моделей.
Этапы экономического моделирования.
Виды зависимостей.
Тема 2. Парная линейная регрессия
Истинное и выборочное уравнения регрессии.
Метод наименьших квадратов.
Геометрическая интерпретация метода наименьших квадратов.
Экономическая интерпретация коэффициентов парной линейной регрессии.
Основные предпосылки регрессионного анализа. Теорема Гаусса-Маркова.
Расчет стандартных ошибок коэффициентов регрессии.
Проверка значимости коэффициентов регрессии.
Построение доверительных интервалов для параметров теоретической регрессии.
Проверка общего качества уровня регрессии. Коэффициент детерминации.
Проверка значимости коэффициента детерминации.
Оценка тесноты связи между переменными. Коэффициент корреляции.
Проверка значимости коэффициента корреляции.
Прогнозирование.
Тема 3. Нелинейная регрессия
Регрессии, нелинейные по переменным.
Регрессии, нелинейные по параметрам.
Индекс корреляции и индекс детерминации.
Эластичность функции.
Тема 4. Множественная регрессия
Оценка параметров линейной модели множественной регрессии.
Оценка качества множественной линейной регрессии.
Анализ и прогнозирование на основе многофакторных моделей.
Тема 5. Временные ряды
Основные понятия временных рядов.
Основная тенденция развития – тренд.
Построение аддитивной модели.
Тема 6 Эконометрический анализ при нарушении предпосылок
метода наименьших квадратов
Понятие мультиколлинеарности.
Понятие автокорреляции.
Понятие гетероскедастичности.

Тема1:
Основные понятия эконометрики.
Вопросы:
Определение эконометрики и ее задачи.
Типы данных.
Терминология
Классификация экономических моделей.
Этапы экономического моделирования.
Виды зависимостей.

1.
Эконометрика – это наука, изучающая количественные закономерности и взаимосвязи в экономике.
Она зародилась и получила свое развитие на основе слияния экономической теории, математической экономики, экономической и математической статистики. В современной эконометрике широко используются информатика, статистические пакеты прикладных программ.
Объект – экономика, различные экономические явления и взаимосвязи.
Предмет – их количественные характеристики.
Задачи:
1. построение эконометрических моделей и оценивание их параметров.
2. проверка гипотез, о свойствах показателей и формах их связей.
Эконометрический анализ – основа для экономического анализа и прогнозирования.

2.
Эконометрика базируется на реальных экономических данных.
2 типа данных:
1. пространственные данные – данные о каком-либо экономическом показателе, полученные от однотипных объектов и относящиеся к одному моменту (периоду времени). Модели, построенные по пространственным данным, называются пространственными моделями.
2. временные ряды – данные об экономическом показателе, характеризующем какой-либо объект в различные моменты времени. Модели, построенные на временных рядах, называются моделями временных рядов.

3.
Исследуемый экономический показатель называют результативным, объясняемым, зависимым экономическим показателем. Соответствующую переменную – объясняемой или зависимой. Экономические показатели, воздействие которых на исследуемый экономический показатель изучается, называют факторами, объясняющими или независимыми показателями (переменными).

4.
В эконометрике выделяют следующие основные 3 класса моделей:
1. Модели временных рядов:
1. Модели тренда (описывают устойчивые изменения экономического показателя в течение длительного времени).
2. Модели сезонности (описывают устойчивые внутригодовые колебания).
3. Модели авторегрессии (в них описываются влияния значения объясняемого экономического показателя в прошедший момент времени на его значение в текущий момент времени).
2. Регрессионные модели с одним уравнением. В них объясняемый экономический показатель представляется в виде функции от объясняющих экономических показателей (факторов). В зависимости от вида функции эти модели бывают: линейные и нелинейные.
3. Системы одновременных уравнений – это системы регрессионных уравнений, в которых в качестве объясняющих переменных используются объясняемые переменные из других уравнений системы.

5.
1 этап: постановочный. Формулируется цель исследования. Целью может служить анализ возможного развития экономического явления, прогноз экономических показателей, выработка на этой основе управленческих решений.
2 этап: априорный. Проводится анализ связей экономических переменных, выделяются зависимые и независимые переменные.
3 этап: информационный. Осуществляется сбор необходимой статистической информации о значениях экономических переменных.
4 этап: спецификация моделей. Для описания выявленных между экономическими показателями связей, подбирается математическая функция.
5 этап: параметризация. На основе собранных статистических данных об экономических переменных оцениваются параметры (коэффициенты) математических функций.
6 этап: верификация. Проводится проверка адекватности модели, т.е. насколько построенная модель соответствует реальному экономическому явлению.

6.
Все зависимости между экономическими переменными можно разделить на 2 вида:
Функциональные. Если каждому значению независимой переменной или нескольким независимых переменных соответствует одно строго определенное значение зависимой переменной, то такая зависимость называется функциональной. В ней отсутствует воздействие случайных факторов, поэтому в экономике функциональная зависимость встречается редко.
Статистические. В экономике каждому значению независимых переменных может соответствовать несколько значений зависимой переменной в зависимости от воздействия неучтенных и случайных факторов. Например, пусть исследуется зависимость прибыли предприятия от объема производства и цены за единицу продукции. При одном и том же объеме производства и цене за единицу продукции прибыль предприятия может быть различна, т.к. на нее воздействуют множество других факторов, в том числе случайных.
Зависимость между переменными, на которую накладывается воздействие случайных факторов, называется статистической. Для нее характерно то, что изменение независимой переменной приводит к изменению математического ожидания зависимой переменной. Уравнение регрессии – математическая формула, описывающая статистическую зависимость между переменными. Если формула описывается линейной функцией, то регрессия называется линейной. Если нелинейной функцией – нелинейной регрессией. Если регрессия связывает одну зависимую и одну независимую переменную, то такая регрессия называется парной (простой). Если рассматривается зависимость экономической переменной от нескольких экономических переменных, то такая регрессия называется множественной.
Тема 2:
Парная линейная регрессия
Вопросы:
Истинное и выборочное уравнения регрессии.
Метод наименьших квадратов.
Геометрическая интерпретация метода наименьших квадратов.
Экономическая интерпретация коэффициентов парной линейной регрессии.
Основные предпосылки регрессионного анализа. Теорема Гаусса-Маркова.
Расчет стандартных ошибок коэффициентов регрессии.
Проверка значимости коэффициентов регрессии.
Построение доверительных интервалов для параметров теоретической регрессии.
Проверка общего качества уровня регрессии. Коэффициент детерминации.
Проверка значимости коэффициента детерминации.
Оценка тесноты связи между переменными. Коэффициент корреляции.
Проверка значимости коэффициента корреляции.
Прогнозирование.

1.
Пусть исследуется статистическая зависимость экономического показателя У (объясняемая зависимая переменная) от экономического показателя Х (фактора, объясняющей или независимой переменной). Предположим, что зависимость носит линейный характер, тогда ее можно описать уравнением.
У=13 EMBED Equation.3 1415+13 EMBED Equation.3 1415Х+Е13 EMBED Equation.3 1415 (1),
где Х – неслучайная величина, У и Е – случайные величины.
Случайная величина Е отражает воздействие на зависимую переменную У неучтенных и случайных факторов и называется ошибкой регрессии. Уравнение (1) называют истинным (теоретическим) уравнением регрессии или линейной регрессионной моделью. На основе реальных статистических данных об экономических показателях Х и У (выборке данных из генеральной совокупности) оцениваются параметры регрессии
· и
· и строится выборочное уравнение регрессии
13 EMBED Equation.3 1415, (2)
а, в, - коэффициенты регрессии. Уравнение (2) называют еще эмпирическим уравнением регрессии.
Одним из методов нахождения коэффициентов регрессии а и в является метод наименьших квадратов (МНК).

2.
Пусть из генеральной совокупности выбраны данные об экономических показателях У: (у13 EMBED Equation.3 1415, у13 EMBED Equation.3 1415, , у13 EMBED Equation.3 1415) и Х: (х13 EMBED Equation.3 1415, х13 EMBED Equation.3 1415,, х13 EMBED Equation.3 1415). Если в (2) подставить наблюдаемое (выборочное значение хi, то получим расчетное значение 13 EMBED Equation.3 1415 зависимой переменной у:
(3)

Разность между фактическими и расчетными значениями зависимой переменной обозначим ei и назовем остатком, т.е.:
13 EMBED Equation.3 1415 (4)
Суть МНК заключается в следующем: коэффициенты а и в должны быть такими, чтобы сумма квадратов остатков была минимальна
13 EMBED Equation.3 1415 (5)
в (5) уi и xi – известные величины, а а и в – неизвестные.
Запишем необходимые условия экстремума функции S относительно а и b:
13 EMBED Equation.3 1415 (6)
Система (6) является системой двух уравнений относительно двух неизвестных а и b. Она легко преобразовывается в систему (7):
13 EMBED Equation.3 1415 (7)
Разделим оба уравнения системы на n:
13 EMBED Equation.3 141513 EMBED Equation.3 1415 (8)

3.
начертим оси координат Х ,У и изобразим в первой четверти точки (хi,уi)

Полученное изображение называется диаграммой рассеяния или полем корреляции.
Проведем линию регрессии 13 EMBED Equation.3 1415

Согласно МНК, а и в должны быть такими, чтобы построенная линия была ближайшей к точкам поля корреляции по их совокупности.
Сумма квадратов расстояний от точек поля корреляции до линии регрессии должна быть минимальной.
Пример1: исследуется зависимость прибыли предприятия от затрат на приобретение нового оборудования и техники. Собранны статистические данные по пяти однотипным предприятиям. Данные в млн. ден.ед. представлены в таблице 1.

Таблица 1
№ предприятия
Затраты на новое оборудование, хi
Прибыль, уi

1
2
3
4
5
2
6
10
14
18
1
2
4
11
12



























Построить уравнение регрессии.
Данные таблицы представим графически, т.е. построим поле корреляции:

Из полученной диаграммы рассеяния видно, что зависимость статистическая и ее можно представить линейной регрессией 13 EMBED Equation.3 1415. Для оценки коэффициентов регрессии а и в воспользуемся формулами (8), для этого построим рабочую таблицу 2.










































































































Таблица2
е нового оборудования и техники. в была минимальна предприятия
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415

1
2
3
4
5
2
6
10
14
18
1
2
4
11
12
4
36
100
196
324
2
12
40
154
216
1
4
16
121
144

Итого:
50
30
660
424
286

Среднее
10
6
132
84,8
57,2


13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415


Подставим результаты, полученные в таблице 2 в формулы (8): испр.
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
Таким образом, уравнение регрессии, описывающее зависимость прибыли предприятия от затрат на новое оборудование и технику имеет вид:
13 EMBED Equation.3 1415
Выбрав с помощью диаграммы рассеяния для описания зависимости линейную регрессию мы выполнили этап спецификации (подбора функции), а рассчитав коэффициенты а и в, т.е. оценив параметры теоретической регрессии, мы выполнили этап параметризации.

4.
Коэффициент парной линейной регрессии в показывает, как в среднем изменяется зависимый экономический показатель у с изменением независимого фактора х на единицу. Так в примере 1 коэффициент в=0,775 показывает, что при увеличении расходов на приобретение нового оборудования и техники на 1 ден.ед. прибыль предприятия в среднем увеличится на 0,775 ден. ед.
Коэффициент а парной линейной регрессии экономического смысла не имеет.

5.
Для того, чтобы оценки параметров теоретической регрессии, полученные на основе МНК были лучшими по сравнению с оценками, найденными с помощью других методов, должны выполнятся определенные условия, которые называются основными предпосылками регрессионного анализа.
Для того, чтобы их сформулировать, вспомним что теоретическая регрессия описывается уравнением
13 EMBED Equation.3 141513 EMBED Equation.3 1415,
или для i-го наблюдения
13 EMBED Equation.3 1415
Предпосылки:
1. Математическое ожидание случайного члена
· в любом наблюдении должно быть равно 0:
13 EMBED Equation.3 1415
2. Дисперсия случайного члена
· должна быть постоянной для всех наблюдений:
13 EMBED Equation.3 1415
3. Случайные члены должны быть статистически независимы друг от друга:
13 EMBED Equation.3 1415
4. Объясняющая переменная хi – неслучайная величина
Теорема Гаусса-Маркова:
Если выполняются предпосылки 1-4 регрессионного анализа, то оценки параметров теоретической регрессии а и в есть наилучшие линейные оценки, обладающие следующими свойствами:
1. Они являются несмещенными:
13 EMBED Equation.3 1415
2. Они являются эффективными, т.е. имеют наименьшую дисперсию в классе всех несмещенных оценок.
13 EMBED Equation.3 1415 (9)
3. Они являются состоятельными, т.е.
13 EMBED Equation.3 1415
Это значит, что при достаточно большом объеме выборки n, оценки а и в близки к истинным параметрам линейной регрессионной модели
· и
·.

6.
Для расчета дисперсий D(a) и D(в) коэффициентов регрессии а и в в формулах (9) использовалась дисперсия
·2 случайного члена
·. Эта дисперсия неизвестна, но ее можно оценить, используя выборочные данные. Можно доказать, что несмещенной оценкой дисперсии
·2 является величина S2, где:
13 EMBED Equation.3 1415 (10)
Величина S называется стандартной ошибкой регрессии. Она служит мерой разброса зависимой переменной около линии регрессии. Запишем в формулах (9) дисперсию
·2 ее оценкой S2:
13 EMBED Equation.3 1415 (11)
13 EMBED Equation.3 1415и 13 EMBED Equation.3 1415называют оценками дисперсии коэффициентов регрессии, а величина Sa и Sв – стандартными ошибками коэффициентов регрессии. Они используются для построения доверительных интервалов, которым принадлежат параметры истинной регрессии и для проверки значимости коэффициентов регрессии.
Вернемся в Примеру 1 и рассчитаем стандартные ошибки коэффициентов регрессии:
13 EMBED Equation.3 1415

7.
Коэффициента регрессии получены на основании выборочных данных, отобранных случайным образом. Следовательно, коэффициенты регрессии а и в являются случайными числами и их значение может быть лишь случайно оказались отличными от нуля. Поэтому проводят проверку значимости коэффициентов регрессии, т.е. проверку того, значимо ли они отличны от нуля. Для этого используют процедуру проверку гипотез. Проверим значимость коэффициента в. Для этого:
1. Сформулируем гипотезу Н0:
13 EMBED Equation.3 1415.
Она состоит в том, что истинный коэффициент
·=0,
2. В качестве критерия проверки гипотезы принимают случайную величину t:
13 EMBED Equation.3 1415 . (12)
Эта случайная величина имеет распределение Стьюдента с
· = n-2 степенями свободы. Подставим в формулу (12) оцененное по выборке значение коэффициента в и его стандартную ошибку Sв, получим наблюдаемое или расчетное значение t-критерия tрасч.
3. Выбирают уровень значимости проверки гипотезы. Как правило
·= 0,05 или
·=0,01, т.е. пятипроцентный или однопроцентный уровень значимости.
4. По таблице распределения Стьюдента для выборочного уровня значимости
·/2 и
· = n-2 находят t кр. (критическое).
5. Если | tрасч.| > t кр., то гипотеза Н0 о равенстве параметра
·=0 отвергается, параметр
· существенно отличен от нуля, коэффициент в значим, а переменная х оказывает существенное влияние на зависимую у (Н0 считается неверной с вероятностью 1-
·)
6. Если | tрасч.| < t кр., гипотеза Н0 принимается, коэффициент в незначим и переменная х не оказывает существенного влияния на зависимую переменную у.
Замечание: аналогично проверяется значимость коэффициента а в уравнении регрессии, однако проверка значимости коэффициента в имеет гораздо большее значение в регрессионном анализе.
Вернемся в примеру 1 и проверим значимость коэффициента в. Зависимость прибыли предприятия от расходов на новое оборудование и технику описывается регрессией:
13 EMBED Equation.3 1415
(1,65) (0,143).
Формулируем гипотезу Н0, состоящую в том, что истинный коэффициент
·=0, 13 EMBED Equation.3 1415.
Определим tрасч.
13 EMBED Equation.3 1415.
Выбираем уровень значимости проверки гипотезы

·= 0,05.
По таблице распределения Стьюдента для
·/2=0,025 и числа степеней свободы

· = 5-2=3
определим t кр. = 3,182.
5. | tрасч.|=5,4 > t кр.=3,182, поэтому гипотеза Н0 не верна с вероятностью
1-
·= 1-0,05 = 0,95, параметр
· существенно отличен от нуля, коэффициент в значим и затраты на новое оборудование и технику оказывают существенное влияние на прибыль предприятия.

8.

Вспомним, что линейная регрессионная модель (истинная или теоретическая регрессия) имеет вид:
13 EMBED Equation.3 1415 (13)
На основании выборки строится выборочное уравнение регрессии:
13 EMBED Equation.3 1415
Также на основании выборки рассчитывается стандартные ошибки регрессии Sa и Sв.
Можно доказать, что с вероятностью 1-
· (
· – выбранный уровень значимости) значения параметра
· лежат внутри интервала:
13 EMBED Equation.3 1415 13 EMBED Equation.3 1415 (14)
и с вероятностью 1-
· (
· – выбранный уровень значимости) значение параметра
· истинной регрессии лежит внутри интервала:
13 EMBED Equation.3 1415 (15)
Вернемся к Примеру 1 и построим доверительный интервал для параметра
· в регрессионной модели, описывающей зависимость прибыли предприятия от затрат на новое оборудование и технику. Выберем уровень значимости
·= 0,05. т.к. в данном примере
· = 5-2=3 , то t кр. = 3,182, в = 0,775, 13 EMBED Equation.3 1415

Тогда с вероятностью 1-
·= 1-0,05 = 0,95 параметр
· истинной регрессии попадает в интервал
13 EMBED Equation.3 1415
или 0,32
9.
Выборочное уравнение регрессии имеет вид:
13 EMBED Equation.3 1415
тогда
13 EMBED Equation.3 1415
Рассчитаем выборочную дисперсию (вариацию) Var(y):
13 EMBED Equation.3 1415.
Из основных предпосылок регрессионного анализа следует, что 13 EMBED Equation.3 1415, следовательно
13 EMBED Equation.3 1415
т.е. дисперсия зависимой переменной у (Var(y)) распадается на 2 части:
13 EMBED Equation.3 1415- часть, объясняемая уравнением регрессии, и часть 13 EMBED Equation.3 1415- необъяснимая часть, зависящая от неученых и случайных факторов.
Коэффициентом детерминации называют отношение R2:
13 EMBED Equation.3 1415, (16)
которое характеризует долю вариации зависимой переменной, объясненную уравнением регрессии. Из (16) следует что R2 меняется от 0 до 1:
13 EMBED Equation.3 1415,
чем ближе R2 к единице, тем меньше 13 EMBED Equation.3 1415, т.е. доля вариации зависимой переменной, объясняемая случайными и неучеными факторами, тем лучше качество уравнения регрессии. Если 13 EMBED Equation.3 1415=0, то R2=1, имеем функциональную зависимость. Чем ближе R2 к 0, тем больше13 EMBED Equation.3 1415, т.е. больше доля вариации, объясненная случайными и неучеными факторами, тем хуже качество регрессии. Т.к.
13 EMBED Equation.3 1415 (17)
Вернемся к примеру 1, можно посчитать, что:
13 EMBED Equation.3 141513 EMBED Equation.3 141513 EMBED Equation.3 1415
Коэффициент детерминации близок к 1, качество регрессии хорошее.
Можно утверждать, что вариация (изменчивость) прибыли предприятия на 90,7% объясняется затратами на новое оборудование и технику и на 9,3% - прочими неучтенными и случайными факторами.

10.
Т.к. R2 оценивается на основании выборочных данных, то его отличие от 0 может оказаться случайным. Поэтому проводят проверку его значимости:
1. Формулируется гипотеза Н0: R2=0, состоящая в том, что истинный коэффициент детерминации равен 0.
2. В качестве критерия проверки гипотезы применяют случайную величину F:
13 EMBED Equation.3 1415 . (18)
Величина F имеет распределение Фишера с двумя степенями свободы
·1=1,
·2=n-2.
Выберем уровень значимости проверки гипотезы значимости:
13 EMBED Equation.3 1415.
На основании
·,
·1,
·2 в таблице распределения Фишера выбираем Fкр. (критическое)
Сравниваем Fрасч и Fкр.. если Fрасч > Fкр., то с вероятностью 1-
· гипотезу Н0 считаем неверной, т.е. истинный коэффициент детерминации существенно отличен от нуля, уравнение регрессии значимо и переменные, включенные в уравнение регрессии достаточно объясняют поведение зависимой переменной. Если Fрасч < Fкр., то принимаемая гипотеза Н0, уравнение регрессии считается незначимым.
Проверим значимость коэффициента детерминации в примере 1:
Формулируем гипотезу Н0: R2=0.
Находим Fрасч.. В (18) подставим значение коэффициента детерминации, оцененное по выборке:
13 EMBED Equation.3 1415.
3.Выбираем уровень значимости
·=0,005.
4. В таблице распределения Фишера на основании
·=0,05 и для степеней свободы
·1=1,
·2 =5-2=3 найдем Fкр.
13 EMBED Equation.3 1415.
Fрасч =29,2> Fкр.=10,13, поэтому Н0 не верна в вероятностью 1-0,05=0,95, коэффициент детерминации значим, значимо построенное в Примере 1 уравнение регрессии.


11.

Уравнение регрессии всегда дополняется показателем тесноты связи между переменными. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции:
13 EMBED Equation.3 1415, (19)
rxy – безразмерная величина, показывает степень линейной зависимости между переменными. Чем ближе rxy к ±1, тем сильнее линейная зависимость. Чем ближе rxy к 0, тем линейная зависимость слабее. Если rxy = ±1, то имеет место функциональная линейная зависимость. Если rxy = 0, то линейная зависимость отсутствует. Если rxy >0, то связь между переменными положительная, если rxy <0 – отрицательная.



Рассчитаем коэффициент корреляции в примере 1:
13 EMBED Equation.3 1415
rxy >0 и близок к 1 следовательно линейная зависимость между прибылью предприятия и затратами на новое оборудование – положительная и тесная.

12.
Осуществляется аналогично проверки значимости коэффициентов регрессии и детерминации, используется t-статистика:
13 EMBED Equation.3 1415 (20)
Проведем проверку значимости коэффициента корреляции в примере 1:
Формулируем гипотезу, состоящую в том, что истинный коэффициент корреляции равен нулю:
13 EMBED Equation.3 1415.
Подставим значение коэффициента корреляции, вычисленное по выборке в (20):
13 EMBED Equation.3 1415
Выбираем уровень значимости
·=0,05.
Для
·/2=0,025 и для
·=n-2=3 в таблице распределения Стьюдента находим tкр.:
13 EMBED Equation.3 1415
Следовательно, истинный коэффициент корреляции существенно отличен от 0, линейная зависимость между прибылью предприятия и затратами на новое оборудование и технику действительно тесная..
Замечание 1:
В парном линейном регрессионном анализе проверка значимости коэффициента в, коэффициента корреляции и коэффициента детерминации являются эквивалентными.
Замечание 2:
Легко показать, что коэффициент детерминации равен квадрату коэффициента корреляции, 13 EMBED Equation.3 1415,

13.
Прогнозирование на основе эконометрических моделей является одной из основных задач эконометрики.
Под прогнозированием в эконометрике понимают построение оценки зависимой переменной для таких значений независимых переменных, которых нет в исходных наблюдениях.
Различают точечное прогнозирование и интервальное.
.
Точечный прогноз это число, значение зависимой переменной, вычисляемое для заданных значений независимых переменных.
Интервальный прогноз это интервал, в котором с заданным уровнем значимости ( с заданной вероятностью) находится истинное значение зависимой переменной для заданных значений независимых переменных.
Рассмотрим парную линейную регрессионную модель 13 EMBED Equation.3 1415 и соответствующее выборочное уравнение регрессии 13 EMBED Equation.3 1415. Обозначим через ур истинное значение переменной у для заданного значения независимой переменной хр, т.е. 13 EMBED Equation.3 1415.
Точечным прогнозом для ур является 13 EMBED Equation.3 1415, т.е. чтобы получить точечный прогноз нужно в построенное уравнение регрессии подставить заданное значение независимой переменной.
Ошибкой предсказания (13 EMBED Equation.3 1415) называют разность между прогнозным и истинным значениями независимой переменной.
13 EMBED Equation.3 1415

Можно доказать, что дисперсия ошибки предсказания
13 EMBED Equation.3 1415. (21)
Из (21) следует, что чем ближе заданное значение независимой переменной 13 EMBED Equation.3 1415 к 13 EMBED Equation.3 1415тем меньше дисперсия прогноза и чем больше объем выборки n, тем меньше дисперсия прогноза.
Заменив в (21) дисперсию 13 EMBED Equation.3 1415на ее оценку 13 EMBED Equation.3 1415, извлечем, квадратный корень и получим стандартную ошибку предсказания 13 EMBED Equation.3 1415.
13 EMBED Equation.3 1415 (22)
Выберем уровень значимости
· и по таблице распределения Стьюдента найдем tкр. Тогда с вероятностью 1-
· истинное значение переменной ур будет находится внутри интервала:
13 EMBED Equation.3 1415 (23)
Очевидно, что чем ближе 13 EMBED Equation.3 1415к 13 EMBED Equation.3 1415 и чем больше n, тем уже доверительный интервал (тем точнее прогноз). Это надо учитывать, выбирая прогнозные значения для независимой переменной.
Вернемся в Примеру 1 и найдем точечный и интервальный прогнозы для прибыли предприятия для затрат на новое оборудование и технику в размере 20 млн. денежных единиц.
13 EMBED Equation.3 1415
Вывод: с вероятностью 0,95 истинное значение прибыли попадет в полученный интервал.
Тема 3:
Нелинейная регрессия.
Вопросы:
Регрессии, нелинейные по переменным.
Регрессии, нелинейные по параметрам.
Индекс корреляции и индекс детерминации.
Эластичность функции.

Многие экономические зависимости не являются линейными по своей сути и их моделирование линейными регрессиями не дает положительного результата. Так для описания зависимости спроса на некоторый товар от его цены наиболее целесообразно использовать логарифмическую модель. При анализе зависимостей издержек от объема выпуска наиболее обоснованной является полиномиальная модель. Широко используемая функция Кобба-Дугласа, является степенной функцией
13 EMBED Equation.3 1415
У – объем выпуска.
К-затраты капитала.
L - затраты труда.
А,
·,
· – параметры.
В современной экономике применяются также достаточно часто обратные и экспоненциальные модели. Различают регрессии нелинейные по переменным и нелинейные по параметрам.

1.
К регрессиям, нелинейным по переменным относят полиномы различных степеней.:
13 EMBED Equation.3 1415 (1)
13 EMBED Equation.3 1415, (2)
равносторонняя гипербола 13 EMBED Equation.3 1415, (3)
функции вида 13 EMBED Equation.3 1415 (4)
Нелинейность по переменным устраняется путем замены переменной. Так в регрессии (1) сделаем замену х=х1, х2=х2 и получим двухфакторную линейную регрессию.
13 EMBED Equation.3 1415
В уравнении (3) замена переменной имеет вид: 13 EMBED Equation.3 1415, а в (4) - 13 EMBED Equation.3 1415.
Применение метода МНК для оценки коэффициентов соответствующих выборочной регрессии приводит к следующим системам уравнений. Для регрессии (!):
13 EMBED Equation.3 1415 (5).
Для равносторонней гиперболы система уравнений имеет вид:
13 EMBED Equation.3 1415 (6)
Для уравнения (4):

(7)
Приведем некоторые примеры использования уравнений (1-4) в экономике:
Полином третьей степени уравнения (2) часто моделирует зависимость общих издержек У от объема выпуска Х. график имеет вид:

Полином второй степени (уравнение (1)) парабола может описать зависимость между объемом выпуска Х и средними (либо предельными) издержками У

Гипербола (3) (обратная модель) применяется в тех случаях, когда неограниченное увеличение объясняющей переменной Х асимптотически приближает зависимую переменную У к некоторому пределу. Если а и в - оценки параметров гиперболы соответственно, то в зависимости знаков а и в возможны следующие ситуации:

рис.1 рис.2 рис.3
График на рисунке 1 может отражать зависимость между объемом выпуска Х и средними фиксированными издержками У. график на рисунке 2 может описывать зависимость между доходом Х и спросом на блага У. Такие функции называются функциями Тронквиста. Важным приложением графика на рисунке 3 является кривая Филипса, отражающая зависимость между уровнем безработицы Х (%) и процентным изменением заработной платы У.
Уравнения с квадратными корнями (4) использовались в исследовании урожайности и трудоемкости с/х производства.
Пример 1:
На основании информации о норме безработицы и темпах инфляции (таблица 1) построить :
диаграмму рассеяния.
уравнение регрессии, описывающее зависимость темпов инфляции от нормы безработицы.


Таблица 1
№ наблюдения, i
Темпы инфляции, уi
Норма безработицы, хi
zi

1
2
3
4
5
6
7
8
1,1
1,1
1,2
1,3
1,7
2,9
4,2
5,4
6,5
5,4
5,5
5,0
4,4
3,7
3,5
3,4
0,154
0,185
0,182
0,2
0,227
0,270
0,286
0,294


Строим диаграмму рассеяния:

Из диаграммы рассеяния видно, что зависимость можно описать гиперболой 13 EMBED Equation.3 1415. Сделаем замену переменных 13 EMBED Equation.3 1415 и уравнение регрессии примет вид:
13 EMBED Equation.3 1415
Обратимся в Excel к программе регрессия и введем данные zi, 13 EMBED Equation.3 1415, получим:
13 EMBED Equation.3 1415
Замечание:
Для оценки коэффициентов гиперболы можно построить систему уравнений (6) и решить ее.

2.
К нелинейным по параметрам регрессиям относятся:
степенная: 13 EMBED Equation.3 1415, (8)
показательная 13 EMBED Equation.3 1415 , (9)
экспоненциальную 13 EMBED Equation.3 1415. (10)
Нелинейные по параметрам регрессии сводятся к линейным путем логарифмирования.

(8’)
(9’)
(10’)



Для нахождения оценок соответствующих коэффициентов выборочных регрессии для (8’), (9’),(10’) используется МНК при условии, что 13 EMBED Equation.3 1415распределен нормально.
Пример 2:
В таблице 2 приведены данные о расходах на питание и доходах 5 групп населения. Построить степенную регрессию, описывающую зависимость расходов на питание У от доходов населения Х.
Таблица 2

Доходы, х
Расходы, у
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415

1
2
3
4
5
2
6
10
14
18
1
2
4
11
12
1,69
1,79
2,3
2,6
2,9
0
0,69
1,39
2,4
2,48


Степенная регрессия имеет вид:
13 EMBED Equation.3 1415
Получим линейное уравнение. Обратимся к программе «Регрессия», введем данные столбцов v и z, получим:
13 EMBED Equation.3 1415 (11)
Выполним обратные преобразования (пропотенцируем полученное уравнение):
13 EMBED Equation.3 1415
Замечание:
Для построения регрессии (11) можно воспользоваться формулами (8) темы 2.

3.
Уравнение нелинейной регрессии также как и линейной дополняются показателями корреляции и детерминации. Для оценки тесноты связи между переменными рассчитывается индекс корреляции:
13 EMBED Equation.3 1415 (12)
Индекс корреляции (R) меняется от 0 до 1. чем ближе R к 1, тем сильнее нелинейная связь между переменными. Величина
13 EMBED Equation.3 141513 EMBED Equation.3 1415 (13)
используется для оценки качества уравнения регрессии. Для проверки значимости индекса детерминации используется F-статистика
13 EMBED Equation.3 1415
n – объем выборки
m – число параметров при независимых переменных.
Так для параболы m=2, а для степенной функции m=1
4.
В экономическом анализе часто используется эластичность функции. Эластичность функции 13 EMBED Equation.3 1415рассчитывается как относительное изменение у к относительному изменению х:
13 EMBED Equation.3 1415 (15)
Эластичность показывает, насколько процентов изменяется функция 13 EMBED Equation.3 1415при изменении независимой переменной на 1 %.
Для степенной функции 13 EMBED Equation.3 1415 эластичность представляет собой постоянную величину, равную в, действительно :
13 EMBED Equation.3 1415
В примере 2 степенная регрессия 13 EMBED Equation.3 1415 описывает зависимость расходов на питание от доходов. Коэффициент 0,35 экономического смысла не имеет, а коэффициент в, равный 1,183, показывает, что увеличение личного дохода на 1% приведет к увеличению расходов на питание в среднем на 1,183%.
Для остальных функций эластичность не является постоянной величиной. Так для линейной функции 13 EMBED Equation.3 1415эластичность 13 EMBED Equation.3 1415, т.е. эластичность зависит от х, поэтому для остальных функций вычисляется средний показатель эластичности, в частности для линейной функции по формуле:
13 EMBED Equation.3 1415 (16)
Рассчитаем коэффициент эластичности в примере 1 темы 2:
13 EMBED Equation.3 1415
Можно утверждать, что с увеличением расходов на новое оборудование на 1%, прибыль предприятия возрастет на 1,29%.
Тема 4:
Множественная регрессия.
Вопросы:
Оценка параметров линейной модели множественной регрессии.
Оценка качества множественной линейной регрессии.
Анализ и прогнозирование на основе многофакторных моделей.

Множественная регрессия является обобщением парной регрессии. Она используется для описания зависимости между объясняемой (зависимой) переменой У и объясняющими (независимыми) переменными Х1,Х2,,Хk. Множественная регрессия может быть как линейная, так и нелинейная, но наибольшее распространение в экономике получила линейная множественная регрессия.
1.
Теоретическая линейная модель множественной регрессии имеет вид:
13 EMBED Equation.3 1415 (1)

соответствующую выборочную регрессию обозначим:
13 EMBED Equation.3 1415 (2)
Как и в парной регрессии случайный член
· должен удовлетворять основным предположениям регрессионного анализа. Тогда с помощью МНК получают наилучшие несмещенные и эффективные оценки параметров теоретической регрессии. Кроме того переменные Х1,Х2,,Хk должны быть некоррелированы (линейно независимы) друг с другом. Для того, чтобы записать формулы для оценки коэффициентов регрессии (2), полученные на основе МНК, введем следующие обозначения:
13 EMBED Equation.3 1415
Тогда можно записать в векторно-матричной форме теоретическую модель:
13 EMBED Equation.3 1415
и выборочную регрессию
13 EMBED Equation.3 1415.
МНК приводит к следующей формуле для оценки вектора 13 EMBED Equation.3 1415 коэффициентов выборочной регрессии:

13 EMBED Equation.3 1415 (3)
Для оценки коэффициентов множественной линейной регрессии с двумя независимыми переменными 13 EMBED Equation.3 1415, можно решить систему уравнений:
13 EMBED Equation.3 1415 (4)
Как и в парной линейной регрессии для множественной регрессии рассчитывается стандартная ошибка регрессии S:
13 EMBED Equation.3 1415 (5)
и стандартные ошибки коэффициентов регрессии:
13 EMBED Equation.3 1415 (6)
значимость коэффициентов проверяется с помощью t-критерия.
13 EMBED Equation.3 1415 (7)
имеющего распространение Стьюдента с числом степеней свободы v=n-k-1.

2.
Для оценки качества регрессии используется коэффициент (индекс) детерминации:
13 EMBED Equation.3 1415 , (8)
чем ближе 13 EMBED Equation.3 1415к 1, тем выше качество регрессии.
Для проверки значимости коэффициента детерминации используется критерий Фишера или F- статистика.
13 EMBED Equation.3 1415 (9)
с v1 =k, v2=n-k-1 степенями свободы.
В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Для компенсации такого увеличения вводится скорректированный (или нормированный) коэффициент детерминации:
13 EMBED Equation.3 1415 (10)
Если увеличение доли объясняемой регрессии при добавлении новой переменной мало, то 13 EMBED Equation.3 1415может уменьшиться. Значит, добавлять новую переменную нецелесообразно.
Пример 4:
Пусть рассматривается зависимость прибыли предприятия от затрат на новое оборудование и технику и от затрат на повышение квалификации работников. Собраны статистические данные по 6 однотипным предприятиям. Данные в млн. ден. ед. приводятся в таблице 1.

Таблица 1
Номер предприятия, i
Прибыль i-го предприятия, уi
Затраты на новое оборудование i-го предприятия, хi1
Затраты на повышение квалификации на i-м предприятии, хi2

1
2
3
4
5
6
2
3
5
6
8
8
3
3
5
7
9
10
1
4
5
6
8
11


Построить двухфакторную линейную регрессию 13 EMBED Equation.3 1415 и оценить ее значимость. Введем обозначения:
13 EMBED Equation.3 1415
Транспонируем матрицу Х:
13 EMBED Equation.3 1415
Обращение этой матрицы:
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
таким образом зависимость прибыли от затрат на новое оборудование и технику и от затрат на повышение квалификации работников можно описать следующей регрессией:
13 EMBED Equation.3 1415
Используя формулу (5), где k=2 рассчитаем стандартную ошибку регрессии S=0,636.
Стандартные ошибки коэффициентов регрессии рассчитаем, используя формулу (6):
13 EMBED Equation.3 1415
Аналогично:
13 EMBED Equation.3 1415
Проверим значимость коэффициентов регрессии а1, а2. посчитаем tрасч.
13 EMBED Equation.3 1415
Выберем уровень значимости 13 EMBED Equation.3 1415, число степеней свободы
13 EMBED Equation.3 1415
значит коэффициент а1 значим.
Оценим значимость коэффициента а2:
13 EMBED Equation.3 1415
Коэффициент а2 незначим.
Рассчитаем коэффициент детерминации по формуле (7) 13 EMBED Equation.3 1415. Прибыль предприятия на 96% зависит от затрат на новое оборудование и технику и повышение квалификации на 4% от прочих и случайных факторов. Проверим значимость коэффициента детерминации. Рассчитаем Fрасч.:
13 EMBED Equation.3 1415
т.о. коэффициент детерминации значим, уравнение регрессии значимо.

3.
Большое значение в анализе на основе многофакторной регрессии имеет сравнение влияния факторов на зависимый показатель у. Коэффициенты регрессии для этой цели не используется, из-за различий единиц измерения и различной степени колеблемости. От этих недостатков свободные коэффициенты эластичности:


13 EMBED Equation.3 1415 (11)
Эластичность показывает, на сколько процентов в среднем изменяется зависимый показатель у при изменении переменной 13 EMBED Equation.3 1415 на 1% при условии неизменности значений остальных переменных. Чем больше 13 EMBED Equation.3 1415, тем больше влияние соответствующей переменной. Как и в парной регрессии для множественной регрессии различают точечный прогноз и интервальный прогноз. Точечный прогноз (число) получают при подстановке прогнозных значений независимых переменных в уравнение множественной регрессии. Обозначим через:
13 EMBED Equation.3 1415 (12)
вектор прогнозных значений независимых переменных, тогда точечный прогноз
13 EMBED Equation.3 1415 (13)
или
13 EMBED Equation.3 1415 (14)
Стандартная ошибка предсказания в случае множественной регрессии определяется следующим образом:
13 EMBED Equation.3 1415 (15)
Выберем уровень значимости
· по таблице распределения Стьюдента. Для уровня значимости
· и числа степеней свободы
· = n-k-1 найдем tкр. Тогда истинное значение ур с вероятностью 1-
· попадает в интервал:
13 EMBED Equation.3 1415 (16)
Тема 5:
Временные ряды.
Вопросы:
Основные понятия временных рядов.
Основная тенденция развития – тренд.
Построение аддитивной модели.

1.

Временные ряды представляют собой совокупность значений какого-либо показателя за несколько последовательных моментов или периодов времени.
Момент (или период) времени обозначают t, а значение показателя в момент времени обозначают у(t) и называют уровнем ряда.
Каждый уровень временного ряды формируется под воздействием большого числа факторов, которые можно разделить на 3 группы:
Длительные, постоянно действующие факторы, оказывающие на изучаемое явление определяющее влияние и формирующие основную тенденцию ряда – тренд T(t).
Кратковременные периодические факторы, формирующие сезонные колебания ряда S(t).
Случайны факторы, которые формируют случайные изменения уровней ряда
·(t).
Аддитивной моделью временного ряда называется модель, в которой каждый уровень ряда представлен суммой тренда, сезонной и случайной компоненты:
13 EMBED Equation.3 1415. (1)
Мультипликативная модель – это модель, в которой каждый уровень ряда представляет собой произведение перечисленных компонент:
13 EMBED Equation.3 1415. (2)
Выбор одной из моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний примерно постоянна, то строят аддитивную модель. Если амплитуда возрастает, то мультипликативную модель.
Основная задача эконометрического анализа заключается в выявлении каждой из перечисленных компонент.

2.
Основной тенденцией развития (трендом) называют плавное и устойчивое изменение уровней ряда во времени свободное от случайных и сезонных колебаний.
Задача выявления основных тенденций развития называется выравниванием временного ряда.
К методам выравнивания временного ряда относят:
1) метод укрупнения интервалов,
2) метод скользящей средней,
3) аналитическое выравнивание.
1) Укрупняются периоды времени, к которым относятся уровни ряда. Затем по укрупненным интервалам суммируются уровни ряда. Колебания в уровнях, обусловленные случайными причинами, взаимно погашаются. Более четко обнаружится общая тенденция.
2) Для определения числа первых уровней ряда рассчитывается средняя величина. Затем рассчитывается средняя из такого же количества уровней ряда, начиная со второго уровня и т.д. средняя величина скользит по ряду динамики, продвигаясь на 1 срок (момент времени). Число уровней ряда, по которому рассчитывается средняя, может быть четным и нечетным. Для нечетного скользящую среднюю относят к середине периода скольжения. Для четного периода нахождение среднего значения не сопоставляют с определением t, а применяют процедуру центрирования, т.е. вычисляют среднее из двух последовательных скользящих средних.
3) Построение аналитической функции, характеризующей зависимость уровня ряда от времени. Для построения трендов применяют следующие функции:
13 EMBED Equation.3 1415
Параметры трендов определяются с помощью МНК. Выбор наилучшей функции осуществляется на основе коэффициента R2.

3.
Построение аддитивной модели проведем на примере.
Пример 7:
Имеются поквартальные данные об объеме потребления электроэнергии в некотором районе за 4 года. Данные в млн. кВт в таблице 1.
Таблица 1
Год
Квартал
1
2
3
4

1
2
3
4
6,0
4,4
5,0
9,0
7,2
4,8
6,0
10,0
8,0
5,6
6,4
11,0
9,0
6,6
7,0
10,8


Построить модель временного ряда.
В этом примере в качестве независимой переменной рассматриваем номер квартала 13 EMBED Equation.3 1415, а в качестве зависимой переменной y(t) потребление электроэнергии за квартал.
Из диаграммы рассеяния можно увидеть, что тенденция (тренд) носит линейный характер. Видно также наличие сезонных колебаний (период = 4) одинаковой амплитуды, поэтому будем строить аддитивную модель.
13 EMBED Equation.3 1415
Построение модели включает следующие шаги:
Проведем выравнивание исходного ряда методом скользящей средней за 4 квартала и проведем центрирование:
Просуммируем уровни ряда последовательно за каждые 4 квартала со сдвигом на 1 момент времени.
Разделив полученные суммы на, 4 найдем скользящие средние.
Приводим эти значения в соответствие с фактическими моментами времени, для чего найдем среднее значение из двух последовательных скользящих средних – центрированные скользящие средние.
Рассчитаем сезонную вариацию. Сезонная вариация (t) = y(t) – центрированная скользящая средняя. Построим таблицу 2 .

Таблица 2
Сквозной №
квартала t
Потребление
электроэнергии
Y(t)
Скользящая средняя за 4
квартала
Центрированная
скользящая
средняя
Оценка сезонной вариации

1
6,0
-
-
-

2
4,4
6,1
-
-

3
5,0
6,4
6,25
-1,25

4
9,0
6,5
6,45
2,55

5
7,2
6,75
6,625
0,575

:
:
:
:
:

14
6,6
8,35
8,375
-1,775

15
7,0
-
-
-

16
10,8
-
-
-


На основе сезонной вариации в таблице 3 рассчитывается сезонная компонента.
Таблица3
Показатели
Год
Номер квартала в году
I II III IV



1
-
-
-1,250
2,550



2
0,575
-2,075
-1,100
2,700



3
0,550
-2,025
-1,475
2,875



4
0,675
-1,775
-
-


Итого

1,8
-5,875
-3,825
8,125
Сумма

Среднее

0,6
-1,958
-1,275
2,708
0,075

Сезонная
компонента

0,581
-1,977
-1,294
2,690



Устраняем сезонную компоненту из исходных уровней ряда:
13 EMBED Equation.3 1415
Аналитически выравниваем ряд T +
·. Строим регрессию:
13 EMBED Equation.3 1415.
Рассчитываем ошибку:
13 EMBED Equation.3 1415.
Результаты вычислений приведем в таблице 4.

Таблица4
t
Y(t)
S(t)
T(t)+13 EMBED Equation.3 1415(t)=Y(t)--S(t)
T(t)
e

1
6,0
0,581
5,419
5,893
-0,474

2
4,4
-1,977
6,337
6,088
0,256

3
5,0
-1,294
6,294
6,268
0,025

4
9,0
2,690
6,310
6,455
-0,145

5
7,2
0,581
6,619
6,642
-0,023

:
:
:
:
:
:

16
10,8
2,690
8,11
8,701
-5,91


Рассчитываем коэффициент детерминации R2:
13 EMBED Equation.3 1415
Вывод:
Аддитивная модель объясняет 98,4% общей вариации уровней исходного временного ряда.



Тема 6.
Эконометрический анализ при нарушении предпосылок метода наименьших квадратов

Понятие мультиколлинеарности.
Понятие автокорреляции.
Понятие гетероскедастичности

1.
Одним из условий регрессионного анализа является предположение о линейной независимости объясняющих переменных. Однако, может оказаться, что несколько или все объясняющие переменные могут иметь общий временной тренд, относительно которого они совершают малые колебания. Тогда условие линейной независимости объясняющих переменных нарушается.
Мультиколлинеарность – высокая взаимная коррелированность (линейная зависимость) объясняющих переменных. Различают функциональную и стохастическую мультиколлинеарность.
При функциональной мультиколлинеарности определитель матрицы X’X равен 0. В этом случае невозможно решить матричное уравнение (3).
При стохастической мультиколлинеарности определитель матрицы X’X очень мал. Она имеет место, когда хотя бы между двумя объясняющими переменными существует тесная корреляционная связь).
Для определения наличия мультиколлинеарности существуют 2 способа:
Рассчитывается матрица коэффициентов парной корреляции. Если между какими-либо независимыми переменными коэффициент парной корреляции больше 0,8, то считают, что мультиколлинеарность имеет место.
Рассчитывают определитель матрицы X’X и его близость к 0 также свидетельствует о наличии мультиколлинеарности.
Методы устранения мультиколлинеарности:
Из двух объясняющих переменных, имеющих высокий коэффициент корреляции, исключают из рассмотрения ту, которая имеет меньший коэффициент корреляции с зависимой переменной.
Метод включения: независимая переменная включается в уравнение регрессии в том случае, если включение существенно увеличивает значение коэффициента множественной корреляции.
Метод исключения: после построения уравнения регрессии проверяется значимость всех коэффициентов. Из уравнения исключаются независимые переменные с незначимым коэффициентом. Затем получают новое уравнение регрессии и опять проводят оценку значимости коэффициентов.


Пример 5:
Пусть по данным бюджетного обследования 7 случайно выбранных семей изучалась зависимость накоплений у от дохода х1, расходов на питание х2 и стоимости имущества х3. После применения к исходным данным программы «Корреляция» была получена следующая корреляционная матрица:


у
х1
х2
х3

у
1




х1
0,85
1



х2
0,8
0,93
1


х3
-0,75
-0,38
-0,28
1


13 EMBED Equation.3 1415тесная корреляционная связь. значит, одну из этих переменных следует исключить из уравнения регрессии. Исключаем х2, т.к. 13 EMBED Equation.3 1415. Таким образом в уравнение регрессии включаются такие факторы как доход х1 и стоимость имущества х3.
Замечание:
При построении регрессии и подборе независимых переменных необходимо помнить, что объем выборки n (число независимых наблюдений) должно быть в 6-7 раз больше чем число независимых переменных.

2.
Третья предпосылка регрессионного анализа гласит: случайные члены 13 EMBED Equation.3 1415 теоретической регрессии должны быть независимы друг от друга.
Автокорреляция – зависимость текущего значения случайного члена от непосредственно предшествующего значения. Т.о. автокорреляция случайного члена теоретической регрессии нарушает третью предпосылку регрессионного анализа. Причинами автокорреляции могут быть:
ошибки спецификации, т.е. неправильно подобранная математическая функция,
необходимость введения в модель новой переменной,
ошибки наблюдения.
Наличие или отсутствие автокорреляции проверяют с помощью критерия (статистики) Дарбина Уотсона.


13 EMBED Equation.3 1415 (11)
Значение статистики DW распределено в интервале (0,4). По таблице распределения статистики DW на основании уровня значимости
·, объема выборки n и числа объясняющих переменных k находят критические точки d1,d2. Эти точки разбивают отрезок (0,4) на 5 зон:

Проверка автокорреляции:
Формируется гипотеза Н0 об отсутствии автокорреляции:
13 EMBED Equation.3 1415,
и альтернативные гипотезы 13 EMBED Equation.3 1415о наличии положительной автокорреляции и 13 EMBED Equation.3 1415о наличии отрицательной автокорреляции.
2. Выбирается уровень значимости 13 EMBED Equation.3 1415.
3. По таблице распределения DW на основании
·, n и k находят критические точки d1и d2
4. На основании выборочных данных для построенной регрессии по формуле (11) рассчитывается значение статистики DW:
- если 0· принимается гипотеза Н1,
- если d1 - если d2· принимается гипотеза Н0,
- если 4-d2 - если 4-d1· принимается гипотеза Н2.
Если DW попадает в зону неопределенности, то для обнаружения автокорреляции используются другие методы. Если утверждается наличие автокорреляции, то тогда пытаются ее устранить.
.

3.
Вторая предпосылка регрессионного анализа гласит, что дисперсия случайного члена регрессионной модели может быть постоянной для любого наблюдения, т.е.:
13 EMBED Equation.3 1415
Это условие называется гомоскедастичностью (одинаковой разбросанностью).
Зависимость дисперсии случайного члена от номера наблюдения называется гетероскедастичностью, 13 EMBED Equation.3 1415
А) гомоскедастичность Б) гетероскедастичность

Для обнаружения гетероскедастичности используются различные тесты. Например, тест ранговой корреляции Спирмена. При наличии гетероскедастичности для оценки параметров регрессионной модели используют обобщенные (или взвешенный МНК(ОМНК)).
Пример 6:
Пусть исследуется зависимость денежных сбережений у от среднедушевых доходов х в 12 семьях. Данные в млн. руб. приводятся в таблице1:

Таблица1
i
yi
xi
i
yi
xi

1
2
3
4
5
6
0,3
0,1
2,2
0,9
4,0
1,7
1
2
3
4
5
6
7
8
9
10
11
12
5,8
2,5
7,5
3,0
9,0
3,4
7
8
9
10
11
12


Из диаграммы рассеяния видно, что зависимость носит линейный характер, и что с ростом доходов х вариация (разброс) отклонений сбережений у от линии регрессии растет пропорционально х, что позволяет сделать вывод о наличии гетероскедастичности.
Построим регрессию 13 EMBED Equation.3 1415используя МНК и ОМНК. Обратимся к программе «Регрессия» и введем данные таблицы. Получим уравнение регрессии на основе МНК:
13 EMBED Equation.3 1415
(1,316) (0,179)
Предположим, что имеет место гетероскедастичность, тогда регрессионная модель имеет вид:
13 EMBED Equation.3 1415
Разделим обе части этой модели на 13 EMBED Equation.3 1415:
13 EMBED Equation.3 1415
В последней модели случайная ошибка
· не зависит от объясняющей переменной 13 EMBED Equation.3 1415. Сделаем замену переменных:
13 EMBED Equation.3 1415
Получим регрессионную модель:
13 EMBED Equation.3 1415,
для которой применим классический МНК. В таблице2 подготовим данные для построения последней регрессионной модели:





Таблица2
i
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415
i
13 EMBED Equation.3 1415
13 EMBED Equation.3 1415

1
2
3
4
5
6
0,3
0,05
0,733
0,225
0,8
0,283
1
0,5
0,333
0,25
0,2
0,166
7
8
9
10
11
12
0,828
0,312
0,833
0,3
0,818
0,283
0,142
0,125
0,111
0,1
0,09
0,083



Для преобразованных данных применим МНК. Получим регрессию
13 EMBED Equation.3 1415
(0,12) (0,333)
Делаем обратную замену переменных:
13 EMBED Equation.3 1415
ОМНК:
13 EMBED Equation.3 1415
(0,333) (0,12)
МНК:
13 EMBED Equation.3 1415
(1,316) (0,179)
Стандартные ошибки коэффициентов регрессии, построенной на основе ОМНК, меньше соответствующих ошибок регрессии, построенной на основе МНК. Поэтому в данном примере уравнение регрессии, построенное на основе ОМНК предпочтительнее.


Литература


Магнус Л.Р., Катышев П.К., Пересецкий А.А. Эконометрика. М., Дело, 2004.
Бородич С.А. Эконометрика. Минск: Новое знание, 2001.
Эконометрика. Под редакцией Елисеевой И.И. М.: Финансы и статистика, 2007.
Доугерти К. Введение в эконометрику. М.: ИНФРА-М, 2004.
Экономико-математические методы и модели. Под ред. Миксюк С.Ф. Мн.: БГЭУ, 2006.
Экономико-математические методы и модели; практикум. Под ред. Миксюк С.Ф. Мн.: БГЭУ, 2006.









13PAGE 15


13PAGE 142315



13 EMBED Equation.3 1415

13 EMBED Equation.3 1415

13 EMBED Equation.3 1415



Root EntryEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativemEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation Native

Приложенные файлы

  • doc 4261084
    Размер файла: 678 kB Загрузок: 1

Добавить комментарий