07. Спецификация уравнения регрессии. Выбор переменных


Чтобы посмотреть презентацию с картинками, оформлением и слайдами, скачайте ее файл и откройте в PowerPoint на своем компьютере.
Текстовое содержимое слайдов презентации:

Спецификация уравнения множественной регрессии. Выбор переменных Лекция Спецификация уравнения регрессии Выбор переменныхВыбор формы зависимости (следующая лекция) Цели лекции 1. Рассмотрение проблемы спецификациипеременных в уравнениях множественнойлинейной регрессии2. Изучить последствия неправильноговыбора переменных3. Найти средства, позволяющие улучшитьпроцедуру выбора переменных Выбор переменных множественной регрессии Включение и исключение переменных1. Влияние на коэффициенты уравнения2. Влияние на значимость коэффициентоврегрессии и уравнения в целом3. Линейные ограничения4. Тесты ошибочной спецификации Будем также говорить об исключении переменной из правильно специфицированного уравнения регрессии Последствия не включения в уравнение существенной переменной Переменная называется существенной,если она должна быть включена вуравнение (согласно правильной теории) Последствия не включения в уравнение существенной переменной 1. Уменьшается возможность правильной оценкии интерпретации уравнения2. Коэффициенты при оставшихся переменныхмогут оказаться смещенными3. Их стандартные ошибки, t-статистики и другиепоказатели качества становятся некорректными ине могут быть использованы для суждения окачестве уравнения Механизм разрушения оценок Если объясняющие переменные коррелированы, то нарушается предпосылка 40 некоррелированности случайного члена и объясняющих переменных Отсутствие существенной переменной Если объясняющая переменная X2 отсутствует, то где Направление смешения зависит от знака истинного значения коэффициента при отсутствующей переменной и ковариации объясняющих переменных Отсутствие существенной переменной Оценка смещения коэффициента 1. Ковариация оценивается по выборке2. Знак коэффициента при отсутствующей переменной берется из экономической теории Отсутствие существенной переменной Направление смещения коэффициента Коэффициент детерминации может оставаться большим за счет кажущегося эффекта замещающей переменной Отсутствие существенной переменной Направление смещения коэффициента Будем также говорить о включении лишней переменной в правильное уравнение регрессии Последствия включения в уравнение несущественной переменной Переменная называется несущественной,если она не должна быть включена вуравнение (согласно правильной теории) Последствия включения в уравнение несущественной переменной 1. Не теряется возможность правильной оценкии интерпретации уравнения2. Коэффициенты при существенных переменныхостаются несмещенными3. Стандартные ошибки растут, t-статистикиуменьшаются, эффективность оценок падает4. Несущественная переменная может бытьзначимой, уравнение с ней – давать лучшую оценку5. Увеличивается риск мультиколлинеарности Часто бывает, что мы не можем найти данные по переменной, которую нужно включить в уравнение регрессии Причины использования замещающей переменной:1. В уравнении отсутствует существенная переменная со всеми вытекающими из этого последствиями.2. Результаты оценки регрессии с включением замещающей переменной могут дать косвенную информацию об отсутствующей переменной Замещающие переменные Замещающая переменная – это переменная, котораякоррелирует с отсутствующей переменной уравнениярегрессии, и за счет этого выполняет функции этойотсутствующей переменной Включение замещающей переменной позволяет правильно оценить роль других факторов, освободив их от функции замещения отсутствующей переменной Коэффициенты замещающих переменных не имеют интерпретации, а сами замещающие факторы не могут быть использованы для формирования экономической политики Замещающие переменные Пример: Время как замещающая переменная для показателятехнического прогресса в производственной функции Кобба-Дугласа Выбор переменных множественной регрессии Включение и исключение переменных1. Влияние на коэффициенты уравнения2. Влияние на значимость коэффициентоврегрессии и уравнения в целом3. Линейные ограничения4. Тесты ошибочной спецификации Эквивалентность предполагает двухстороннюю альтернативу для t-критерия Эквивалентный метод – использование F-критерия Оценка значимости включаемой переменной Значимость включаемой переменнойоценивается t-статистикой коэффициента Значимость группы переменных не означает значимости каждой из переменных в этой группе Оценка значимости включаемой группы переменных Значимость включаемой группыпеременных оценивается F-тестом Данный тест может также использоваться для обратной процедуры: оценки значимости ухудшения качества модели при исключении из модели s переменных: Оценка значимости включаемой группы переменных F-статистика может быть найдена черезкоэффициенты детерминации Четыре критерия для включения переменной в уравнение регрессии 1. Роль переменной в уравнении опирается напрочные теоретические основания2. Высокое значение t-статистики коэффициента приновой переменной3. Скорректированный коэффициент детерминациирастет при включении переменной 4. Другие коэффициенты испытывают значительноесмещение при включении новой переменной Обе процедуры могут привести к серьезным ошибкам и следует избегать их автоматического применения, либо резко ограничивать объем поиска Процедуры поиска существенных переменных 1. Последовательный восходящий поиск2. Последовательный нисходящий поиск Выбор переменных множественной регрессии Включение и исключение переменных1. Влияние на коэффициенты уравнения2. Влияние на значимость коэффициентоврегрессии и уравнения в целом3. Линейные ограничения4. Тесты ошибочной спецификации Справедливость гипотезы о наличии линейного ограничения позволяет исключить лишнюю переменную (m  m1). Проверка проводится по F-критерию или по t-критерию (непосредственно для включаемой переменной) Проверка наличия линейных ограничений Линейным ограничением называется условиелинейной зависимости коэффициентов регрессии Выбор переменных множественной регрессии Включение и исключение переменных1. Влияние на коэффициенты уравнения2. Влияние на значимость коэффициентоврегрессии и уравнения в целом3. Линейные ограничения4. Тесты ошибочной спецификации 1. Оценивается уравнение регрессии 2. Вычисляются степени зависимой переменной 3. Оценивается уравнение регрессии 4. Проводится оценка улучшения по F-критерию Тест ошибочной спецификации Рамсея Тест Рамсея позволяет проверить, стоит ли начинать поискдополнительной переменной для включения в уравнение Является вариантом скорректированного коэффициента детерминации и превосходит его Тест ошибочной спецификации Амемии (Акаике) Выбирается уравнение с меньшим значением PCСмысл теста Амемии в том, что он позволяетминимизировать среднюю ошибку оценки b Вложенная модель является частным случаем (ограниченной версией) более общей модели.Невложенные модели имеют разные наборы переменных. Выбор переменных регрессии: вложенные и невложенные модели Вложенные модели непосредственно сравнимы. Сравнениеневложенных моделей возможно только с помощьюспециальных процедур. 1. Оценивается уравнение регрессии (A)2. Расчетные значения зависимой переменной из модели (A)включаются в модель (B) в качестве дополнительнойобъясняющей переменной 3. Проводится оценка улучшения модели по F-критерию4. Делается симметричная процедура J-тест ошибочной спецификации Дэвидсона-МакКиннона для невложенных моделей J-тест ошибочной спецификации Дэвидсона-МакКиннона для невложенных моделей В результате применения теста возможны четыре случая:1. Модель (A) значимо улучшается, а (B) – нет.Вывод: выбираем модель (B).2. Модель (B) значимо улучшается, а (A) – нет.Вывод: выбираем модель (A).3. Обе модели значимо улучшаются.Вывод: ни одна из них не пригодна.4. Обе модели улучшаются не значимо.Вывод: данных недостаточно, чтобы различить качествомоделей. Конец лекции

Приложенные файлы

  • ppt 6648771
    Размер файла: 174 kB Загрузок: 0

Добавить комментарий