Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Тема 5. Линейная модель множественной регрессии
Решая задачи с использованием корреляционно-регрессионного анализа, всегда приходится иметь в виду, что зависимость некоторого количественного признака Y от какой-либо переменной X — не единственная (и, может быть, не самая существенная) причина вариации Y. Как правило, существует, по крайней мере, две-три переменные, влияние которых на Y является сопоставимым по важности. Такого рода проблемы приводят к необходимости построения модели множественной регрессии, когда вместо одной объясняющей переменной X используется несколько переменных X1, X2, ..., Xk. Основной материал по теме множественной регрессии изложен в параграфах 3.4.1-3.4.6. При изучении параграфа 3.4.1 Оценка параметров модели множественной регрессии особое внимание следует обратить на вопросы, связанные с отбором факторов в модель. Наиболее важным здесь является понятие мультиколлинеарности. Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. Мультиколлинеарность исходных данных является одним из существенных препятствий для эффективного применения аппарата регрессионного анализа. Особенно часто с этой проблемой приходится сталкиваться в регрессионном анализе экономических данных, содержащих результаты наблюдений по времени, когда входные переменные меняются от точки к точке почти синхронно. Необходимо знать к каким последствиям приводит мультиколлинеарность. Следует внимательно рассмотреть способы обнаружения мультиколлинеарности, а также методы для устранения или уменьшения мультиколлинеарности. Самый простой из них (но не всегда самый эффективный) состоит в том, что из двух объясняющих переменных, имеющих высокий коэффициент корреляции (больше 0, 8), одну переменную исключают из рассмотрения. При этом какую переменную оставить, а какую удалить из анализа, решают в первую очередь на основании экономических соображений. Если с экономической точки зрения ни одной из переменных нельзя отдать предпочтение, то оставляют ту из двух переменных, которая имеет больший коэффициент корреляции с зависимой переменной. При построении модели множественной регрессии можно использовать стратегию шагового отбора, реализованную в ряде алгоритмов пошаговой регрессии. Здесь получили распространение две схемы отбора: метод включения и метод исключения. Ни одна их этих процедур не гарантирует получения оптимального набора переменных. Однако при практическом применении они позволяют получить достаточно хорошие наборы существенно влияющих факторов. При отборе факторов также рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6–7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной дисперсии очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, а - критерий меньше табличного значения. Оценка параметров множественной регрессии методом наименьших квадратов рассматривается также в этом параграфе. Оценку качества модели множественной регрессии следует изучать по материалам параграфа 3.4.2. К основным характеристикам качества многофакторных регрессионных моделей относятся: коэффициент детерминации , скорректированный , коэффициент множественной корреляции, стандартная ошибка и средняя относительная ошибка аппроксимации. Для проверки значимости модели регрессии используется F-критерий Фишера. значимость отдельных коэффициентов регрессии проверяется по t-статистике. Для того чтобы регрессионный анализ, основанный на обычном методе наименьших квадратов, давал наилучшие из всех возможных результаты, случайный член должен удовлетворять основным условиям, поэтому необходимо осуществлять проверку выполнения предпосылок МНК. Самыми важными являются предпосылки о независимости случайных составляющих в различных наблюдениях и равноизменчивости. Важные понятие автокорреляции остатков и методы их обнаружения рассмотрены в параграфе 3.4.2. Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов. При использовании перекрестных данных наличие автокорреляции (пространственной корреляции) крайне редко. Автокорреляция может быть также следствием ошибочной спецификации эконометрической модели. Кроме того, наличие автокорреляции остатков может означать, что необходимо ввести в модель новую независимую переменную. Следует усвоить такие понятия как гомоскедастичность и гетероскедастичность. Необходимо иметь представление о методах проверки условия гомоскедастичности, или равноизменчивости случайной составляющей. Анализ экономических объектов и прогнозирование с помощью модели множественной регрессии подробно и на примере рассматривается в параграфе 3.4.4. Изучая этот материал, необходимо помнить о практической важности вопроса. При несоблюдении основных предпосылок обычного метода наименьших квадратов приходится корректировать модель: изменять ее форму, добавлять или, наоборот, исключать факторы, преобразовывать исходные данные и т.п. При наличии гетероскедастичности в остатках рекомендуется традиционный метод наименьших квадратов (МНК) заменять обобщенным методом наименьших квадратов (ОМНК), который рассмотрен в параграфе 3.4.4. Обобщенный метод наименьших квадратов применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии. Особенности применения нелинейной регрессии, включенные в программу данной дисциплины, можно изучать по материалу параграфа 3.4.5. С основными понятиями производственных функций рекомендуется ознакомиться по материалам параграфа 3.4.6. В завершении темы следует изучить параграф 3.4.7- Регрессионные модели с переменной структурой (фиктивные переменные). В качестве основного литературного источника рекомендуется использовать [2, 4], в качестве дополнительного – [3].
|
Последнее изменение этой страницы: 2017-05-11; Просмотров: 110; Нарушение авторского права страницы