Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Гетероскедастичные и автокоррелированные остатки в линейных регрессионных моделях.
Итак, при исследовании остатков ei должно проверяться наличие следующих предпосылок МНК: 1) остатки должны иметь случайный характер; 2) средняя величина остатков должна равняться 0 и не зависеть от хi; 3) дисперсия отклонений ei должна быть одинакова для разных значений хi, это называется гомоскедастичность; 4) должна отсутствовать автокорреляция остатков, иначе, значения остатков ei распределяются друг от друга независимо; 5) остатки распределены по нормальному закону. Если случайные остатки ei имеет распределение, не соответствующее некоторым предпосылкам МНК, модель следует корректировать. В случае нарушения первых двух предпосылок следует применить другую функцию, или ввести дополнительную информацию и строить заново уравнение регрессии. Пятая предпосылка позволяет осуществлять проверку параметров регрессии с помощью критериев t, F. Однако и при невыполнении пятой предпосылки МНК получающиеся оценки регрессии достаточно состоятельны. Третья и четвертая предпосылка совершенно необходимы, чтобы получить по МНК состоятельные оценки параметров регрессии. При несоблюдении гомоскедастичности имеет место гетероскедастичность. Она порождает смещенность оценок коэффициентов регрессии, а также уменьшает их достоверность. Поэтому все выводы, полученные на основе t- и F-статистик, и интервальные оценки являются ненадежными. Поэтому и статистические выводы, сделанные при стандартных проверках, могут оказаться ошибочными и приводить к построению неэффективной модели. При этом стандартные ошибки коэффициентов оказываются заниженными, а t-статистики завышенными. При этом статистически значимыми могут оказаться коэффициенты, которые на самом деле ими не являются. В подобной ситуации применяют обобщенный метод наименьших квадратов, заключающийся в том, что минимизация суммы квадратов отклонений производится при взвешивании отдельных ее слагаемых: наблюдения с большей дисперсией складываются с пропорционально меньшим весом. Чтобы установить гетероскедастичность остатков и, следовательно, необходимость использования обобщенного МНК, не ограничиваются визуальной проверкой поведения остатков, а используют эмпирическое подтверждение, например, метод Гольдфельда – Квандта. Покажем его действие на примере (табл.2.3). Таблица 2.3. Поступления налогов в бюджет (yi – млн.руб.) от численности работающих (хi – тыс.чел).
По этим данным получаем уравнение регрессии ŷ х = – 4, 565 + 1, 178х. Теоретические значения ŷ х и отклонения от них фактических значений ei приведены в четвертой и пятой колонке табл.2.3. Видно, что остаточные значения ei имеют тенденцию к росту при увеличении х и у. Этот вывод подтвердит и критерий Гольдфельда – Квандта. Его применение предполагает выполнение следующих шагов: - упорядочение наблюдений по возрастанию фактора х; - исключение из центра таблицыk наблюдений (рекомендуется при n=60 исключать k=16 строк, при n=30 исключать k=8, при n=20 исключать k=4), в данном примере исключаем строки 9–12; - разделение наблюдений на две группы (в данном случае по ń =(n – k): 2=8 наблюдений в каждой, соответственно, с меньшими и большими значениями переменной х) и формирование по каждой из групп подходящего уравнения регрессии (результаты в табл.2.4.); - определение остаточных сумм квадратов для первой (S1) и второй (S2) групп и нахождение их отношения R=S2: S1. Чем больше значение R превышает табличную величину F–критерия с ń –2 степенями свободы (приложение 2), тем более имеет место нарушение предпосылки о равенстве дисперсий остатков, или наблюдается гетероскедастичность остатков. Таблица 2.4.
Получили величину R=2638, 48: 68, 42=38.56, которая существенно превышает критическую величинуF-критерия при 5%-м и при 1%-м уровне значимости (4, 28 и 8, 47, соответственно) для 6 (8-2) степеней свободы, тем самым подтверждая наличие гетероскедастичности. При нарушении четвертой предпосылки – автокорреляции остатков проявляется корреляция между последовательными по времени остатками наблюдений. Основные причины, вызывающие автокорреляцию, это ошибки спецификации, инерционность при изменении экономических показателей, сглаживание данных, эффект паутины. Ошибки спецификации. Если в модели не учтена какая-либо важная объясняющая переменная либо неправильно выбрана форма зависимости, то это приводит к систематическим отклонениям наблюдений от регрессии, что порождает автокорреляцию. Инерционность. Многие экономические показатели (инфляция, ВНП, безработица, и др.) обладают некоторой цикличностью, связанной с периодичностью деловой активности. Экономический подъем приводит к увеличению ВНП, сокращению инфляции, росту занятости, и т.д. Рост продолжается, пока изменение рыночной конъюнктуры и некоторых экономических характеристик не приводит к замедлению роста, потом остановке и движению в обратную сторону рассматриваемых показателей. Во всех случаях эта трансформация обладает определенной инертностью и происходит не мгновенно. Сглаживание данных. Часто данные по некоторому довольно продолжительному временному периоду усредняют по составляющим его подпериодам. Это может привести к некоторому сглаживанию колебаний, имеющихся в рассматриваемом периоде, что в свою очередь может повлечь автокорреляцию. Эффект паутины. Многие экономические показатели в разных сферах деятельности реагируют с опозданием (временным лагом)при изменении экономических условий. Так, предложение агропродукции с запаздыванием реагирует на изменение цены (на период созревания урожая). Повышенная цена агропродукции в прошлом году, скорее всего, вызовет ее большее производство в текущем году, поэтому цена на нее понизится и т.д. Последствия автокорреляции во многом сходны с последствиями гетероскедастичности. К ним относятся: -Оценки параметров остаются линейными и несмещенными, но перестают быть лучшими несмещенными оценками. -Дисперсия некоторых оценок получается смещенная, чаще всего, заниженная, из-за чего увеличивается t-статистика. При этом могут быть признаны статистически значимыми объясняющие факторы, которые фактически такими не являются. -Оценка дисперсии регрессии может также является смещенной вниз оценкой фактического значения дисперсии. Поэтому выводы по t- и F-статистикам, которые определяют значимость полученных коэффициентов регрессии и детерминации, могут быть неверными. Прогнозные качества модели вследствие этого ухудшаются. Для обнаружения автокорреляции необходимо наблюдения упорядочить по значению фактора х (как в предыдущем примере) и составить ряды с текущими и предыдущими остатками. Коэффициент корреляции reiej между текущими и предыдущими остатками определяется по формуле коэффициента корреляции (1.1, прил.4).Рассмотрим расчет коэффициента корреляции между остатками, взяв в качестве примера данные из табл.2.3 и перенеся их в табл. 2.5 (n=19).
Таблица 2.5.
σ ei =15.1347, σ ej =14, 7663 и в соответствие с (1.1, прил.4) reiej =(48, 5311 – (–0, 2842)(–0, 7949))/15, 1347/14, 7663=0, 2161, что при 17 степенях свободы незначимо и свидетельствует об отсутствии автокорреляции остатков. Причины, вызывающие автокорреляцию остатков могут иметь различную природу. Иногда это связано с исходными данными и вызывается наличием ошибок измерения. Причину следует искать также в форме модели, если не включить существенный фактор, который может отражаться в остатках, вследствие чего они оказываются автокоррелированными. Часто этим фактором является время, поэтому проблема автокорреляции остатков весьма актуальна при исследовании динамических рядов, что мы рассмотрим в соответствующем разделе.
Популярное:
|
Последнее изменение этой страницы: 2016-05-30; Просмотров: 1231; Нарушение авторского права страницы