Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Гетероскедастичность: методы обнаружения и устранения.
Рассмотрим уравнение регрессии . После оценки данного уравнения строится модель линейной регрессии , где а, b - выборочные оценки параметров и . Оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными состоятельными и эффективными. Одним из условий, необходимых для получения несмещенных, состоятельных и эффективных оценок, является условие гомоскедастичности. Гомоскедастичность – дисперсия каждого отклонения одинакова для всех значений x, т.е. в каждом наблюдении D(u)=const или для любого i: D(ui)=const. В соответствии с данной предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора остатки имеют одинаковую дисперсию. Если это условие не соблюдается, то имеет место гетероскедастичность. Наличие гомоскедастичности или гетероскедастичности можно увидеть по графику зависимости остатков от теоретических значений результативного признака . Для множественной регрессии данный вид графиков является наиболее визуальным способом изучения гомо- и гетероскедастичности. Для обнаружения гетероскедастичности, помимо анализа наглядного представления, рекомендуется использовать специальные аналитические тесты. Наиболее часто используются три из них: • тест ранговой корреляции Спирмэна; • тест Голдфелда-Квандта; • тест Глейзера. В основе этих критериев лежат различные предположения о зависимости между дисперсией случайного члена и величиной объясняющих переменных. Тест ранговой корреляции Спирмэна. Тест ранговой корреляции Спирмэна основан на предположении, что дисперсия случайного члена будет либо увеличиваться, либо уменьшаться по мере увеличения объясняющей переменной, и поэтому в регрессии, параметры которой оцениваются по МНК, абсолютные величины остатков и значения объясняющей переменной будут коррелированы. Реализация данного теста предполагает, что данные по Хi (i – индекс любого включенного в модель фактора) и по абсолютным значениям остатков ранжируются (в порядке возрастания); выдвигается гипотеза Н0 об отсутствии гетероскедастичности; коэффициент ранговой корреляции определяется по формуле: , где Dk – разность между рангом переменной Хi и рангом абсолютного значения остаточного члена соответствующего наблюдения |e|. Свойства коэффициента ранговой корреляции Спирмэна: · - нормальная случайная величина для больших выборок; · =0; · . Таким образом, величина ~N(0; 1). Если z≥ zкр (γ =95%), значит Н0 отклоняется при α = 0, 05. Гетероскедастичность имеет место. Если z≥ zкр (γ =99%), значит Н0 отклоняется при α = 0, 01. Гетероскедастичность имеет место. Этапы применения теста Спирмэна: 1. по исходным данным выборки рассчитывается уравнение . 2. рассчитываются остатки для всех наблюдений . 3. значения и xi ранжируются по возрастанию. 4. рассчитывается . 5. определяется . 6. сравнивается и . Если , то гипотеза Н0 отклоняется; гетероскедастичность имеет место. Тест Голдфелда-Квандта. При малом объеме выборки, что наиболее характерно для эконометрических исследований, для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта, разработанный в 1965 г. Тест Голдфелда-Квандта основан на предположении, что среднеквадратическое отклонение распределения вероятностей случайной составляющей в каждом наблюдении пропорционально значению объясняющей переменной в этом наблюдении. Предполагается также, что случайная составляющая распределена нормально и не подвержена автокорреляции. Гольдфельд и Квандт рассмотрели однофакторную линейную модель, для которой дисперсия остатков возрастает пропорционально квадрату фактора. Чтобы оценить нарушение гомоскедастичности, они предложили параметрический тест, который включает в себя следующие шаги: · Упорядочение n наблюдений по мере возрастания переменной х. · Исключение из рассмотрения С центральных наблюдений; при этом (n- C )/ 2> p, где р - число оцениваемых параметров. · Разделение совокупности из (n- C ) наблюдений на две группы (соответственно с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии. · Определение остаточной суммы квадратов для первой (S1) и второй (S2) групп и нахождение их отношения: . При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять F-критерию с (n-C-2p)/2 степенями свободы для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F–критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин. Тест Глейзера. Тест Глейзера основан на предположении, что среднеквадратическое отклонение распределения вероятностей случайной составляющей в каждом наблюдении связано некоторой функциональной зависимостью со значением объясняющей переменной в этом наблюдении. Т.е. имеет место, следующее соотношение: . Данный подход рассматривает регрессию абсолютных величин остатков |e| по некоторой функции от переменной Хi (Хi – это та объясняющая переменная, от которой гипотетически зависит дисперсия остатков). Регрессия |e| может строиться не по одной объясняющей переменной, а по нескольким, или по определенной комбинации объясняющих переменных. На практике рассматриваются простые функции от Х. Т.е. оценивается уравнение (*), где . При этом может быть равна, например, -1; -0, 5; 0, 5; 1; 1, 5. Результаты оценивания регрессий по тесту Глейзера представляются в таблице Из оцениваемых зависимостей выбирают ту, у которой R2 будет максимальным. Выбирается то значение , которому соответствует максимальное значение R2. Найденное значение и полученные коэффициенты регрессии подставляем в (*) и получаем уравнение. Решение о гетероскедастичности принимается на основе проверки регрессионных коэффициентов на их статистически значимое отличие от нуля. Обобщенный (взвешенный) МНК. Рассмотрим уравнение парной линейной регрессии . Запишем его для каждого члена выборки: . Предположим, что имеет место гетероскедастичность, тогда (*). Пусть . Рассмотрим следующую модель: . Разделим обе части уравнения на . Получаем . Проверим, что выполняется условие Г-М: . Следовательно, выполняется условие гомоскедастичности модели: . Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 1074; Нарушение авторского права страницы