Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Гипотезы о значимости. Интервальное оценивание.
Проверка гипотез о значимости коэффициентов регрессии (t-тест). Рассмотрим линейную регрессию . Допустим, что величина имеет определенное значение : , т.е. формируем гипотезу Н0: . Это нулевая гипотеза. Возникает альтернативная гипотеза: Н1: . По имеющейся выборке значений ( , ( ) строим уравнение регрессии . Задача – проверить значение b в соответствии с гипотезой Н0. По МНК имеем . Допустим, что выполняется 5-е условие Г-М, т.е. u – нормальная случайная величина: u~N(0; ). Тогда оценка b тоже будет нормальной случайной величиной: b~N( ). Если гипотеза Н0 верна, тогда , b~N( ). Вероятность попадания в интервал = γ. - доверительный интервал. - область принятия гипотезы Н0 при доверительной вероятности γ (или при уровне значимости α =1-γ ). ; заменим на z. ~N(0; 1), т.к. b~N( ). Если Н0 верна, тогда при достаточно большом значении доверительной вероятности γ (95%, 99%) величина z: . Если это условие не выполняется, тогда ( ) имеет место противоречие и истинность гипотезы Н0 ставится под сомнение. величина, аналогичная величине z и определяемая следующим образом:
Это t-статистика, имеет распределение Стьюдента с числом степеней свободы (n-2). Область принятия гипотезы Н0 при выбранном уровне доверительной вероятности γ перепишется так: ; . Предполагается, что γ =95% или 99%. Если , то Н0 ставится под сомнение, отклоняется при α =1-γ. Если , то Н0 не отклоняется при α =1-γ. Построение доверительных интервалов для истинных значений параметров регрессии. Сформулируем гипотезу Н0: . Альтернативная гипотеза: Н1: . Пусть b оказалась в соответствии с гипотезой Н0 (гипотеза принята), т.е. для выбранного уровня значимости имеет место неравенство: Рассмотрим гипотезу Н’0: ( - область принятия Н’0 для уровня значимости α ). Если , то оценка b будет находиться в соответствии с Н0 и Н’0 одновременно, т.е. истинное значение β может принимать два значения и . Найдем все значения такие, что гипотеза Н0: находилась в соответствии со значением оценки b (т.е. гипотеза принимается). Для всех таких значений должно выполняться неравенство: - - это доверительный интервал для при уровне значимости α. Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера: , где - регрессионная сумма квадратов; - остаточная сумма квадратов ( - остатки); n – объем выборки; k – число параметров при переменных x. Если известен коэффициент детерминации R2, то:
Сформулируем гипотезу Н0 о незначимости уравнения регрессии в целом, т.е. . Фактическое значение F- критерия сравнивается с табличным при 5%-ном или 1%-ном уровне значимости и числе степеней свободы k1=k и k2=n-k-1. Если , то гипотеза Н0 отклоняется, , уравнение регрессии значимо. Если , то гипотеза Н0 не отклоняется и уравнение регрессии незначимо. Частный F-критерий является мерой для оценки включения фактора в модель: , где - коэффициент детерминации для модели с полным набором факторов; - тот же показатель, но без включения в модель фактора ; - число наблюдений; - число параметров в модели. Если фактическое значение , то дополнительное включение фактора в модель статистически оправданно и коэффициент регрессии при факторе статистически значим. Если фактическое значение , то дополнительное включение фактора в модель нецелесообразно и коэффициент регрессии при факторе статистически незначим. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, можно существенно увеличивать долю объясненной вариации результативного признака. Свойства выборочных оценок. Оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное практическое значение в использовании результатов регрессии и корреляции. Коэффициенты регрессии представляют собой выборочные оценки характеристики силы связи. Их несмещенность является желательным свойством, т.к. только в этом случае они могут иметь практическую значимость. Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Следовательно, при большом числе выборочных оцениваний остатки не будут накапливаться и найденный параметр регрессии можно рассматривать как среднее значение из возможного большого количества несмещенных оценок. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям. А* - искомый параметр распределения случайной величины х. А, В – оценки А*. Оценка А называется несмещенной оценкой параметра А*, если М(А)=А*. Для практических целей важна не только несмещенность, но и эффективность оценок. Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. Оценка А называется эффективной оценкой параметра А*, если D(A)=min среди всех дисперсий. Поэтому несмещенность оценки должна дополняться минимальной дисперсией. В практических исследованиях это означает возможность перехода от точечного оценивания к интервальному. Степень реалистичности доверительных интервалов параметров регрессии обеспечивается, если оценки будут не только несмещенными и эффективными, но и состоятельными. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки. Оценка А называется состоятельной оценкой параметра А*, если с ростом выборки она сходится по вероятности к значению этого параметра: для любого . Указанные критерии оценок (несмещенность, эффективность и состоятельность) обязательно учитываются при разных способах оценивания. Свойства оценки : Пусть х – случайная величина, . Пусть - выборка значений х. - оценка . Так как для любого i: , где , - случайная величина с и То , где . 1) несмещенность: ? Т.о., - несмещенная оценка. 2) эффективность. Свойства выборочной дисперсии : 1) 2) если - независимы, то , а 3) 4) Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 673; Нарушение авторского права страницы