Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Проверка значимости параметров множественной линейной регрессии с использованием f-критериев
В таблице2.1 содержатся ежегодные данные о показателях экономики России с 1999 по 2011 годы (трлн.руб., в ценах 2010 г.): Y –объем товарного импорта в Россию; X1 –ВВП; X2 –личное потребление. Таблица2.1
Будем искать модель в виде где – значение фактора в i-м наблюдении. Предположим, что случайные величины, распределенные по нормальному закону с параметрами , и значение нам не известно. Выполняя регрессионный анализ, получаем следующие результаты: и
В соответствии с полученными -значениями, каждая отдельная гипотеза , при уровне значимости должна быть принята. Т.е. проверка показывает, параметры или признаются статистически незначимыми. Это противоречит большому значению коэффициента детерминации. Значит, нам надо проверить гипотезу определяющую значения не одного, а одновременно двух коэффициентов. В общем случае необходимо проверить гипотезу в случае линейной множественной регрессии Статистический критерий для решения этой задачи основывается на F-статистике, которая после небольших преобразований принимает вид: где – остаточная сумма квадратов. В некоторых пакетах обработки статистики (например, в EXCEL, см. п.2.5 приложение 4) в результатах приводятся числитель и знаменатель этой статистики (графа Средние квадраты – Mean Squares). Указанная -статистика имеет при гипотезе H0 (α 1=¼ = α m=0) распределение , которое называется F-распределение Фишера с m и (n-m-1) степенями свободы. Чем больше значение критерия Фишера, тем больше оснований считать, что переменные в совокупности действительно объясняют изменчивость объясняемой переменной . Значит, гипотеза отвергается при больших значениях выражения F. Пороговое значение уровня является квантилем распределения и обозначается . Таким образом, гипотеза Н0 отвергается при выполнении неравенства Вероятность ошибки при этом равна . Статистические пакеты регрессионного анализа среди прочих результатов приводят также значение данной -статистики и соответствующее P-значение (P-value), или вероятность В примере с товарным импортом в Россию получено значение -статистики, равное , а пороговое значение Таким образом, в этом примере нет оснований принимать гипотезу , хотя каждая из отдельных гипотез или , рассматриваемая по отдельности, не отвергается. Подобные случаи встречаются на практике и объясняются мультиколлениарностью данных. Рассмотрим эту проблему ниже. Пример 2.5. Анализ данных о безработице в примере 2.1дает следующие результаты: , , -значение = , поэтому при выборе гипотеза принимается, а при отвергается. Пример 2.6. Анализ данных о куриных окорочках в примере 2.3приводит к значениям , , -значение = , поэтому гипотеза отвергается, а уравнение регрессии признается статистически значимым. Пример 2.7. Потребление свинины в зависимости от цен (пример 2.4): , , -значение = , поэтому гипотеза принимается даже при выборе . Отметим, что во всех рассмотренных примерах парной линейной регрессии (m=1) были получены -значения -статистик, которые совпадают с -значениями -статистик, применяемые для проверки гипотезы . Такое совпадение не случайно и может быть доказано. Кроме анализа значимости коэффициентов регрессии распределение Фишера (F-критерии) применяется также в процессе подбора вида модели. Рассмотрим множественную линейную регрессию имеющую объясняющих переменных. Гипотеза заключается в том, что в модели M(m) q последних коэффициентов равны нулю: Тогда в случае справедливости гипотезы получается редуцированная модель имеющая объясняющих переменных. Если и – остаточные суммы квадратов в модели M(m) и редуцированной модели M(m-q) соответственно, гипотеза верна и погрешности являются нормально распределенными случайными величинами с параметрами , то F-статистика имеет при гипотезе H0 F-распределение Фишера F (q, n-m-1) с q и (n-m-1) степенями свободы. Дополнительное количество объясняющих переменных, включенных в уравнение, ведет к возрастанию объясненной суммы квадратов, что и показывает F-статистика. Таким образом, получаем критерий проверки гипотезы
основанный на F-статистике и отвергающий гипотезу , если фактическое значение удовлетворяет неравенству
где – заданный уровень значимости критерия. Популярное:
|
Последнее изменение этой страницы: 2016-05-30; Просмотров: 939; Нарушение авторского права страницы