![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Качество оценок МНК линейной множественной регрессии.
Теорема Гаусса-Маркова В классическом множественном регрессионном анализе обычно делаются следующие предпосылки: 1. Математическое ожидание случайного члена 2. Дисперсия случайного члена постоянна для всех наблюдений
3. Значения случайного члена в любых наблюдениях Cov( Это условие с учетом того, что М( M( 4. Случайный член должен быть распределен независимо от объясняющих переменных Cov( где было учтено, что М( Следует сказать, что последнее условие заведомо выполняется, если объясняющие переменные 5. Матрица 6. Значения случайного члена
Модель (3.6), удовлетворяющая приведенным предпосылкам 1- 6, называется классической нормальной линейной моделью множественной регрессии. Модель (3.6), удовлетворяющая приведенным предпосылкам 1- 5, называется классической линейной моделью множественной регрессии. Согласно теореме Гаусса-Маркова, при выполнении указанных предпосылок оценки параметров линейной множественной регрессии (3.13), полученные методом наименьших квадратов, будут несмещенными и эффективными (т. е. будут иметь наименьшую дисперсию) в классе линейных несмещенных оценок. Нарушение одного из условий Гаусса-Маркова приводит к нарушению эффективности оценок, т. е. в классе несмещенных оценок можно найти такие, которые имеют меньшую дисперсию. После построения модели необходимо вычислить значения остатков еi и проверить выполнение предпосылок 1- 6, так как их нарушение снижает качество модели. Если условия нарушаются, то следует модернизировать модель соответствующим образом. Эти вопросы будут рассмотрены далее.
3.6. Проверка качества уравнения регрессии. F-критерий Фишера Как и в случае парной регрессии для оценки качества полученного множественной уравнения регрессии (3.6) можно использовать коэффициентмножественной детерминации, представляющий собой отношение факторной суммы квадратов остатков к их общей сумме квадратов:
Коэффициент множественной корреляции равен корню из коэффициента множественной детерминации:
Оба показателя изменяются от нуля до единицы. Коэффициент множественной корреляции R используется для оценки тесноты связи факторов с исследуемым признаком. Чем ближе величина R к единице, тем теснее данная связь, тем лучше теоретическая зависимость согласуется с эмпирическими данными. Введём понятие дисперсии на одну степень свободы (df).
где (n-1) - количество степеней свободы для общей дисперсии; p–для факторнойдисперсии (количество независимых переменных в уравнении регрессии); (n-p-1) – для остаточной дисперсии. Оценка статистической значимости уравнения регрессии (а также коэффициента детерминации
Согласно F-критерию Фишера, выдвигаемая «нулевая» гипотеза H0 о статистической незначимости уравнения регрессии отвергается при выполнении условия F > Fкрит, где Fкрит определяется по таблицам F-критерия Фишера по двум степеням свободы k1 = p, k2 = n-p-1 и заданному уровню значимости α. Величина коэффициента множественной корреляции R не может быть меньше максимального парного индекса корреляции max В случае линейной зависимости (3.6) коэффициент корреляции R связан с парными коэффициентами корреляции
Использование коэффициента множественной детерминации R2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину Поэтому при большом количестве факторов предпочтительнее использовать, так называемый, скорректированный, улучшенный (adjusted) коэффициент множественной детерминации
Чем больше величина p, тем сильнее различия При использовании При заданном объеме наблюдений и при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации Отметим, что низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации – в регрессионную модель не включены существенные факторы; – неверно выбрана форма аналитической зависимости, не отражающая реальные соотношения между переменными, включенными в модель. Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 1705; Нарушение авторского права страницы