Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Тема. Линейная модель множественной регрессии



Множественная регрессия – это уравнение связи с несколькими независимыми переменными:

,

где у – зависимая переменная (результативный признак);

– независимые переменные ( факторы).

 

Линейная регрессия имеет вид .

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Вычислить параметры уравнения множественной регрессии возможно также с помощью инструмента анализа данных Регрессия (ППП Excel). Воспользуемся надстройкой Пакет анализа. Необходимо выбрать:

Сервис – Анализ данных – Регрессия – ОК.

Появляется диалоговое окно, которое нужно заполнить. В графе Входной интервал У: указывается ссылка на ячейки, содержащие значения результативного признака у. В графе Входной интервал Х: указывается ссылка на ячейки, содержащие значения факторов .

Рассмотрим графы:

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Константа – ноль – флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона.

Пример.

х1 х2 у

1) Найдем точечные оценки коэффициентов уравнения линейной регрессии . Воспользуемся пакетом «Анализ данных» ППП MS Excel.

ВЫВОД ИТОГОВ          
             
Регрессионная статистика          
Множественный R 0, 202125          
R-квадрат 0, 040854          
Нормированный R-квадрат -0, 23319          
Стандартная ошибка 14, 66753          
Наблюдения          
             
Дисперсионный анализ        
df SS MS F Значимость F  
Регрессия 64, 14542 32, 07271 0, 149081 0, 864164  
Остаток 1505, 955 215, 1364      
Итого 1570, 1        
             
Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 15, 40418 9, 952511 1, 547768 0, 165604 -8, 12977 38, 93813
х1 0, 010868 0, 207621 0, 052348 0, 959714 -0, 48008 0, 501813
х2 -1, 10865 2, 058189 -0, 53865 0, 606822 -5, 9755 3, 758192
             
             
             
ВЫВОД ОСТАТКА          
             
Наблюдение Предсказанное у Остатки        
12, 27385 2, 726149        
13, 25208 32, 74792        
13, 50206 -10, 5021        
5, 491512 2, 508488        
8, 523952 1, 476048        
12, 11082 -8, 11082        
12, 13256 -11, 1326        
9, 893518 -7, 89352        
12, 08909 -6, 08909        
7, 730555 4, 269445        

 

Итак, = 15, 4; = 0, 01; =-1, 11. Тогда .

2) Найдем интервальные оценки коэффициентов уравнения линейной регрессии . Доверительный интервал коэффициента задается формулой , , . Составим таблицу

2
2, 726149 7, 431889
32, 74792 1072, 426
-10, 5021 110, 2932
2, 508488 6, 29251
1, 476048 2, 178718
-8, 11082 65, 78547
-11, 1326 123, 9339
-7, 89352 62, 30763
-6, 08909 37, 07698
4, 269445 18, 22816
сумма   1505, 955

 

Тогда = =215, 14; =14, 67

Стандартные ошибки коэффициентов:

=

 

 

Составим таблицу

х1 х2 ( )2 ( )2 ( )( )
-1, 4 1, 96 -2, 8
-10 -2, 4 5, 76
-2, 4 5, 76 -31, 2
-10 4, 6 21, 16 -46
2, 6 6, 76
-13 -1, 4 1, 96 18, 2
-11 -1, 4 1, 96 15, 4
-13 0, 6 0, 36 -7, 8
-15 -1, 4 1, 96
-8 2, 6 6, 76 -20, 8
сумма   54, 4
среднее 4, 4          

 

Получим

= =99, 05, тогда =9, 95;

 

= =0, 04, тогда =0, 2;

 

= =4, 24, тогда =2, 06

tкр(df=n-m-1=10-2-1=7; α =0, 005)=2, 84

Тогда интервальные оценки коэффициентов уравнения линейной регрессии имеют вид:

= 15, 4 ±2, 84·9, 95, т.е.

= 0, 01 ±2, 84·0, 2, т.е. -0, 56 0, 58

= -1, 11 ±2, 84·2, 06, т.е. -6, 96 4, 74

 

3) Проверим общее качество уравнения линейной регрессии. Вычислим коэффициент детерминации R2=0, 04, т.е. модель объясняет 4% общего разброса значений результативного признака у. Выдвигаем гипотезы:

,

.

Доверительная вероятность равна p=0, 95. Правосторонняя проверка. . Из таблиц F- распределения находим граничную точку

F( =0, 05; m=2; n-m-1=10-2-1=7)=4, 74. Статистика = =0, 15. Отметим значения на числовой оси

 

95% 5%

 
 


0, 15

4, 74

Мы принимаем гипотезу и отклоняем гипотезу на уровне значимости 0, 05%. Предположение о незначительности связи принимается.

 

4) Проверка статистической значимости коэффициентов уравнения регрессии.

Выдвигаем гипотезы:

, т.е. объясняющая переменная хi не влияет на результативный признак у.

, т.е. объясняющая переменная хi влияет на результативный признак у.

Проведем двустороннюю проверку.

По таблице t-распределения находим

tкр(df=n-m-1=10-2-1 =7; α =0, 005)=2, 84. Граничные точки ±2, 84.

Статистики:

=1, 55; =0, 05; =-0, 54.

Отметим значения на числовой оси.

       
   


2, 5% 95% 2, 5%

 
 


-0, 54 0, 05 1, 55

-2, 84 2, 84

 

Мы принимаем гипотезу и отклоняем гипотезу на уровне значимости 2, 5%. Все коэффициенты статистически незначимы.

 

5) Определим наличие автокорреляции с помощью критерия Дарбина-Уотсона. Статистика Дарбина-Уотсона DW= . Составим таблицу

( )2 2
12, 27385 2, 726149 - - 7, 431889
13, 25208 32, 74792 30, 02177 901, 3066 1072, 426
13, 50206 -10, 5021 -43, 25 1870, 56 110, 2932
5, 491512 2, 508488 13, 01054 169, 2743 6, 29251
8, 523952 1, 476048 -1, 03244 1, 065932 2, 178718
12, 11082 -8, 11082 -9, 58687 91, 90812 65, 78547
12, 13256 -11, 1326 -3, 02174 9, 130894 123, 9339
9, 893518 -7, 89352 3, 239043 10, 4914 62, 30763
12, 08909 -6, 08909 1, 804431 3, 255972 37, 07698
7, 730555 4, 269445 10, 35853 107, 2992 18, 22816
      сумма 3164, 293 1505, 955

 

Тогда DW= = =2, 10. По таблице распределения Дарбина-Уотсона находим

dl =0, 70   du =1, 64

Тогда 4- du=4-1, 64=2, 36. Так как , (1, 64< 2, 10< 2, 36), то гипотеза об отсутствии автокорреляции остатков не отклоняется на уровне значимости 0, 05.

 

7) Выясним, есть ли в модели мультиколлинеарность с помощью ППП MS Excel. Матрица парных коэффициентов корреляции:

х1 х2 у
х1    
х2 0, 257751  
у -0, 03314 -0, 20119

Низкие значения коэффициентов корреляции свидетельствуют об отсутствии мультиколлинеарности.

 


Поделиться:



Последнее изменение этой страницы: 2017-05-11; Просмотров: 88; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.039 с.)
Главная | Случайная страница | Обратная связь