Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ПОСТРОЕНИЕ МОДЕЛИ ЛИНЕЙНОЙ РЕГРЕССИИ



(СЛУЧАЙ НЕСГРУППИРОВАННЫХ ДАННЫХ)

Цель работы: овладеть способами построения моделей линейной регрессии, и выработать умения и навыки оценки надежности коэффициента корреляции, уравнения регрессии и его коэффициентов.

Задача. Найти эмпирическую формулу, устанавливающую зависимость между коэффициентами сменности техники Y и её средним возрастом X по предприятию ПМК-7 объединения Сибкомплектмонтаж на основании следующих данных:

Таблица 2.8

Y 1, 18 1, 21 1, 25 1, 26 1, 3 1, 32 1, 33 0, 69 0, 72 0, 8
X 6, 31 5, 8 5, 1 5, 6 6, 1 6, 5 6, 55 3, 8 3, 41

 

Содержание работы: на основании данных необходимо:

1. Построить корреляционное поле и по характеру расположения точек в корреляционном поле определить общий вид регрессии.

2. Вычислить основные характеристики , , , , , , необходимые для построения модели регрессии.

3. Определить коэффициент корреляции , найти уровень егозначимости и доверительный интервал (степень надежности определяется самостоятельно).

4. Написать эмпирические уравнения линий регрессий на и на .

5. Вычислить коэффициент детерминации и объяснить полученное значение.

6. Проверить адекватность уравнения регрессии.

7. Провести оценку величины погрешности уравнения регрессии на и его коэффициентов.

8. Построить уравнение регрессии на в первоначальной системе координат.

Выполнение работы

На основании, анализа взаимосвязи коэффициента сменности техники от ее среднего возраста следует, что за факторный признак Х следует принять средний возраст техники, а коэффициент сменности за результативный признак Y.

1. Для определения формы связи между признаками X и Y строим на координатной плоскости точки (xi.yi), пользуясь табл. 2.8. Около построенных точек проводим так называемую линию тренда (рис. 2.5).

Рис. 2.5. Линейная регрессия y на x — прямая a с уравнением

y = 0, 185 x + 0, 122 и линейная регрессия x на y — прямая b с уравнением x = 3, 81 y + 1, 1. Пунктированная прямая с проведена «от руки».

2. Произведем расчет статистик , , Sx, Sy, r, которые войдут в уравнения линий регрессий. Составим расчетную табл. 2.9.

 

Таблица 2.9

xi xi-ẍ (xi-ẍ )2 yi yi-ỹ (yi-ỹ )2 x2 xy
6, 31 0, 993 0, 986049 1, 18 0, 074 0, 005476 39, 8161 7, 4458
5, 8 0, 483 0, 233289 1, 21 0, 104 0, 010816 33, 64 7, 018
5, 1 -0, 217 0, 047089 1, 25 0, 144 0, 020736 26, 01 6, 375
5, 6 0, 283 0, 080089 1, 26 0, 154 0, 023716 31, 36 7, 056
6, 1 0, 783 0, 613089 1, 3 0, 194 0, 037636 37, 21 7, 93
6, 5 1, 183 1, 399489 1, 32 0, 214 0, 045796 42, 25 8, 58
6, 55 1, 233 1, 520289 1, 33 0, 224 0, 050176 42, 9025 8, 7115
3, 8 -1, 517 2, 301289 0, 69 -0, 416 0, 173056 14, 44 2, 622
3, 41 -1, 907 3, 636649 0, 72 -0, 386 0, 148996 11, 6281 2, 4552
-1, 317 1, 734489 0, 8 -0, 306 0, 093636 3, 2
53, 17   12, 55181 11, 06   0, 61004 295, 2567 61, 3935

Теперь найдем средний возраст техники и средний коэффициент сменности.

— средний возраст техники

— средний коэффициент сменности.

Рассчитаем следующие числовые характеристики:

Þ ,

Þ ,

,

Подставим найденные значения в формулу для нахождения коэффициента корреляции (1.61).

.

Коэффициент корреляции получился достаточно большим, его значение близко к единице. Следовательно, между признаками существует достаточно тесная связь.

3. Теперьпроверим значимость коэффициента корреляции. Вычислим статистику tp по формуле:

.

По таблице критических точек распределения Стьюдента (приложение 5) по уровню значимости и числу степеней свободы находим . Так как , то выборочный коэффициент корреляции значимо отличается от нуля. Следовательно, средний коэффициент сменности Y и средним возрастом X коррелированны.

Находим доверительный интервал для выборочного коэффициента корреляции с надежностью . Так как объем выборки , то доверительный интервал находим по формуле: .

Так как по условию надежность (доверительная вероятность) равна , то по таблице функции Лапласа (приложение 6) находим . Вычисляем среднюю квадратичную ошибку по формуле:

.

 

Записываем доверительный интервал:

 

или ϵ [0, 64; 1].

 

Следовательно, с вероятностью 0, 64 линейный коэффициент корреляции генеральной совокупности находится в пределах от 0, 64 до 1. По имеющейся выборке следует ожидать влияние среднего возраста техники на коэффициент сменности не менее чем на 64%.

4. Найдем эмпирические линейные уравнения регрессии y на x и x на y, которые являются приближенными уравнениями для истинных уравнений регрессий.

x=0, 185*x+0, 122

y=3, 81*y+1, 1

 

Контроль вычислений:

a1b1=0, 185*3, 81=0, 705

r2=0, 84*0, 84=0, 705

 

Получили, что a1b1= r2, а это значит, что вычисления выполнены верно.

Из уравнения x=0.185*x+0.122 следует, что при уменьшении коэффициента сменности на 1 средний возраст техники вырастет на 0, 185

5. Найдем коэффициент детерминации. Для линейной регрессии при вычисленном коэффициенте r он равен r2= 0, 705 0, 71. Это означает, что коэффициент сменности техники зависит от ее возраста на 71%, и только 29% рассеивания среднего показателя коэффициента сменности остались необъяснимыми.

6. Проверим адекватность уравнений линейной регрессии y на x по критерию Фишера-Снедекора. Для этого вычислим статистику Fн по формуле (ф.1.67):

 

 

где R2 определяем по формуле (ф.1.62) используя расчетную табл. 2.10:

 

.

Таблица 2.10

yi x yi-ẏ x (yi-ẏ x)2
1, 18 1, 289 -0, 109 0, 012
1, 21 1, 195 0, 015 0, 000
1, 25 1, 066 0, 185 0, 034
1, 26 1, 158 0, 102 0, 010
1, 3 1, 251 0, 050 0, 002
1, 32 1, 325 -0, 004 0, 000
1, 33 1, 334 -0, 004 0, 000
0, 69 0, 825 -0, 135 0, 018
0, 72 0, 753 -0, 033 0, 001
0, 8 0, 862 -0, 062 0, 004
Сумма     0, 082

 

При уровне значимости α =0, 05 и числах степеней свободы k1=1, k2=10-2=8 по таблице критических точек распределения Фишера-Снедекора (приложение 7) находим FТ=5, 32.

Так как =51.3< 5, 32, то заключаем, что уравнение линейной регрессии х=0, 185*x+0, 122 статистически значимо описывает результаты эксперимента.

7. Теперьнайдем оценку величины погрешности уравнения регрессии на и его коэффициентов. Для этого составим табл. 2.11.

 

Таблица 2.11

ui ui-u (ui-u)2
-0, 109 -0, 11758 0, 013824
0, 015 0, 006774 4, 59E-05
0, 185 0, 176274 0, 031073
0, 102 0, 093774 0, 008794
0, 050 0, 041274 0, 001704
-0, 004 -0, 01273 0, 000162
-0, 004 -0, 01198 0, 000143
-0, 135 -0, 14323 0, 020514
-0, 033 -0, 04108 0, 001687
-0, 062 -0, 07023 0, 004932
    0, 082878

Проведем оценку величины погрешности уравнения регрессии x=0, 185*x+0, 122.

Найдем относительную погрешность уравнения по формуле:

 

 

где , ,

Так как , то . Для нахождения суммы используем табл. 2.11.

Тогда , . Так как величина достаточно мала, то уравнение линейной регрессии x= 0, 185*x+0, 122 описывает опытные данные.

Оценим коэффициенты уравнения регрессии. У нас , . Для нахождения отношений и вычислим средние квадратические ошибки коэффициентов по формулам:

, , .

 

По табл. 2.9 находим: , . Учитывая, что , и , находим:

 

Коэффициенты считаются значимыми, если выполняется условие: .

 

Проверяя это условие для коэффициентов и получим, что коэффициент значим, а коэффициент не значим. Следует отметить, что это легко можно устранить увеличивая объем выборки. Графиками найденных регрессий являются прямые a, b, представленные на рис. 2.5. Таким образом, полученное уравнение может быть принято для практического руководства.

Лабораторная работа № 3.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-04-10; Просмотров: 1202; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.029 с.)
Главная | Случайная страница | Обратная связь