Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Корреляционный анализ. Уравнение парной регрессии



 

Для оценки параметров α и β - используют МНК (метод наименьших квадратов).

Система нормальных уравнений.

•n + b∑ x = ∑ y∑ x + b∑ x2 = ∑ y•x

 

Для наших данных система уравнений имеет вид

 

a + 963529 b = 610500

a + 112094728619 b = 58943885800

 

Из первого уравнения выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: = 0.00625, a = 60447.3406

Уравнение регрессии (эмпирическое уравнение регрессии): = 0.00625 x + 60447.3406

Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

 

X Y x2 y2 x • y
37211 54000 1384658521 2916000000 2009394000
42368 59500 1795047424 3540250000 2520896000
52361 63900 2741674321 4083210000 3345867900
68516 65600 4694442256 4303360000 4494649600
88133 64500 7767425689 4160250000 5684578500
96333 61700 9280046889 3806890000 5943746100
128903 59600 16615983409 3552160000 7682618800
137861 59500 19005655321 3540250000 8202729500
146258 60800 21391402564 3696640000 8892486400
165585 61400 27418392225 3769960000 10166919000
963529 610500 112094728619 37368970000 58943885800

 

Х - капиталовложения, Y - добыча нефти

Рис.6. Поле корреляции

 

. Параметры уравнения регрессии

Выборочные средние.

 


 

 

Выборочные дисперсии:

 

 

Среднеквадратическое отклонение

 

 

Коэффициент корреляции

 

Ковариация

 

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

 

Линейный коэффициент корреляции принимает значения от -1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

< rxy < 0.3: слабая;

< rxy < 0.5: умеренная;

< rxy < 0.7: заметная;

< rxy < 0.9: высокая;

< rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X слабая и прямая.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

 

 

Уравнение регрессии (оценка уравнения регрессии)

 

Линейное уравнение регрессии имеет вид y = 0.00625 x + 60447.34

Коэффициентам уравнения линейной регрессии можно придать экономический смысл.

Коэффициент регрессии b = 0.00625 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.00625.

Коэффициент a = 60447.34 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.

Ошибка аппроксимации.

 

 

Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Эмпирическое корреляционное отношение.

 

 

Где

 

Индекс корреляции.

Для линейной регрессии индекс корреляции равен коэффициенту корреляции rxy = 0.0877.

Полученная величина свидетельствует о том, что фактор x не существенно влияет на y

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:

 

Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0; 1].

Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

Коэффициент детерминации

= 0.08772 = 0.00769

т.е. в 0.77 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 99.23 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)

 

x y y(x) (yi-ycp)2 (y-y(x))2 (xi-xcp)2 |y - yx|: y
37211 54000 60680.08 49702500 44623529.82 3497764335.61 0.12
42368 59500 60712.34 2402500 1469768.53 2914369428.01 0.0204
52361 63900 60774.84 8122500 9766603.63 1935287265.61 0.0489
68516 65600 60875.89 20702500 22317231.7 774893001.61 0.072
88133 64500 60998.59 11902500 12259893.63 67566756.01 0.0543
96333 61700 61049.88 422500 422661.82 396.01 0.0105
128903 59600 61253.59 2102500 2734364.64 1059509010.01 0.0277
137861 59500 61309.62 2402500 3274728.63 1722922365.61 0.0304
146258 60800 61362.14 62500 316003.55 2490519006.01 0.00925
165585 61400 61483.03 122500 6893.43 4793083670.41 0.00135
963529 610500 610500 97945000 97191679.38 19255915234.9 0.4

 

Оценка параметров уравнения регрессии. Значимость коэффициента корреляции

 

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия

 

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит - нулевую гипотезу отвергают.

 

По таблице Стьюдента с уровнем значимости α =0.05 и степенями свободы k=8 находим tкрит:


tкрит (n-m-1; α /2) = (8; 0.025) = 2.306

 

где m = 1 - количество объясняющих переменных.

Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).

Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим

В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.


Поделиться:



Последнее изменение этой страницы: 2020-02-17; Просмотров: 96; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.019 с.)
Главная | Случайная страница | Обратная связь