Корреляционный анализ. Уравнение парной регрессии

⇐ ПредыдущаяСтр 6 из 6

Для оценки параметров α и β - используют МНК (метод наименьших квадратов).

Система нормальных уравнений.

•n + b∑ x = ∑ y∑ x + b∑ x2 = ∑ y•x

Для наших данных система уравнений имеет вид

a + 963529 b = 610500

a + 112094728619 b = 58943885800

Из первого уравнения выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: = 0.00625, a = 60447.3406

Уравнение регрессии (эмпирическое уравнение регрессии): = 0.00625 x + 60447.3406

Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

X	Y	x2	y2	x • y
37211	54000	1384658521	2916000000	2009394000
42368	59500	1795047424	3540250000	2520896000
52361	63900	2741674321	4083210000	3345867900
68516	65600	4694442256	4303360000	4494649600
88133	64500	7767425689	4160250000	5684578500
96333	61700	9280046889	3806890000	5943746100
128903	59600	16615983409	3552160000	7682618800
137861	59500	19005655321	3540250000	8202729500
146258	60800	21391402564	3696640000	8892486400
165585	61400	27418392225	3769960000	10166919000
963529	610500	112094728619	37368970000	58943885800

Х - капиталовложения, Y - добыча нефти

Рис.6. Поле корреляции

. Параметры уравнения регрессии

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

Коэффициент корреляции

Ковариация

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Линейный коэффициент корреляции принимает значения от -1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

< rxy < 0.3: слабая;

< rxy < 0.5: умеренная;

< rxy < 0.7: заметная;

< rxy < 0.9: высокая;

< rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X слабая и прямая.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

Уравнение регрессии (оценка уравнения регрессии)

Линейное уравнение регрессии имеет вид y = 0.00625 x + 60447.34

Коэффициентам уравнения линейной регрессии можно придать экономический смысл.

Коэффициент регрессии b = 0.00625 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.00625.

Коэффициент a = 60447.34 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.

Ошибка аппроксимации.

Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Эмпирическое корреляционное отношение.

Где

Индекс корреляции.

Для линейной регрессии индекс корреляции равен коэффициенту корреляции rxy = 0.0877.

Полученная величина свидетельствует о том, что фактор x не существенно влияет на y

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:

Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции rxy.

В отличие от линейного коэффициента корреляции он характеризует тесноту нелинейной связи и не характеризует ее направление. Изменяется в пределах [0; 1].

Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

Коэффициент детерминации

= 0.08772 = 0.00769

т.е. в 0.77 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 99.23 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)

x	y	y(x)	(yi-ycp)2	(y-y(x))2	(xi-xcp)2	\|y - yx\|: y
37211	54000	60680.08	49702500	44623529.82	3497764335.61	0.12
42368	59500	60712.34	2402500	1469768.53	2914369428.01	0.0204
52361	63900	60774.84	8122500	9766603.63	1935287265.61	0.0489
68516	65600	60875.89	20702500	22317231.7	774893001.61	0.072
88133	64500	60998.59	11902500	12259893.63	67566756.01	0.0543
96333	61700	61049.88	422500	422661.82	396.01	0.0105
128903	59600	61253.59	2102500	2734364.64	1059509010.01	0.0277
137861	59500	61309.62	2402500	3274728.63	1722922365.61	0.0304
146258	60800	61362.14	62500	316003.55	2490519006.01	0.00925
165585	61400	61483.03	122500	6893.43	4793083670.41	0.00135
963529	610500	610500	97945000	97191679.38	19255915234.9	0.4

Оценка параметров уравнения регрессии. Значимость коэффициента корреляции

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит - нулевую гипотезу отвергают.

По таблице Стьюдента с уровнем значимости α =0.05 и степенями свободы k=8 находим tкрит:

tкрит (n-m-1; α /2) = (8; 0.025) = 2.306

где m = 1 - количество объясняющих переменных.

Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).

Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим

В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

⇐ Предыдущая 1 2 3 4 56

Последнее изменение этой страницы: 2020-02-17; Просмотров: 96; Нарушение авторского права страницы