Регрессионный метод анализа взаимосвязи

Линию, сглаживающую эмпирическую ломаную линию связи, называют теоретической линией регрессии Y на X или просто линией регрессии. Эта линия отражает теоретическую форму связи признаков X и Y, т.е. закономерность изменения средних значений признака Y в зависимости от изменения фактора X при условии полного взаимопоглощения всех прочих случайных по отношению к фактору X причин. Иначе говоря, теоретическая линия регрессии определяет основную тенденцию взаимосвязи признаков X и Y.

Уравнение

(7.3.1.)

описывающее математически теоретическую линию регрессии, называют уравнением регрессии. В уравнении (7.1.3.) переменная - это средняя величина признака Y, меняющаяся по мере изменения фактора X, а функция f(x) устанавливает аналитический вид однозначной зависимости между вариациями x и .

Таким образом, уравнение регрессии аппроксимирует (приближению характеризует) корреляционную связь признаков X и Y, представляя ее в форме функциональной зависимости.

Правомерность моделирования стохастической корреляционной связи на основе функциональной зависимости (7) будет оправданной лишь в тех случаях, если корреляционная связь не столь значительно отстоит от функциональной, т.е. не дает значительной погрешности в отклонениях ( y_i - ).

Это требование порождает в теории корреляционной связи две главные задачи:

· определить теоретическую форму связи – подыскать такую форму функциональной зависимости (7), которая в наилучшей степени отвечает сущности обнаруженной корреляционной связи признаков;

· измерить тесноту связи – оценить, в какой мере изучаемая корреляционная связь приближается по своей силе к связи изучаемых функциональной.

В однофакторных регрессионных моделях взаимосвязи социально-экономических явлений наиболее часто используются следующие типы математических функций, описывающих теоретическую линию регрессии и характеризующих механизм взаимодействия факторного и результативного признаков:

= a₀ + a₁x - линейная ,

= a₀ + a₁ - гиперболическая ,

= a₀ + a₁lgx - логарифмическая ,

= a₀ - степенная,

= a₀ + a₁x + а₂x² - параболическая,

= a₀ + - показательная.

Коэффициенты уравнений регрессии a₀, a₁, a₂, … называют параметрами связи.

Функциональные зависимости описывают типы кривых, применяемых для сглаживания ломаных эмпирических линий связи, причем операция сглаживания сводится, по существу, к нахождению численных значений параметров a_k.

Наиболее простой регрессионной моделью однофакторой корреляционной связи является линейная модель

(7.3.2.)

изображаемая графически прямой линией. Модель отражает линейную взаимосвязь признаков X и Y, когда с возрастанием значений Х происходит непрерывное, более или менее равномерное возрастание или убывание средних значений Y.

Разброс фактических значений y_i вокруг теоретических значений , рассчитанных по избранному для моделирования уравнению регрессии, обусловлен влиянием множества случайных факторов. Разности

(7.3.3.)

называемые остаточными величинами (или остатками ), оценивают отклонения расчетных значений от фактических значений y_i.

Следовательно, при построении регрессионной модели численные значения коэффициентов a_k выбранного типового уравнения регрессии (8) необходимо искать так, чтобы обеспечить наименьшие возможные остатки для всех случаев наблюдения ( x_i, y_i ).

Для этой цели используется метод наименьших квадратов (МНК), который позволяет рассчитать параметры a_k выбранного типового уравнения регрессии таким образом, чтобы теоретическая линия регрессии была бы в среднем наименее удалена от всех точек (x_i, y_i) по сравнению с любой другой теоретической линией регрессии, отвечающей выбранному типу функции связи (8).

Согласно МНК, задача поиска значений параметров a_k, минимизирующих сумму погрешностей (10), имеет вид

min (7.3.4.)

и решается как задача на экстремум - путем приравнивания нулю первых частных производных функции S по каждому искомому параметру a_k уравнения регрессии. Это приводит к системе уравнений, называемой нормальной, решение которой дает численные значения параметров a_k, минимизирующие функцию S.

Таким образом, параметры связи a_k, в силу их расчета по МНК, являются усредненными по всей совокупности наблюдений ( x_i, y_i ). Они отражают взаимосвязь признаков X и Y только в общем итоге, по всей совокупности в целом (для каждой индивидуальной пары ( x_i, y_i ) значения a_k остаются неизвестными).

При изучении многофакторных корреляционных связей методология их моделирования уравнениями регрессии аналогична рассмотренной. Уравнения многофакторной регрессии имеют вид

…, _xm=f(x_1,x_{2, …,}x_m) (7.3.5.)

и позволяют приближенно оценить меру влияния на результативный признак Y каждого из включенных в модель факторов X при фиксированных (на среднем уровне) значениях остальных факторов, а также оценить влияние на Y различных сочетаний рассматриваемых факторов.

Пример построения однофакторной регрессионной модели связи

Уравнение парной линейной корреляционной связи имеет следующий вид:

,

где - расчетное теоретическое значение результативного признака Y, полученное по уравнению регрессии;

а₀ - среднее значение признака Y в точке x=0;

а₀, а₁ - коэффициенты уравнения регрессии (параметры связи).

Гипотеза о линейной зависимости между признаками Х и Y выдвигается в том случае, если значения обоих признаков возрастают (или убывают) одинаково, примерно в арифметической прогрессии.

Уравнение парной линейной корреляции показывает среднее изменение результативного признака Y при изменении фактора Х на одну единицу его измерения, т.е. вариацию признака Y, которая приходится на единицу вариации фактора Х. Знак параметра указывает направление этого изменения.

Коэффициенты уравнения а₀, а₁ отыскиваются методом наименьших квадратов (МНК). Как изложено в раздел II – Теоретические основы и методика корреляционно-регрессионного анализа данных (п.3 – Моделирование однофакторных корреляционных связей на основе функциональных зависимостей ), в основу МНК положено требование минимальности сумм квадратов отклонений эмпирических значений y_i от выровненных . При линейной зависимости критерий минимизации (7.4.1.) принимает вид:

7.4.1.

Для нахождения значений параметров а₀, а₁, при которых функция двух переменных S может достигнуть минимума, приравнивают к нулю частные производные S по а₀, а₁ и тем самым получают систему 2-х уравнений с двумя неизвестными а₀, а₁:

7.4.2.

Сократив каждое уравнение на –2, раскрыв скобки и перенеся члены с х в одну строку, а с y – в другую, для определения а₀, а₁ получают систему:

Эта система называется системой нормальных уравнений МНК для линейного уравнения регрессии.

Все суммы, необходимые для конкретизации нормальных уравнений, определяют по эмпирическим данным ( x_i, y_i ).

Решая полученную систему, находят искомые параметры а₀, а₁ – коэффициенты линейного уравнения регрессии.

Расчет коэффициента может быть выполнен по формулам:

; 7.4.3.

. 7.4.4.

Иногда эти коэффициенты удобнее вычислять по формулам:

7.4.5.

7.4.6.

где - среднее из произведения; - среднее квадратов;

- произведение средних; - квадрат средних.

Построив линейное уравнение регрессии, следует проанализировать качество синтезированной регрессионной модели, оценить адекватность и практическую пригодность модели, дать ее экономическую интерпретации. Как уже отмечалось, на этапе регрессионного анализа определяется теоретическое выражение связи между признаками (форма связи). Для построения и анализа теоретической линии, определяемой на базе эмпирического материала, необходимо знать параметры уравнения регрессии.

Рассмотрим более подробно определение параметров для линейного уравнения парной регрессии. Рассчитаем эти показатели:

Линейное уравнение парной регрессии имеет вид:

На базе данных таблицы

Таблица 7.4.1.

Вспомогательная таблица для расчета уравнения линейной регрессии

Номер предприятия Кредитные вложения, млн.руб. Прибыль банков, млн.руб . у с крышкой

гр4=гр2*гр3 гр5=гр2*гр2 33, 739+0, 33*х

157, 489

160, 459

164, 419

175, 309

196, 099

206, 329

207, 979

210, 949

211, 939

212, 929

215, 899

216, 889

223, 819

228, 109

228, 769

232, 729

235, 039

236, 359

236, 689

237, 679

240, 649

245, 599

249, 229

258, 469

264, 079

266, 059

266, 719

279, 259

284, 209

296, 089

итого: 6846, 24

1. Для построения линейного уравнения регрессии необходимо определить параметры этого уравнения: свободный член уравнения ( ) и коэффициент регрессии ( ). С этой целью построим вспомогательную таблицу.

Определим параметры уравнения линейной регрессии, n – количество банков

7.4.5.

7.4.6.

где - среднее из произведения; - среднее квадратов;

- произведение средних; - квадрат средних.

В уравнении регрессии параметр показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков

В нашем случае мы получили уравнение линейной зависимости

33, 739+0, 33*х

А0 а1

Коэффициент регрессии а₁ 0, 33 показывает, что при увеличении факторного признака Кредитные вложения на 1 млн. руб. значение результативного признака «Прибыль банков» увеличивается в среднем на 0, 33 млн руб.

Для построения теоретической линии зависимости рассчитаем этот показатель в таблице 7.4.1.

Теперь графически построим корреляционное поле – затем график с выводом формулы.

Затем ЭКО и ЭКД, см. тему 5.

В Excel- поставить мышь на множество точек корреляционного поля, правой клавишей – добавить Линию тренда, тип, параметры и по индексу детерминации выбрать наиболее адекватную линию регрессии.

ТЕМА 8. РЯДЫ ДИНАМИКИ

Предыдущая 2 3 4 5 6 7 8 9 10 11 12 131415 16 17 Следующая
Поделиться:

Популярное:
Анализ взаимосвязи благополучия в регионе и уровня развития социального предпринимательства
Взаимосвязи между целевыми показателями прибыли и рентабельности при нелинейной функции прибыли
Взаимосвязи между целевыми показателями результата и ликвидности
Взаимосвязи общественных явлений, их виды, формы.
Взаимосвязи при постоянном и переменном капитале
Глава 4. Корреляционно-регрессионный анализ связи между площадями с/х угодий, средней стоимостью основных средств и фондообеспеченностью
Ключевые современные проблемы дизайна. Их характеристики, взаимосвязи, иерархия.
Корреляционно-регрессионный анализ зависимости статистики отходов от статистики населения.
Корреляционно-регрессионный анализ. Метод корреляции рангов. Измерение тесноты и проверка существенности связи.
Линии взаимосвязи выполняются толщиной от 0,2 до 1,0 мм в зависимости от формата схемы и размеров графических обозначений. Рекомендуется толщина линий от 0,3 до 0,4 мм.
О физической взаимосвязи напряжений и деформаций
Общественное воспроизводство – это непрерывно возобновляемый процесс общественного производства в постоянно повторяющейся взаимосвязи его циклов.

Последнее изменение этой страницы: 2016-08-31; Просмотров: 1501; Нарушение авторского права страницы