Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Регрессионный метод анализа взаимосвязи



Линию, сглаживающую эмпирическую ломаную линию связи, называют теоретической линией регрессии Y на X или просто линией регрессии. Эта линия отражает теоретическую форму связи признаков X и Y, т.е. закономерность изменения средних значений признака Y в зависимости от изменения фактора X при условии полного взаимопоглощения всех прочих случайных по отношению к фактору X причин. Иначе говоря, теоретическая линия регрессии определяет основную тенденцию взаимосвязи признаков X и Y.

Уравнение

(7.3.1.)

описывающее математически теоретическую линию регрессии, называют уравнением регрессии. В уравнении (7.1.3.) переменная - это средняя величина признака Y, меняющаяся по мере изменения фактора X, а функция f(x) устанавливает аналитический вид однозначной зависимости между вариациями x и .

Таким образом, уравнение регрессии аппроксимирует (приближению характеризует) корреляционную связь признаков X и Y, представляя ее в форме функциональной зависимости.

Правомерность моделирования стохастической корреляционной связи на основе функциональной зависимости (7) будет оправданной лишь в тех случаях, если корреляционная связь не столь значительно отстоит от функциональной, т.е. не дает значительной погрешности в отклонениях ( yi - ).

Это требование порождает в теории корреляционной связи две главные задачи:

· определить теоретическую форму связи – подыскать такую форму функциональной зависимости (7), которая в наилучшей степени отвечает сущности обнаруженной корреляционной связи признаков;

· измерить тесноту связи – оценить, в какой мере изучаемая корреляционная связь приближается по своей силе к связи изучаемых функциональной.

В однофакторных регрессионных моделях взаимосвязи социально-экономических явлений наиболее часто используются следующие типы математических функций, описывающих теоретическую линию регрессии и характеризующих механизм взаимодействия факторного и результативного признаков:

= a0 + a1x - линейная ,

= a0 + a1 - гиперболическая ,

= a0 + a1lgx - логарифмическая ,

= a0 - степенная,

= a0 + a1x + а2x2 - параболическая,

= a0 + - показательная.

Коэффициенты уравнений регрессии a0, a1, a2, … называют параметрами связи.

Функциональные зависимости описывают типы кривых, применяемых для сглаживания ломаных эмпирических линий связи, причем операция сглаживания сводится, по существу, к нахождению численных значений параметров ak.

Наиболее простой регрессионной моделью однофакторой корреляционной связи является линейная модель

(7.3.2.)

изображаемая графически прямой линией. Модель отражает линейную взаимосвязь признаков X и Y, когда с возрастанием значений Х происходит непрерывное, более или менее равномерное возрастание или убывание средних значений Y.

Разброс фактических значений yi вокруг теоретических значений , рассчитанных по избранному для моделирования уравнению регрессии, обусловлен влиянием множества случайных факторов. Разности

(7.3.3.)

называемые остаточными величинами (или остатками ), оценивают отклонения расчетных значений от фактических значений yi.

Следовательно, при построении регрессионной модели численные значения коэффициентов ak выбранного типового уравнения регрессии (8) необходимо искать так, чтобы обеспечить наименьшие возможные остатки для всех случаев наблюдения ( xi, yi ).

Для этой цели используется метод наименьших квадратов (МНК), который позволяет рассчитать параметры ak выбранного типового уравнения регрессии таким образом, чтобы теоретическая линия регрессии была бы в среднем наименее удалена от всех точек (xi, yi) по сравнению с любой другой теоретической линией регрессии, отвечающей выбранному типу функции связи (8).

Согласно МНК, задача поиска значений параметров ak, минимизирующих сумму погрешностей (10), имеет вид

min (7.3.4.)

и решается как задача на экстремум - путем приравнивания нулю первых частных производных функции S по каждому искомому параметру ak уравнения регрессии. Это приводит к системе уравнений, называемой нормальной, решение которой дает численные значения параметров ak, минимизирующие функцию S.

Таким образом, параметры связи ak, в силу их расчета по МНК, являются усредненными по всей совокупности наблюдений ( xi, yi ). Они отражают взаимосвязь признаков X и Y только в общем итоге, по всей совокупности в целом (для каждой индивидуальной пары ( xi, yi ) значения ak остаются неизвестными).

 

При изучении многофакторных корреляционных связей методология их моделирования уравнениями регрессии аналогична рассмотренной. Уравнения многофакторной регрессии имеют вид

…, xm=f(x1, x2, …, xm) (7.3.5.)

и позволяют приближенно оценить меру влияния на результативный признак Y каждого из включенных в модель факторов X при фиксированных (на среднем уровне) значениях остальных факторов, а также оценить влияние на Y различных сочетаний рассматриваемых факторов.

Пример построения однофакторной регрессионной модели связи

Уравнение парной линейной корреляционной связи имеет следующий вид:

,

где - расчетное теоретическое значение результативного признака Y, полученное по уравнению регрессии;

а0 - среднее значение признака Y в точке x=0;

а0, а1 - коэффициенты уравнения регрессии (параметры связи).

Гипотеза о линейной зависимости между признаками Х и Y выдвигается в том случае, если значения обоих признаков возрастают (или убывают) одинаково, примерно в арифметической прогрессии.

Уравнение парной линейной корреляции показывает среднее изменение результативного признака Y при изменении фактора Х на одну единицу его измерения, т.е. вариацию признака Y, которая приходится на единицу вариации фактора Х. Знак параметра указывает направление этого изменения.

Коэффициенты уравнения а0, а1 отыскиваются методом наименьших квадратов (МНК). Как изложено в раздел II – Теоретические основы и методика корреляционно-регрессионного анализа данных (п.3 – Моделирование однофакторных корреляционных связей на основе функциональных зависимостей ), в основу МНК положено требование минимальности сумм квадратов отклонений эмпирических значений yi от выровненных . При линейной зависимости критерий минимизации (7.4.1.) принимает вид:

7.4.1.

Для нахождения значений параметров а0, а1, при которых функция двух переменных S может достигнуть минимума, приравнивают к нулю частные производные S по а0, а1 и тем самым получают систему 2-х уравнений с двумя неизвестными а0, а1:

7.4.2.

Сократив каждое уравнение на –2, раскрыв скобки и перенеся члены с х в одну строку, а с y – в другую, для определения а0, а1 получают систему:

Эта система называется системой нормальных уравнений МНК для линейного уравнения регрессии.

Все суммы, необходимые для конкретизации нормальных уравнений, определяют по эмпирическим данным ( xi, yi ).

Решая полученную систему, находят искомые параметры а0, а1 – коэффициенты линейного уравнения регрессии.

Расчет коэффициента может быть выполнен по формулам:

; 7.4.3.

. 7.4.4.

Иногда эти коэффициенты удобнее вычислять по формулам:

7.4.5.

7.4.6.

где - среднее из произведения; - среднее квадратов;

- произведение средних; - квадрат средних.

Построив линейное уравнение регрессии, следует проанализировать качество синтезированной регрессионной модели, оценить адекватность и практическую пригодность модели, дать ее экономическую интерпретации. Как уже отмечалось, на этапе регрессионного анализа определяется теоретическое выражение связи между признаками (форма связи). Для построения и анализа теоретической линии, определяемой на базе эмпирического материала, необходимо знать параметры уравнения регрессии.

Рассмотрим более подробно определение параметров для линейного уравнения парной регрессии. Рассчитаем эти показатели:

Линейное уравнение парной регрессии имеет вид:

На базе данных таблицы


 

Таблица 7.4.1.

Вспомогательная таблица для расчета уравнения линейной регрессии

 

Номер предприятия Кредитные вложения, млн.руб. Прибыль банков, млн.руб . у с крышкой
гр4=гр2*гр3 гр5=гр2*гр2 33, 739+0, 33*х
157, 489
160, 459
164, 419
175, 309
196, 099
206, 329
207, 979
210, 949
211, 939
212, 929
215, 899
216, 889
223, 819
228, 109
228, 769
232, 729
235, 039
236, 359
236, 689
237, 679
240, 649
245, 599
249, 229
258, 469
264, 079
266, 059
266, 719
279, 259
284, 209
296, 089
итого: 6846, 24

 

1. Для построения линейного уравнения регрессии необходимо определить параметры этого уравнения: свободный член уравнения ( ) и коэффициент регрессии ( ). С этой целью построим вспомогательную таблицу.

Определим параметры уравнения линейной регрессии, n – количество банков

7.4.5.

7.4.6.

где - среднее из произведения; - среднее квадратов;

- произведение средних; - квадрат средних.

В уравнении регрессии параметр показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков

В нашем случае мы получили уравнение линейной зависимости

33, 739+0, 33*х

А0 а1

Коэффициент регрессии а1 0, 33 показывает, что при увеличении факторного признака Кредитные вложения на 1 млн. руб. значение результативного признака «Прибыль банков» увеличивается в среднем на 0, 33 млн руб.

Для построения теоретической линии зависимости рассчитаем этот показатель в таблице 7.4.1.

Теперь графически построим корреляционное поле – затем график с выводом формулы.

 

 

Затем ЭКО и ЭКД, см. тему 5.

В Excel- поставить мышь на множество точек корреляционного поля, правой клавишей – добавить Линию тренда, тип, параметры и по индексу детерминации выбрать наиболее адекватную линию регрессии.


ТЕМА 8. РЯДЫ ДИНАМИКИ


Поделиться:



Популярное:

  1. Анализ взаимосвязи благополучия в регионе и уровня развития социального предпринимательства
  2. Взаимосвязи между целевыми показателями прибыли и рентабельности при нелинейной функции прибыли
  3. Взаимосвязи между целевыми показателями результата и ликвидности
  4. Взаимосвязи общественных явлений, их виды, формы.
  5. Взаимосвязи при постоянном и переменном капитале
  6. Глава 4. Корреляционно-регрессионный анализ связи между площадями с/х угодий, средней стоимостью основных средств и фондообеспеченностью
  7. Ключевые современные проблемы дизайна. Их характеристики, взаимосвязи, иерархия.
  8. Корреляционно-регрессионный анализ зависимости статистики отходов от статистики населения.
  9. Корреляционно-регрессионный анализ. Метод корреляции рангов. Измерение тесноты и проверка существенности связи.
  10. Линии взаимосвязи выполняются толщиной от 0,2 до 1,0 мм в зависимости от формата схемы и размеров графических обозначений. Рекомендуется толщина линий от 0,3 до 0,4 мм.
  11. О физической взаимосвязи напряжений и деформаций
  12. Общественное воспроизводство – это непрерывно возобновляемый процесс общественного производства в постоянно повторяющейся взаимосвязи его циклов.


Последнее изменение этой страницы: 2016-08-31; Просмотров: 1501; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.046 с.)
Главная | Случайная страница | Обратная связь