Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Регрессионный метод анализа взаимосвязи
Линию, сглаживающую эмпирическую ломаную линию связи, называют теоретической линией регрессии Y на X или просто линией регрессии. Эта линия отражает теоретическую форму связи признаков X и Y, т.е. закономерность изменения средних значений признака Y в зависимости от изменения фактора X при условии полного взаимопоглощения всех прочих случайных по отношению к фактору X причин. Иначе говоря, теоретическая линия регрессии определяет основную тенденцию взаимосвязи признаков X и Y. Уравнение (7.3.1.) описывающее математически теоретическую линию регрессии, называют уравнением регрессии. В уравнении (7.1.3.) переменная - это средняя величина признака Y, меняющаяся по мере изменения фактора X, а функция f(x) устанавливает аналитический вид однозначной зависимости между вариациями x и . Таким образом, уравнение регрессии аппроксимирует (приближению характеризует) корреляционную связь признаков X и Y, представляя ее в форме функциональной зависимости. Правомерность моделирования стохастической корреляционной связи на основе функциональной зависимости (7) будет оправданной лишь в тех случаях, если корреляционная связь не столь значительно отстоит от функциональной, т.е. не дает значительной погрешности в отклонениях ( yi - ). Это требование порождает в теории корреляционной связи две главные задачи: · определить теоретическую форму связи – подыскать такую форму функциональной зависимости (7), которая в наилучшей степени отвечает сущности обнаруженной корреляционной связи признаков; · измерить тесноту связи – оценить, в какой мере изучаемая корреляционная связь приближается по своей силе к связи изучаемых функциональной. В однофакторных регрессионных моделях взаимосвязи социально-экономических явлений наиболее часто используются следующие типы математических функций, описывающих теоретическую линию регрессии и характеризующих механизм взаимодействия факторного и результативного признаков: = a0 + a1x - линейная , = a0 + a1 - гиперболическая , = a0 + a1lgx - логарифмическая , = a0 - степенная, = a0 + a1x + а2x2 - параболическая, = a0 + - показательная. Коэффициенты уравнений регрессии a0, a1, a2, … называют параметрами связи. Функциональные зависимости описывают типы кривых, применяемых для сглаживания ломаных эмпирических линий связи, причем операция сглаживания сводится, по существу, к нахождению численных значений параметров ak. Наиболее простой регрессионной моделью однофакторой корреляционной связи является линейная модель (7.3.2.) изображаемая графически прямой линией. Модель отражает линейную взаимосвязь признаков X и Y, когда с возрастанием значений Х происходит непрерывное, более или менее равномерное возрастание или убывание средних значений Y. Разброс фактических значений yi вокруг теоретических значений , рассчитанных по избранному для моделирования уравнению регрессии, обусловлен влиянием множества случайных факторов. Разности (7.3.3.) называемые остаточными величинами (или остатками ), оценивают отклонения расчетных значений от фактических значений yi. Следовательно, при построении регрессионной модели численные значения коэффициентов ak выбранного типового уравнения регрессии (8) необходимо искать так, чтобы обеспечить наименьшие возможные остатки для всех случаев наблюдения ( xi, yi ). Для этой цели используется метод наименьших квадратов (МНК), который позволяет рассчитать параметры ak выбранного типового уравнения регрессии таким образом, чтобы теоретическая линия регрессии была бы в среднем наименее удалена от всех точек (xi, yi) по сравнению с любой другой теоретической линией регрессии, отвечающей выбранному типу функции связи (8). Согласно МНК, задача поиска значений параметров ak, минимизирующих сумму погрешностей (10), имеет вид min (7.3.4.) и решается как задача на экстремум - путем приравнивания нулю первых частных производных функции S по каждому искомому параметру ak уравнения регрессии. Это приводит к системе уравнений, называемой нормальной, решение которой дает численные значения параметров ak, минимизирующие функцию S. Таким образом, параметры связи ak, в силу их расчета по МНК, являются усредненными по всей совокупности наблюдений ( xi, yi ). Они отражают взаимосвязь признаков X и Y только в общем итоге, по всей совокупности в целом (для каждой индивидуальной пары ( xi, yi ) значения ak остаются неизвестными).
При изучении многофакторных корреляционных связей методология их моделирования уравнениями регрессии аналогична рассмотренной. Уравнения многофакторной регрессии имеют вид …, xm=f(x1, x2, …, xm) (7.3.5.) и позволяют приближенно оценить меру влияния на результативный признак Y каждого из включенных в модель факторов X при фиксированных (на среднем уровне) значениях остальных факторов, а также оценить влияние на Y различных сочетаний рассматриваемых факторов. Пример построения однофакторной регрессионной модели связи Уравнение парной линейной корреляционной связи имеет следующий вид: , где - расчетное теоретическое значение результативного признака Y, полученное по уравнению регрессии; а0 - среднее значение признака Y в точке x=0; а0, а1 - коэффициенты уравнения регрессии (параметры связи). Гипотеза о линейной зависимости между признаками Х и Y выдвигается в том случае, если значения обоих признаков возрастают (или убывают) одинаково, примерно в арифметической прогрессии. Уравнение парной линейной корреляции показывает среднее изменение результативного признака Y при изменении фактора Х на одну единицу его измерения, т.е. вариацию признака Y, которая приходится на единицу вариации фактора Х. Знак параметра указывает направление этого изменения. Коэффициенты уравнения а0, а1 отыскиваются методом наименьших квадратов (МНК). Как изложено в раздел II – Теоретические основы и методика корреляционно-регрессионного анализа данных (п.3 – Моделирование однофакторных корреляционных связей на основе функциональных зависимостей ), в основу МНК положено требование минимальности сумм квадратов отклонений эмпирических значений yi от выровненных . При линейной зависимости критерий минимизации (7.4.1.) принимает вид: 7.4.1. Для нахождения значений параметров а0, а1, при которых функция двух переменных S может достигнуть минимума, приравнивают к нулю частные производные S по а0, а1 и тем самым получают систему 2-х уравнений с двумя неизвестными а0, а1: 7.4.2. Сократив каждое уравнение на –2, раскрыв скобки и перенеся члены с х в одну строку, а с y – в другую, для определения а0, а1 получают систему:
Эта система называется системой нормальных уравнений МНК для линейного уравнения регрессии. Все суммы, необходимые для конкретизации нормальных уравнений, определяют по эмпирическим данным ( xi, yi ). Решая полученную систему, находят искомые параметры а0, а1 – коэффициенты линейного уравнения регрессии. Расчет коэффициента может быть выполнен по формулам: ; 7.4.3. . 7.4.4. Иногда эти коэффициенты удобнее вычислять по формулам: 7.4.5. 7.4.6. где - среднее из произведения; - среднее квадратов; - произведение средних; - квадрат средних. Построив линейное уравнение регрессии, следует проанализировать качество синтезированной регрессионной модели, оценить адекватность и практическую пригодность модели, дать ее экономическую интерпретации. Как уже отмечалось, на этапе регрессионного анализа определяется теоретическое выражение связи между признаками (форма связи). Для построения и анализа теоретической линии, определяемой на базе эмпирического материала, необходимо знать параметры уравнения регрессии. Рассмотрим более подробно определение параметров для линейного уравнения парной регрессии. Рассчитаем эти показатели: Линейное уравнение парной регрессии имеет вид: На базе данных таблицы
Таблица 7.4.1. Вспомогательная таблица для расчета уравнения линейной регрессии
1. Для построения линейного уравнения регрессии необходимо определить параметры этого уравнения: свободный член уравнения ( ) и коэффициент регрессии ( ). С этой целью построим вспомогательную таблицу. Определим параметры уравнения линейной регрессии, n – количество банков
7.4.5. 7.4.6. где - среднее из произведения; - среднее квадратов; - произведение средних; - квадрат средних.
В нашем случае мы получили уравнение линейной зависимости 33, 739+0, 33*х А0 а1 Коэффициент регрессии а1 0, 33 показывает, что при увеличении факторного признака Кредитные вложения на 1 млн. руб. значение результативного признака «Прибыль банков» увеличивается в среднем на 0, 33 млн руб. Для построения теоретической линии зависимости рассчитаем этот показатель в таблице 7.4.1. Теперь графически построим корреляционное поле – затем график с выводом формулы.
Затем ЭКО и ЭКД, см. тему 5. В Excel- поставить мышь на множество точек корреляционного поля, правой клавишей – добавить Линию тренда, тип, параметры и по индексу детерминации выбрать наиболее адекватную линию регрессии. ТЕМА 8. РЯДЫ ДИНАМИКИ Популярное:
|
Последнее изменение этой страницы: 2016-08-31; Просмотров: 1501; Нарушение авторского права страницы