Множественная (многофакторная) регрессия

⇐ ПредыдущаяСтр 10 из 18Следующая ⇒

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так же, как и при использовании парной регрессии, т. е. требуется определить аналитическое выражение связи между результативным признаком у и факторными признаками , найти функцию

Построение моделей множественной регрессии включает несколько этапов:

1) выбор формы связи (уравнения регрессии);

2) выбор факторных признаков;

3) обеспечение достаточного объема совокупности для получения несмещенных оценок.

Выбор формы связи затрудняется тем, что, используя математический аппарат, теоретически зависимость между признаками может быть выражена большим числом различных функций.

Выбор типа уравнения осложнен тем, что для любой формы зависимости выбирается целый ряд уравнений, которые в определенной степени будут описывать эти связи. Некоторые предпосылки для выбора уравнения регрессии получают на основе анализа предшествующих аналогичных исследований.

Наиболее приемлемым способом определения вида уравнения регрессии является метод перебора различных уравнений.

Сущность метода заключается в том, что большое число уравнений (моделей) регрессии реализуется на ЭВМ с помощью специально разработанного алгоритма перебора с последующей статистической проверкой, главным образом на основе t-критерия Стьюдента и F-критерия Фишера – Снедекора.

В практике построения многофакторных моделей взаимосвязи социально-экономических явлений используются пять типов моделей:

1) линейная:

(8.32)

2) степенная:

(8.33)

3) показательная:

(8.34)

4) параболическая:

(8.35)

5) гиперболическая:

(8.36)

Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации.

Проблема размерности модели связи, т. е. определение оптимального числа факторных признаков, является одной из основных проблем построения множественного уравнения регрессии. Модель размером более ста факторных признаков сложно реализуема и требует больших затрат времени.

Существует несколько методов отбора факторных признаков для построения модели взаимосвязи. Один из методов – метод экспертных оценок – основан на интуитивно-логических предпосылках, содержательно-качественном анализе. Наиболее приемлемым способом отбора является шаговая регрессия. Сущность метода заключается в последовательном отборе факторов в уравнение регрессии и последующей проверке их значимости.

Сложность и взаимное переплетение отдельных факторов, обуславливающих исследуемое экономическое явление, могут проявляться в так называемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель. Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0, 8 ( ) и др.

Устранение мультиколлинеарности может реализовываться через исключение из модели одного или нескольких линейно-связаных факторных признаков. На основе качественного и количественного анализов отбрасываются некоторые факторные признаки. Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности.

Пример. По данным табл. 8.6 о прибыли (y), затратах на 1 р. произведенной продукции (х₁) и стоимости основных фондов (х₂) необходимо определить зависимость между признаками.

Таблица 8.6

№ п/п	Затраты на 1 р. произведенной продукции, коп. x₁	Стоимость основных фондов млн. р., x₂	Прибыль, тыс. р. y			yx₁		yx₂
		5, 9 5, 9 4, 9 4, 3 3, 9 4, 3	1 070 1 001	5 929 5 929 6 561 6 724 7 921 9 216	454, 3 454, 3 396, 3 352, 6 347, 1 412, 8	82 390 77 077 63 909 63 878 53 934 21 216	34, 81 34, 81 24, 01 18, 49 15, 21 18, 49	6 313, 0 5 905, 9 3 866, 1 3 349, 7 2 363, 4 950, 3	1012, 8 1012, 8 854, 7 817, 8 530, 8 237, 1
Ито-го		29, 2	4 466	42 280	2 418	362 404	145, 82	22 748, 4	4466, 0

Решение. По данным табл. 8.6 составим систему нормальных уравнений:

Таким образом,

Оценка существенности связи

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.

Значимость коэффициентов регрессии осуществляется с помощью
t-критерия Стьюдента

, (8.37)

где – дисперсия коэффициента регрессии.

Параметр модели признается статистически значимым, если

где α – уровень значимости статической существенности связи;

V = n – k – 1 – число степеней свободы, которое характеризует число свободно варьирующих элементов совокупности.

Наиболее сложным в этом выражении является определение дисперсии, которая может быть рассчитана двояким способом:

1) приближенная оценка: ,

где – дисперсия результативного признака;

k – число факторных признаков в уравнении;

2) более точная оценка: ,

где – величина множественного коэффициента корреляции по фактору с остальными факторами.

Проверка адекватности всей модели осуществляется с помощью расчета F-критерия Фишера и величины средней ошибки аппроксимации Ē .

Значение F-критерия Фишера определяется по формуле

, (8.38)

где – теоретические значения результативного признака, полученные по уравнению регрессии;

n – объем исследуемой совокупности;

k – число факторных признаков в модели.

Если F_p> F_α при α = 0, 05 или α = 0, 01, то уравнение регрессии соответствует или адекватно эмпирическим данным. Величина определяется по специальным таблицам на основании величины α = 0, 05 или α = 0, 01 и числа степеней свободы V₁ = k + 1, V₂= n – k – 1, где n – число наблюдений, k – число факторных признаков.

Значение средней ошибки аппроксимации

(8.39)

не должно превышать 12–15 %.

Интерпретация моделей регрессии начинается со статистической оценки. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак «+», то с увеличением данного фактора результативный признак возрастает; если факторный признак со знаком «–», то с его увеличением результативный признак уменьшается. Интерпретация этих знаков полностью определяется социально-экономическим содержанием.

При анализе адекватности уравнения регрессии исследуемому процессу возможны следующие варианты:

1) если построенная модель после проверки по F-критерию Фишера в целом адекватна и все коэффициенты регрессии значимы, то она может быть использована для принятия решений к осуществлению прогнозов;

2) если модель по F-критерию Фишера адекватна, но часть коэффициентов регрессии незначима, то она пригодна для принятия некоторых решений, но не для производства прогнозов;

3) если модель по F-критерию Фишера адекватна, но все коэффициенты регрессии незначимы, то модель считается неадекватной и по ней не принимаются решения и не осуществляются прогнозы.

С целью расширения возможности экономического анализа используется частный коэффициент эластичности

, (8.40)

где – среднее значение соответствующего факторного признака;

– среднее значение результативного признака;

– коэффициент регрессии при соответствующем факторном признаке.

Коэффициент эластичности показывает, на сколько в среднем процентов изменится значение результативного признака при изменении факторного признака на 1 %.

Множественный коэффициент детерминации (R² ) представляет собой множественный коэффициент корреляции в квадрате, характеризует, какая доля вариации результативного признака обусловлена изменением факторных признаков, входящих в многофакторную регрессионную модель.

Для более точной оценки влияния каждого факторного признака на моделируемый используют Q-коэффициент

, (8.41)

где – коэффициент вариации соответствующего факторного признака [1, 3–8].

Тесты

1. Для изучения связи между двумя признаками рассчитано линейное уравнение регрессии: У_х = 36, 5 – 1, 04 х, параметры а₀=36, 5
и а₁=–1, 04.

Параметр а₁ показывает, что …

а) связь между признаками обратная;

б) с увеличением признака Х на единицу признак У увеличивается на 36, 5;

в) связь между признаками прямая;

г) с увеличением признака Х на 1 признак У уменьшается на 1, 04.

2. По направлению связи бывают:

а) умеренные;

б) прямые;

в) прямолинейные.

3. Функциональной является связь:

а) между двумя признаками;

б) при которой определенному значению факторного признака соответствует несколько значений результативного признака;

в) при которой определенному значению факторного признака соответствует одно значение результативного признака.

4. Аналитическое выражение связи определяется с помощью методов анализа:

а) корреляционного;

б) регрессионного;

в) группировок.

5. Анализ тесноты и направления связей двух признаков осуществляется на основе:

а) парного коэффициента корреляции;

б) частного коэффициента корреляции;

в) множественного коэффициента корреляции.

6. Мультиколлинеарность – это связь между:

а) признаками;

б) уровнями;

в) явлениями.

7. Оценка значимости уравнения регрессии осуществляется на основе:

а) коэффициента детерминации;

б) средней квадратической ошибки;

в) F-критерия Фишера.

8. Оценка связей социальных явлений производится на основе:

а) коэффициента ассоциации;

б) коэффициента контингенции;

в) коэффициента эластичности.

9. Коэффициент корреляции рангов Спирмена можно применять для оценки тесноты связи между:

а) количественными признаками;

б) качественными признаками, значения которых могут быть упорядочены;

в) любыми качественными признаками.

⇐ Предыдущая 5 6 7 8 91011 12 13 14 Следующая ⇒