Основные этапы проведения корреляционно-регрессионного анализа

⇐ ПредыдущаяСтр 9 из 11Следующая ⇒

Одной из наиболее важных задач статистического исследования является изучение связи между наблюдаемыми переменными и на их основе прогнозирование социально-экономических явлений. Корреляционно-регрессионный анализ предназначен для установления и измерения связей между одной зависимой и несколькими (одной) независимыми переменными.

Исходной для анализа является матрица Х размерности ( n, k ), элементы которой представляют собой n наблюдений для каждого из k факторов.

Корреляционно-регрессионный анализ начинается с расчета корреляционной матрицы R, размерности ( k, k ), состоящей из парных коэффициентов корреляции.

Парный коэффициент корреляции представляет собой меру линейной зависимости между двумя переменными на фоне действия остальных рассматриваемых в анализе.

Парные коэффициенты корреляции изменяются в пределах от –1 до +1. Значение корреляции –1 показывает, что переменные связаны функциональной обратной зависимостью, а значение +1 – прямой функциональной зависимостью. Значение парного коэффициента корреляции равного 0 означает отсутствие связи между признаками.

Корреляционная матрица всегда симметрична, на главной диагонали находятся 1.

Расчет парного коэффициента корреляции производится по формуле

где

; ; ; ; .

Значимость парных коэффициентов можно проверить с помощью -критерия Стьюдента.

Проверяемый коэффициент корреляции считается значимым, если .

Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность.

На практике о наличии мультиколлинеарности обычном судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы больше 0, 8, т.е. , то считают, что имеет место мультиколлинеарность.

Нахождение частных коэффициентов корреляции любого порядка является одной из задач корреляционного анализа. Порядок коэффициентов корреляции (k) − это число фиксируемых факторов.

Частный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входящих в модель.

Коэффициент частной корреляции первого порядка, когда элиминируется корреляция с одной переменной, определяется по формуле

На основе коэффициентов частной корреляции первого порядка можно найти коэффициент частной корреляции второго порядка:

Точка в подстрочных значках означает элиминирование, т.е. погашение связи и с и .

На основе коэффициентов частной корреляции второго порядка можно найти коэффициенты частной корреляции третьего порядка и т.д.

Коэффициент частной корреляции -го порядка имеет вид:

Коэффициент частной корреляции принимают значения от –1 до 1, так как они являются мерами линейных связей. По абсолютной величине коэффициенты частной корреляции изменяются в интервале .

Значимость частных коэффициентов корреляции проверяется по тем же критериям, что и парных.

где − оценка частного коэффициента корреляции;

− число фиксируемых факторов.

Проверяемый коэффициент корреляции считается значимым, если

Множественный коэффициент корреляции характеризует тесноту связи между результативной переменной и независимой. Он изменяется от 0 до 1 и рассчитывается по формуле

где − коэффициент множественной детерминации при всех учтенных факторных переменных (включая );

− коэффициент множественной детерминации без переменной .

Назначение коэффициента множественной корреляции состоит в оценке качества уровня множественной регрессии: чем больше значение , чем ближе оно к единице, тем лучше уравнение регрессии, тем надежнее результаты анализа или прогноза на его основе.

Значимость множественного коэффициента корреляции проверяется на основе -критерию.

Фактическое значение находится по формуле

где − число наблюдений;

− число факторов в уравнении.

Если , то множественный коэффициент корреляции считается значимым.

Показателями тесноты связи можно дать качественную оценку на основе шкала Чеддока:

Количественная мера тесноты связи^*	Качественная характеристика силы связи
0, 1 − 0, 3 0, 3 − 0, 5 0, 5 − 0, 7 0, 7 − 0, 9 0, 9 − 0, 99	Слабая Умеренная Заметная Высокая Весьма высокая

*Значения коэффициентов следует брать по модулю.

Функциональная связь возникает при значении, равном 1, а отсутствие связи – 0.

Регрессионный анализ является статистическим методом изучения зависимости случайной величины от переменных .

Математически корреляционная зависимость результативной переменной от нескольких факторных переменных описывается уравнением множественной регрессии.

Уравнение регрессии характеризует среднее изменение с применением признаков-факторов.

Построение уравнения регрессии решает две задачи: выбор признаков факторов и тип уравнения.

Решение первой задачи основывается на анализе матрицы парных коэффициентов корреляции и выделение тех переменных, для которых . Не рекомендуется совместно включать в модель объясняющие переменные, тесно связанные между собой. При переменные и дублируют друг друга, и совместное включение их в уравнение регрессии не дает дополнительной информации для объяснения вариации .Такое явление называется мультиколлинеарностью и в урав-нение регрессии следует включать только одну из переменных или .

Чтобы избавиться от этого негативного явления, обычно используют алгоритм пошагового регрессионного анализа или строят уравнение регрессии на главных компонентах.

Не следует включать совместно признаки, представленные как абсолютные, средние и относительные величины. Не рекомендуется включать в модель признаки, функционально связанные с зависимой переменной (являются составной частью ).

Необходимо принять во внимание частные коэффициенты корреляции для каждого признака-фактора. Их значение свидетельствует о возможности включения в регрессионную модель той или иной зависимой переменной.

Решение второй задачи опирается на простоту интерпретации результатов многофакторного регрессионного анализа: чем проще тип уравнения множественной регрессии, тем очевиднее интерпретация его параметров и предпочтительнее выбор модели для анализа производства прогноза и принятия решений.

Для выбора типа аналитического выражения для описания линии регрессии могут использоваться любые математические функции, но обычно выбирают из пяти следующих типов:

- линейная: ;

- степенная: ;

- показательная: ;

- параболическая: ;

- гиперболическая: .

На практике наиболее часто используют линейное уравнение множественной регрессии:

Коэффициенты регрессии линейного уравнения множественной регрессии показывают, на сколько единиц в среднем изменяется при изменении на свою единицу измерения и закрепления прочих, введенных в уравнение факторных переменных на среднем уровне.

Так как все включенные переменные имеют свою размерность, то сравнивать нельзя; по величине нельзя сделать вывод, что одна переменная влияет сильнее на , а другая слабее.

При проверке адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.

Значимость коэффициентов регрессии осуществляется с помощью − критерию Стьюдента:

где − дисперсия коэффициентов регрессии.

где − множественный коэффициент детерминации.

Параметры модели признаются статистически значимыми, если .

Проверка адекватности всей модели осуществляется с помощью расчета − критерий по формуле

если , то модель признается значимой.

При адекватности уравнения регрессии исследуемому процессу возможны следующие варианты.

1. Построенная модель на основе ее проверки по -критерию Фишера в целом адекватна, и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений к осуществлению процессов.

2. Модель -критерию Фишера адекватна, но часть коэффициентов регрессии незначима. В этом случае модель пригодна для принятия некоторых решений, но не для производства прогнозов.

3. Модель по -критерию Фишера адекватна, но все коэффициентов регрессии незначимы. Поэтому модель полностью считает неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.

С целью расширения возможностей экономического анализа рассчитывают коэффициенты эластичности , -коэффициенты (стандартизованные коэффициенты регрессии), -коэффициенты. На их основе можно определить степень влияния факторной переменной на результат.

Коэффициент эластичности характеризует, на сколько процентов увеличивается У при увеличении Х_iна один процент и рассчитывается по формуле

-коэффициенты показывают, на какую часть среднеквадратического отклонения ( ) изменится зависимая переменная У с изменением соответствующего фактора Х_i на величину своего среднеквадратического отклонения ( ). Этот коэффициент позволяет сравнить влияние колеблемости различных факторов на вариацию исследуемого показателя, на основе чего выявляются факторы, в развитии которых заложены наибольшие резервы изменения результативного показателя:

Чтобы оценить долю вариации каждого фактора в суммарном влиянии факторов, включенных в уравнение регрессии, рассчитывают -коэффициенты:

⇐ Предыдущая 2 3 4 5 6 7 8910 11 Следующая ⇒