Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Основные этапы проведения корреляционно-регрессионного анализа
Одной из наиболее важных задач статистического исследования является изучение связи между наблюдаемыми переменными и на их основе прогнозирование социально-экономических явлений. Корреляционно-регрессионный анализ предназначен для установления и измерения связей между одной зависимой и несколькими (одной) независимыми переменными. Исходной для анализа является матрица Х размерности ( n, k ), элементы которой представляют собой n наблюдений для каждого из k факторов. Корреляционно-регрессионный анализ начинается с расчета корреляционной матрицы R, размерности ( k, k ), состоящей из парных коэффициентов корреляции. . Парный коэффициент корреляции представляет собой меру линейной зависимости между двумя переменными на фоне действия остальных рассматриваемых в анализе. Парные коэффициенты корреляции изменяются в пределах от –1 до +1. Значение корреляции –1 показывает, что переменные связаны функциональной обратной зависимостью, а значение +1 – прямой функциональной зависимостью. Значение парного коэффициента корреляции равного 0 означает отсутствие связи между признаками. Корреляционная матрица всегда симметрична, на главной диагонали находятся 1. Расчет парного коэффициента корреляции производится по формуле , где ; ; ; ; . Значимость парных коэффициентов можно проверить с помощью -критерия Стьюдента. . Проверяемый коэффициент корреляции считается значимым, если . Одним из основных препятствий эффективного применения множественного регрессионного анализа является мультиколлинеарность. На практике о наличии мультиколлинеарности обычном судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы больше 0, 8, т.е. , то считают, что имеет место мультиколлинеарность. Нахождение частных коэффициентов корреляции любого порядка является одной из задач корреляционного анализа. Порядок коэффициентов корреляции (k) − это число фиксируемых факторов. Частный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входящих в модель. Коэффициент частной корреляции первого порядка, когда элиминируется корреляция с одной переменной, определяется по формуле . На основе коэффициентов частной корреляции первого порядка можно найти коэффициент частной корреляции второго порядка: . Точка в подстрочных значках означает элиминирование, т.е. погашение связи и с и . На основе коэффициентов частной корреляции второго порядка можно найти коэффициенты частной корреляции третьего порядка и т.д. Коэффициент частной корреляции -го порядка имеет вид: . Коэффициент частной корреляции принимают значения от –1 до 1, так как они являются мерами линейных связей. По абсолютной величине коэффициенты частной корреляции изменяются в интервале . Значимость частных коэффициентов корреляции проверяется по тем же критериям, что и парных. , где − оценка частного коэффициента корреляции; − число фиксируемых факторов. Проверяемый коэффициент корреляции считается значимым, если . Множественный коэффициент корреляции характеризует тесноту связи между результативной переменной и независимой. Он изменяется от 0 до 1 и рассчитывается по формуле , где − коэффициент множественной детерминации при всех учтенных факторных переменных (включая ); − коэффициент множественной детерминации без переменной . Назначение коэффициента множественной корреляции состоит в оценке качества уровня множественной регрессии: чем больше значение , чем ближе оно к единице, тем лучше уравнение регрессии, тем надежнее результаты анализа или прогноза на его основе. Значимость множественного коэффициента корреляции проверяется на основе -критерию. Фактическое значение находится по формуле , где − число наблюдений; − число факторов в уравнении. Если , то множественный коэффициент корреляции считается значимым. Показателями тесноты связи можно дать качественную оценку на основе шкала Чеддока:
*Значения коэффициентов следует брать по модулю. Функциональная связь возникает при значении, равном 1, а отсутствие связи – 0. Регрессионный анализ является статистическим методом изучения зависимости случайной величины от переменных . Математически корреляционная зависимость результативной переменной от нескольких факторных переменных описывается уравнением множественной регрессии. Уравнение регрессии характеризует среднее изменение с применением признаков-факторов. Построение уравнения регрессии решает две задачи: выбор признаков факторов и тип уравнения. Решение первой задачи основывается на анализе матрицы парных коэффициентов корреляции и выделение тех переменных, для которых . Не рекомендуется совместно включать в модель объясняющие переменные, тесно связанные между собой. При переменные и дублируют друг друга, и совместное включение их в уравнение регрессии не дает дополнительной информации для объяснения вариации .Такое явление называется мультиколлинеарностью и в урав-нение регрессии следует включать только одну из переменных или . Чтобы избавиться от этого негативного явления, обычно используют алгоритм пошагового регрессионного анализа или строят уравнение регрессии на главных компонентах. Не следует включать совместно признаки, представленные как абсолютные, средние и относительные величины. Не рекомендуется включать в модель признаки, функционально связанные с зависимой переменной (являются составной частью ). Необходимо принять во внимание частные коэффициенты корреляции для каждого признака-фактора. Их значение свидетельствует о возможности включения в регрессионную модель той или иной зависимой переменной. Решение второй задачи опирается на простоту интерпретации результатов многофакторного регрессионного анализа: чем проще тип уравнения множественной регрессии, тем очевиднее интерпретация его параметров и предпочтительнее выбор модели для анализа производства прогноза и принятия решений. Для выбора типа аналитического выражения для описания линии регрессии могут использоваться любые математические функции, но обычно выбирают из пяти следующих типов: - линейная: ; - степенная: ; - показательная: ; - параболическая: ; - гиперболическая: . На практике наиболее часто используют линейное уравнение множественной регрессии: . Коэффициенты регрессии линейного уравнения множественной регрессии показывают, на сколько единиц в среднем изменяется при изменении на свою единицу измерения и закрепления прочих, введенных в уравнение факторных переменных на среднем уровне. Так как все включенные переменные имеют свою размерность, то сравнивать нельзя; по величине нельзя сделать вывод, что одна переменная влияет сильнее на , а другая слабее. При проверке адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Значимость коэффициентов регрессии осуществляется с помощью − критерию Стьюдента: , где − дисперсия коэффициентов регрессии. , где − множественный коэффициент детерминации. Параметры модели признаются статистически значимыми, если . Проверка адекватности всей модели осуществляется с помощью расчета − критерий по формуле , если , то модель признается значимой. При адекватности уравнения регрессии исследуемому процессу возможны следующие варианты. 1. Построенная модель на основе ее проверки по -критерию Фишера в целом адекватна, и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений к осуществлению процессов. 2. Модель -критерию Фишера адекватна, но часть коэффициентов регрессии незначима. В этом случае модель пригодна для принятия некоторых решений, но не для производства прогнозов. 3. Модель по -критерию Фишера адекватна, но все коэффициентов регрессии незначимы. Поэтому модель полностью считает неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы. С целью расширения возможностей экономического анализа рассчитывают коэффициенты эластичности , -коэффициенты (стандартизованные коэффициенты регрессии), -коэффициенты. На их основе можно определить степень влияния факторной переменной на результат. Коэффициент эластичности характеризует, на сколько процентов увеличивается У при увеличении Хi на один процент и рассчитывается по формуле . -коэффициенты показывают, на какую часть среднеквадратического отклонения ( ) изменится зависимая переменная У с изменением соответствующего фактора Хi на величину своего среднеквадратического отклонения ( ). Этот коэффициент позволяет сравнить влияние колеблемости различных факторов на вариацию исследуемого показателя, на основе чего выявляются факторы, в развитии которых заложены наибольшие резервы изменения результативного показателя: . Чтобы оценить долю вариации каждого фактора в суммарном влиянии факторов, включенных в уравнение регрессии, рассчитывают -коэффициенты: . Популярное:
|
Последнее изменение этой страницы: 2017-03-11; Просмотров: 1132; Нарушение авторского права страницы