Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Тема 9. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
Корреляционно-регрессионный анализ заключается в определении аналитического выражения и степени тесноты связи между различными социально-экономическими явлениями и процессами или их признаками. Признаки, обусловливающие изменение других, связанных с ними признаков, называют факторными и обозначают х. Признаки, изменяющиеся под воздействием факторных признаков, называют результативными и обозначают . Связи между явлениями и их признаками классифицируются по: – аналитическому выражению (линейная связь и нелинейная связь); – направлению (прямая связь и обратная связь); – степени тесноты (связь отсутствует, слабая, умеренная, сильная). Линейная связь выражается уравнением прямой , где и – параметры линейной функции в уравнении связи, выражающей зависимость у от х. Степень тесноты связи между различными явлениями определяют с помощью эмпирического корреляционного отношения ( ) , где – дисперсия в ряду результативного признака под влиянием фактора х, т. е. рассчитанных по уравнению регрессии; – дисперсия в ряду фактических значений результативного признака. Если , т. е. = 1, то существует полная зависимость уx от х. Если = 0, то вариация факторного признака не влияет на вариацию результативного признака. В случае линейной зависимости между двумя признаками степень тесноты связи между ними можно определить также с помощью линейного коэффициента корреляции по формулам r = и r = , где – параметр линейной функции в уравнении связи, выражающей зависимость у от х; и – среднеквадратическое отклонение в рядах х и у, соответственно; – средняя величина факторного признака; – средняя величина результативного признака; – средняя величина произведений факторного и результативного признаков. Коэффициент регрессии показывает, на сколько единиц изменяются значения результативного признака при изменении факторного признака на единицу. В случае прямой связи между признаками линейный коэффициент корреляции принимает положительные значения, а в случае обратной связи – отрицательные. По величине линейного коэффициента корреляции судят о степени тесноты связи между признаками.
Графически связь между двумя количественными признаками изучают с помощью поля корреляции. Пример 1. Приводятся данные за 2004 г. по отдельным отраслям промышленности в целом по РФ:
Составить уравнение линейной функции, выражающей зависимость среднемесячной заработной платы от уровня производительности труда, и измерить тесноту связи между этими показателями. Полученную связь изучить графически. Решение. Все предварительные расчеты представим в таблице. Факторный признак – уровень производительности труда, рассчитанная путем деления объема промышленной продукции на среднегодовую численность персонала (графа 2), результативный признак – размер средней месячной номинальной заработной платы (графа 3).
Вычисляем все необходимые показатели. 1, 4188; 11, 958; 19, 54318; 2, 49738; 61, 64983; 0, 696; 4, 319.
Вычислим линейный коэффициент корреляции r = = = 0, 857. Для определения параметров линейной функции и составляют систему уравнений Подставим в систему уравнений все вычисленные показатели
Решая эту систему уравнений, получаем, что = 4, 40930 и = 5, 32048. Уравнение имеет вид: . В графе 7 с помощью полученной линейной функции рассчитаем теоретические значения результативного признака. Вычислим линейный коэффициент корреляции r = = = 0, 857. Зависимость средней месячной номинальной заработной платы от уровня производительности труда в представленных отраслях промышленности сильная ( близок к 1) и прямая ( больше нуля), т. е. с увеличением производительности труда увеличивается среднемесячная номинальная заработная плата. Построим поле корреляции.
Рис. 8. Поле корреляции
Поскольку наблюдается сосредоточение точек на графике, то существует сильная связь между уровнем производительности труда и среднемесячной номинальной заработной платой. Оценку существенности корреляционной связи производят с помощью F-критерия Фишера и t-критерия Стьюдента. Коэффициент эластичности ( ) показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на 1% и рассчитывается по формуле = , где – среднее значение факторного признака; – среднее значение результативного признака; – параметр линейной функции, выражающей зависимость у от х. Если с возрастанием факторного признака происходит ускоренное возрастание или убывание результативного признака, то корреляционная зависимость может быть выражена параболой второго порядка . Система уравнений для расчета параметров параболы второго порядка принимает вид
При наличии линейной зависимости результативного признака от двух факторных признаков вычисляют множественный коэффициент корреляции R = , где r – парные коэффициенты корреляции между признаками. Множественный коэффициент корреляции изменяется в пределах от 0 до + 1, и его приближение к единице свидетельствует о сильной зависимости между рассматриваемыми признаками. Ранговые коэффициенты связи Коэффициент корреляции рангов Спирмена (r) определяется по формуле r = , где – квадраты разности рангов; n – число наблюдений (число пар рангов). Коэффициент корреляции рангов Кендалла (t) вычисляют по формуле t = , где S – сумма разностей между числом последовательностей и числом инверсий по результативному признаку, n – число наблюдений (пар рангов). Коэффициенты Спирмена и Кендалла принимают значения от –1 до + 1. Чем ближе величина коэффициентов Спирмена и Кендалла по модулю к 1, тем сильнее связь между признаками. Пример 2. По исходным данным предыдущего примера 1 рассчитать ранговые коэффициенты связи Спирмена и Кендалла. Решение. Ранжируем значения факторного и результативного признаков (графы 4 и 5); находим разности рангов = – ( графа 6).
Полученные разности рангов ( ) возводим в квадрат, находим их сумму (графа 7) и подставляем в формулу коэффициента Спирмена r = = = = 0, 7. При вычислении коэффициента Кендалла значения факторного признакапредварительно ранжируем. Значения результативного признака записываем в соответствии с исходными данными.
Для каждого определяем: – число следующих за ним рангов, больших по значению, чем данный ранг. Общее число таких случаев учитывают со знаком «+» и обозначают буквой P (графа 6); – число следующих за ним рангов, меньших по значению, чем данный ранг. Общее число таких случаев учитывают со знаком «–» и обозначают буквой Q (графа 7). Вычисляем S = P + Q = 8 + (–2) = 6. Подставим в формулу коэффициента Кендалла полученные значения t = = = 0, 6. Величины коэффициентов Спирмена и Кендалла свидетельствует о тесной зависимости среднемесячной заработной платы от уровня производительности труда в представленных отраслях экономики. Для изучения степени тесноты связи между произвольным числом ранжированных количественных признаков вычисляют множественный коэффициент конкордации (W) по формуле , где S – отклонение суммы квадратов рангов от средней квадратов рангов; m – число ранжируемых признаков; n – число наблюдений. Эта формула применяется в том случае, когда ранги по каждому признаку не повторяются. Если несколько значений имеют одинаковую количественную оценку, т. е. ранги повторяются, то применяют следующую формулу: , гдеt – число одинаковых рангов по каждому признаку. |
Последнее изменение этой страницы: 2017-03-14; Просмотров: 414; Нарушение авторского права страницы