Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Тема 9. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ



Корреляционно-регрессионный анализ заключается в определении аналитического выражения и степени тесноты связи между различными социально-экономическими явлениями и процессами или их признаками.

Признаки, обусловливающие изменение других, связанных с ними признаков, называют факторными и обозначают х. Признаки, изменяющиеся под воздействием факторных признаков, называют результативными и обозначают .

Связи между явлениями и их признаками классифицируются по:

аналитическому выражению (линейная связь и нелинейная связь);

– направлению (прямая связь и обратная связь);

степени тесноты (связь отсутствует, слабая, умеренная, сильная).

Линейная связь выражается уравнением прямой

,

где и – параметры линейной функции в уравнении связи, выражающей зависимость у от х.

Степень тесноты связи между различными явлениями определяют с помощью эмпирического корреляционного отношения ( ) ,

где – дисперсия в ряду результативного признака под влиянием фактора х, т. е. рассчитанных по уравнению регрессии;

– дисперсия в ряду фактических значений результативного признака.

Если , т. е. = 1, то существует полная зависимость уx от х. Если = 0, то вариация факторного признака не влияет на вариацию результативного признака.

В случае линейной зависимости между двумя признаками степень тесноты связи между ними можно определить также с помощью линейного коэффициента корреляции по формулам

r = и r = ,

где – параметр линейной функции в уравнении связи, выражающей зависимость у от х;

и – среднеквадратическое отклонение в рядах х и у, соответственно;

– средняя величина факторного признака;

– средняя величина результативного признака;

– средняя величина произведений факторного и результативного признаков.

Коэффициент регрессии показывает, на сколько единиц изменяются значения результативного признака при изменении факторного признака на единицу. В случае прямой связи между признаками линейный коэффициент корреляции принимает положительные значения, а в случае обратной связи – отрицательные.

По величине линейного коэффициента корреляции судят о степени тесноты связи между признаками.

Величина коэффициента корреляции по модулю Теснота связи
От 0 до ± 0, 3 практически отсутствует
От ± 0, 3 до ± 0, 5 слабая
От ± 0, 5 до ± 0, 7 умеренная
От ± 0, 7 до ± 1, 0 сильная

Графически связь между двумя количественными признаками изучают с помощью поля корреляции.

Пример 1. Приводятся данные за 2004 г. по отдельным отраслям промышленности в целом по РФ:

Отрасль промышленности Среднегодовая численность персонала, тыс. чел. Объем промышленной продукции, млрд. руб. Среднемесячная номинальная заработная плата, тыс. руб.
Электроэнергетика 10, 96
Топливная 1 996 19, 35
Черная металлургия 1 126 9, 35
Цветная металлургия       13, 45
Машиностроение 3 180 1 748 6, 68

Составить уравнение линейной функции, выражающей зависимость среднемесячной заработной платы от уровня производительности труда, и измерить тесноту связи между этими показателями. Полученную связь изучить графически.

Решение. Все предварительные расчеты представим в таблице. Факторный признак – уровень производительности труда, рассчитанная путем деления объема промышленной продукции на среднегодовую численность персонала (графа 2), результативный признак – размер средней месячной номинальной заработной платы (графа 3).

Отрасль промышлен-ности x y  
Электро-энергетика 1, 127 10, 96 1, 2701 12, 3519 120, 1216 10, 405
Топливная 2, 630 19, 35 6, 9169 50, 8906 374, 4225 18, 402
Черная металлургия 1, 632 9, 35 2, 6634 15, 2592 87, 4225 13, 092
Цветная металлургия 1, 155 13, 45 1, 3340 15, 5348 180, 9025 10, 554
Машино-строение 0, 550 6, 68 0, 3025 3, 6740 44, 6224 7, 336
Итого 7, 094 59, 79 12, 4869 97, 7159 807, 4915 59, 789

Вычисляем все необходимые показатели.

1, 4188;

11, 958;

19, 54318;

2, 49738;

61, 64983;

0, 696;

4, 319.

 

Вычислим линейный коэффициент корреляции

r = = = 0, 857.

Для определения параметров линейной функции и составляют систему уравнений

Подставим в систему уравнений все вычисленные показатели

Решая эту систему уравнений, получаем, что = 4, 40930 и = 5, 32048.

Уравнение имеет вид: .

В графе 7 с помощью полученной линейной функции рассчитаем теоретические значения результативного признака.

Вычислим линейный коэффициент корреляции

r = = = 0, 857.

Зависимость средней месячной номинальной заработной платы от уровня производительности труда в представленных отраслях промышленности сильная ( близок к 1) и прямая ( больше нуля), т. е. с увеличением производительности труда увеличивается среднемесячная номинальная заработная плата. Построим поле корреляции.

 

Рис. 8. Поле корреляции

 

Поскольку наблюдается сосредоточение точек на графике, то существует сильная связь между уровнем производительности труда и среднемесячной номинальной заработной платой.

Оценку существенности корреляционной связи производят с помощью F-критерия Фишера и t-критерия Стьюдента.

Коэффициент эластичности ( ) показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на 1% и рассчитывается по формуле = ,

где – среднее значение факторного признака;

– среднее значение результативного признака;

– параметр линейной функции, выражающей зависимость у от х.

Если с возрастанием факторного признака происходит ускоренное возрастание или убывание результативного признака, то корреляционная зависимость может быть выражена параболой второго порядка

.


Система уравнений для расчета параметров параболы второго порядка принимает вид

При наличии линейной зависимости результативного признака от двух факторных признаков вычисляют множественный коэффициент корреляции

R = ,

где r – парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до + 1, и его приближение к единице свидетельствует о сильной зависимости между рассматриваемыми признаками.

Ранговые коэффициенты связи

Коэффициент корреляции рангов Спирмена (r) определяется по формуле

r = ,

где – квадраты разности рангов;

n – число наблюдений (число пар рангов).

Коэффициент корреляции рангов Кендалла (t) вычисляют по формуле

t = ,

где S – сумма разностей между числом последовательностей и числом инверсий по результативному признаку,

n – число наблюдений (пар рангов).

Коэффициенты Спирмена и Кендалла принимают значения от –1 до + 1. Чем ближе величина коэффициентов Спирмена и Кендалла по модулю к 1, тем сильнее связь между признаками.

Пример 2. По исходным данным предыдущего примера 1 рассчитать ранговые коэффициенты связи Спирмена и Кендалла.

Решение. Ранжируем значения факторного и результативного признаков (графы 4 и 5); находим разности рангов = ( графа 6).

Отрасль промышленности х у
Электроэнергетика 1, 127 10, 96 –1
Топливная 2, 630 19, 35
Черная металлургия 1, 632 9, 35
Цветная металлургия 1, 155 13, 45 –1
Машиностроение 0, 550 6, 68
Итого

Полученные разности рангов ( ) возводим в квадрат, находим их сумму (графа 7) и подставляем в формулу коэффициента Спирмена

r = = = = 0, 7.

При вычислении коэффициента Кендалла значения факторного признакапредварительно ранжируем. Значения результативного признака записываем в соответствии с исходными данными.

Отрасль промышленности х у P Q
Машиностроение 0, 550 6, 68
Электроэнергетика 1, 127 10, 96
Цветная металлургия 1, 155 13, 45
Черная металлургия 1, 632 9, 35
Топливная 2, 630 19, 35
Итого         – 2

Для каждого определяем:

– число следующих за ним рангов, больших по значению, чем данный ранг. Общее число таких случаев учитывают со знаком «+» и обозначают буквой P (графа 6);

– число следующих за ним рангов, меньших по значению, чем данный ранг. Общее число таких случаев учитывают со знаком «–» и обозначают буквой Q (графа 7).

Вычисляем S = P + Q = 8 + (–2) = 6.

Подставим в формулу коэффициента Кендалла полученные значения

t = = = 0, 6.

Величины коэффициентов Спирмена и Кендалла свидетельствует о тесной зависимости среднемесячной заработной платы от уровня производительности труда в представленных отраслях экономики.

Для изучения степени тесноты связи между произвольным числом ранжированных количественных признаков вычисляют множественный коэффициент конкордации (W) по формуле

,

где S – отклонение суммы квадратов рангов от средней квадратов рангов;

m – число ранжируемых признаков;

n – число наблюдений.

Эта формула применяется в том случае, когда ранги по каждому признаку не повторяются.

Если несколько значений имеют одинаковую количественную оценку, т. е. ранги повторяются, то применяют следующую формулу:

,

гдеt число одинаковых рангов по каждому признаку.


Поделиться:



Последнее изменение этой страницы: 2017-03-14; Просмотров: 414; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.036 с.)
Главная | Случайная страница | Обратная связь