Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Количественная оценка тесноты связи по эмпирическим данным: эмпирический коэффициент детерминации, эмпирическое корреляционное отношение.



ОТВЕТ

Количественная оценка тесноты связи по эмпирическим данным состоит в расчете показателей тесноты связи:

· Эмпирический коэффициент детерминации (эмпирическое дисперсионное отношение) - r2.

Данный показатель рассчитывается по данным аналитической группировки (табл.), как отношение межгрупповой дисперсии признака-результата Y (dy2) к общей дисперсии Y (sy2):

.

Согласно теореме о разложении дисперсии межгрупповая дисперсия связана с общей дисперсией: sy2=dy2+ey2. Тогда эмпирический коэффициент детерминации может быть рассчитан через остаточную дисперсию по формуле:

где sj2 – дисперсия признака-результата Y внутри j-ой группы.

 

Эмпирический коэффициент детерминации характеризует силу влияния группировочного признака (Х) на образование общей вариации результативного признака Y и показывает процент (долю) вариации признака-результата, обусловленную признаком-фактором, положенным в основу группировки.

Расчет r2 удобно вести в таблице:

Таблица

Признак- фактор Хj Nj Среднее значение признака-результата sj2Nj
X1 N1 s12N1
X2 N2 s22N2
....       ...
Xm Nm sm2Nm
Итого N Х å sj2

Тогда .

 

Рассмотрим пример. Пусть дана совокупность из 20 рабочих, характеризующихся признаками: Y - выработка рабочего (шт./смену) и Х- квалификация (разряд). Исходные данные представлены в таблице:

X
Y

Требуется оценить тесноту связи между признаками с помощью эмпирического коэффициента детерминации (r2).

Для расчета r2 произведем аналитическую группировку совокупности. В качестве признака-фактора возьмем Х (разряд рабочего), в качестве признака-результата – Y выработку рабочего). Аналитическая группировка производится по признаку Х. В данном случае она будет дискретная (т.к. значения признака Х довольно часто повторяются). Количество групп равно числу значений признака Х в совокупности, т.е. 6. Результаты группировки и расчета r2 сведем в таблицу:

Признак-фактор Х Признак-результат Y Количество единиц в группе, Nj Среднее значение признака-результата в группе, ( - )2·Nj Дисперсия признака-результата в группе, s2j s2j·Nj
(10+12+13)/3=11, 7 (11, 7-17, 1)23=88, 56 s21=((10-11, 7)2+(12-11, 7)2+(13-11, 7)2)/3=1, 56 4, 7
(11+14)/2=12, 5 (12, 5-17, 1)22=42, 3 s22=((11-12, 5)2+(14-12, 5)2)/2=2, 25 4, 5
(12+13+15+16)/4= 14 (14-17, 1)24=38, 4 s23=((12-14)2+(13-14)2+(15-14)2+(16-14)2)/4=2, 5
(15+17+17+18)/4= 16, 75 (16, 75-17, 1)24=0, 49 s24=((15-16, 75)2+(17-16, 75)2++(17-16, 75)2+(18-16, 75)2)/4=1, 9 4, 75
(18+20+22)/3=20 (20-17, 1)23=25, 23 s25=((18-20)2+(20-20)2+(22-20)2)/3=2, 7
(23+24+27+25)/4= 24, 75 (24, 75-17, 1)24=234, 1 s26=((23-24, 75)2+(24-24, 75)2+(27-24, 75)2+(25-24, 75)2)/4=2, 19 8, 75
  =17, 1   429, 1   40, 7

Эмпирический коэффициент детерминации равен отношению межгрупповой дисперсии признака-результата (dy2) к общей дисперсии признака-результата (sy2): r2 = dy2/sy2 = dy2/(dy2+ey2).

Межгрупповая дисперсия Y будет равна: dy2= å ( - )2·Nj / N = 429, 1/20=21, 45.

Остаточная дисперсия Y будет равна: ey2= å s2j·Nj/ N= 40, 7/20= 2, 035.

Тогда: r2=21, 45/(21, 45+2, 035)= 429, 1/(429, 1+40, 7)=0, 913.

Вывод: 91, 3% вариации выработки рабочих обусловлена влиянием фактора разряд.

 

· Эмпирическое корреляционное отношение - r.

Данный показатель представляет собой корень из эмпирического коэффициента детерминации. Оно показывает тесноту связи (не только линейной! ) между группировочным и результативным признаками. Область допустимых значений эмпирического корреляционного отношения от 0 до +1.

Максимально тесная связь – это связь функциональная, когда каждое значение признака-результата Y однозначно определяется значением признака-фактора Х (т.е. результатом группировки). В этом случае дисперсия групповых средних (dy2) равна общей дисперсии (sy2), т.е. внутригрупповой вариации не будет. При этом остаточная дисперсия (ey2) равна 0, а эмпирический коэффициент детерминации равен 1.

Если связь между признаками отсутствует, то все групповые средние равны между собой, межгрупповой вариации не будет (dy2=0), а эмпирический коэффициент детерминации равен 0.

Рассчитаем эмпирическое корреляционное отношение для нашего примера: r= 0, 9555. Вывод: признаки «выработка рабочего» и «разряд» связаны довольно тесной связью.

Показатели r и r2 определяются не только наличием связи признаков Х и Y, но и фактом группировки первичных данных. С ростом числа групп m межгрупповая дисперсия d2 растет и приближается к общей дисперсии. Если число групп меньше количества единиц совокупности N, то значения r и r2 никогда не будут равны 1, даже при строгой функциональной связи.

Заметим, что сама по себе величина показателя тесноты связи не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а является оценкой степени взаимной согласованности в изменениях признаков. Установлению причинно-следственной зависимости должен обязательно предшествовать анализ качественной природы явлений.

ВОПРОС 37


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-08-24; Просмотров: 1694; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.012 с.)
Главная | Случайная страница | Обратная связь