Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
ТЕМА 10. СТАТИСТИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ
МЕРЫ СВЯЗИ МЕТОДИЧЕСКИЕ УКАЗАНИЯ Необходимая обусловленность явления множеством факторов называется детерминизмом. Признак, характеризующий следствие, называется результативным (y); признак, характеризующий причину, - факторным (x). Для исследования стохастических связей широко используется метод сопоставления параллельных рядов факторного и результативного признаков, метод аналитической группировки (см. тему «Сводка и группировка статистических данных), корреляционный анализ, регрессионный анализ и непараметрические методы. В общем виде задача статистики в области изучения взаимосвязей состоит в оценке направления, силы и формы (аналитического выражения) влияния факторных признаков на результативный. Для ее решения применяют методы корреляционного и регрессионного анализа. Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Задачами регрессионного анализа является выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчетных значений зависимой переменной (функции регрессии). Решение всех этих задач приводит к использованию корреляционно-регрессионного анализа. Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации одного факторного признака на результативный признак и представляющая собой однофакторный корреляционный и регрессионный анализ. Важнейшим этапом построения регрессионной модели (уравнения регрессии) является установление в анализе исходной информации математической функции. Регрессионный анализ проводится по количественным признакам. Выбор типа функции может опираться на графический метод, теоретические знания об изучаемом явлении, опыт предыдущих аналогичных исследований, или осуществляться эмпирически – перебором и оценкой функций разных типов и т.п. Уравнение парной линейной связи имеет вид: yt = a0 + a1x, (10.1) где yt - теоретические значения результативного признака, полученные по уравнению регрессии; a0, a1 - параметры (коэффициенты) уравнения регрессии. Параметры уравнения a0 и a1 исчисляют по следующим формулам: (10.2) (10.3) Поскольку а0 является средним значением y в точке x = 0, его экономическая интерпретация часто затруднена или вообще невозможна. Коэффициент парной линейной регрессии a1 имеет смысл показателя силы связи между вариацией факторного признака и вариацией результативного признака. Уравнение показывает среднее значение изменения результативного признака при изменении факторного признака на одну единицу его измерения. Знак a1 указывает направление этого измерения. Определив параметры a0 и a1, и подставив их в уравнение связи, можно определить значения yt, зависящие только от заданного значения х. Построение регрессионной модели может быть дополнено корреляционным анализом. При линейной форме связи признаков, измеренных в интервальной шкале, применяется показатель тесноты связи – линейный коэффициент корреляции. (10.4) Значение линейного коэффициента корреляции принимает значения в интервале от –1 до +1. Отрицательные значения коэффициента указывают на обратную связь, положительные – на прямую связь между признаками. Чем ближе коэффициент корреляции по модулю к 1, тем теснее связь между признаками, при его равенстве 1 связь – функциональная. В остальных случаях можно пользоваться шкалой Фишера:
Квадрат линейного коэффициента корреляции называется линейным коэффициентом детерминации, который характеризует долю объясненной дисперсии в общей дисперсии результативного признака. Самым простым показателем тесноты связи является коэффициент Фехнера, который учитывает совпадение или несовпадение знаков отклонений от средних уровней. Значение этого коэффициента по абсолютной величине не превышает 1. Отрицательное значение свидетельствует об обратной связи. Однако по коэффициенту Фехнера ничего нельзя сказать о форме связи, кроме того он характеризует только несовпадение знаков отклонений, а не их величину. Теснота связи может быть измерена эмпирическим корреляционным отношением на основе аналитической группировки, в этом случае факторный признак может быть любого вида, а результативный только количественным. Для измерения этой связи на основе аналитической группировки следует определить эмпирическое корреляционное отношение , (10.5) где – межгрупповая дисперсия результативного признака. Межгрупповая дисперсия определяется по формуле: , (10.6) где – среднее значение результативного признака по отдельным группам, – общее среднее значение результативного признака по всей совокупности обследованных лиц, m – численность единиц в каждой группе. - общая дисперсия результативного признака, определяется по формуле: (10.7) Корреляционное отношение принимает значения от 0 до 1; направление связи по значению корреляционного отношения определить нельзя, а теснота связи оценивается по шкале Фишера. Корреляционное отношение в квадрате представляет собой коэффициент детерминации, который характеризует долю объясненной дисперсии в общей дисперсии результативного признака. Если исходные значения признаков можно заменить их рангами, то линейный коэффициент корреляции примет форму коэффициента корреляции рангов Спирмэна. (10.8) где d – разница между рангами факторного и результативного признаков; n – количество единиц в совокупности. Коэффициент Спирмэна принимает значения от -1 до +1. Интерпретируется также как и парный коэффициент линейной корреляции. Для оценки тесноты связи между качественными (атрибутивными) признаками используются непараметрические методы. Здесь речь идет только об установлении наличия связи и измерении ее тесноты. При использовании непараметрических методов строится корреляционная таблица (таблица сопряженности), где по строкам следуют упорядоченные значения одного признака, а по столбцам - другого. По данным корреляционной таблицы для измерения тесноты связи между признаками используют коэффициенты взаимной сопряженности Чупрова, Пирсона, Крамера и другие. Коэффициент Чупрова (10.9) Коэффициент Пирсона (10.10) Коэффициент Крамера (10.11) Где φ 2 – критерий фи-квадрат, исчисляемый по формуле: (10.12) mij – количество единиц совокупности, находящихся на пересечении i-той строки и j-того столбца; Мi, Mj - сумма значений, соответственно по i-той строке и j-тому столбцу; n, k – количество выделенных групп у признаков, т.е., соответственно количество строк и столбцов. Коэффициенты взаимной сопряженности принимают значения от 0 до 1. Чем ближе значение к 1, тем теснее связаны между собой анализируемые признаки. Если по каждому из признаков выделено только по две группы (альтернативный признак), то взаимную сопряженность признаков можно оценить на основе коэффициентов контингенции и ассоциации. Коэффициент контингенции (10.13) Для ускорения расчетов коэффициент взаимосвязи альтернативных признаков рассчитывают в форме коэффициента ассоциации: (10.14) Где a, b, c, d – количество единиц совокупности, представленных в таблице сопряженности следующим образом:
РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ Задача 1. По группе студентов одной специальности дневной формы обучения известно количество посещенных практических занятий (из 20 возможных в семестре) и балльная оценка (из возможных 100 баллов). Данные представлены в таблице.
По результату аналитической группировки оценить тесноту связи между количеством явок на занятия и набранным количеством баллов с помощью эмпирического корреляционного отношения. Решение. Результат аналитической группировки представлен в таблице (см. решение типовой задачи в теме «Сводка и группировка статистических данных»).
Для исчисления эмпирического корреляционного отношения необходимо определить общую и межгрупповую дисперсии результативного признака. Общую дисперсию считаем по простой формуле, так как данные по полученным баллам не сгруппированы.
Межгрупповую дисперсию вычисляем с учетом численности человек в каждой группе.
Эмпирическое корреляционное отношение составит:
Таким образом, по шкале Фишера связь между посещением занятий и количеством полученных баллов очень тесная (свыше 0, 8). Коэффициент детерминации составляет 0, 812 (подкоренное выражение), т.е. количество полученных баллов на 81, 2% объясняется посещаемостью.
ЗАДАЧИ ДЛЯ РЕШЕНИЯ Задача 1. На основе аналитической группировки, проведенной в задаче 2 темы «Сводка и группировка статистических данных», оценить тесноту связи между факторным и результативным признаками с помощью эмпирического корреляционного отношения. Задача 2. Известны распределения сотрудников по заработной плате и полу.
1. Исчислить дисперсию заработной платы по совокупности мужчин, женщин и всех сотрудников (принять во внимание расчеты, проведенные по теме «Средние величины»). Проверить правило сложения дисперсий; 2. Оценить тесноту связи между полом и заработной платой с помощью эмпирического корреляционного отношения.
Задача 3. По регионам Сибирского федерального округа известны следующие данные за 2008 г.
По данным СФО: 1) построить парное линейное уравнение регрессии ВРП от размера инвестиций. Сделать выводы. 2) исчислить парный коэффициент линейной корреляции; 3) исчислить коэффициент Фехнера. Задача 4. Из исходных данных задачи 2 темы «Сводка и группировка статистических данных», отобрать совокупность лиц до 55 лет (22 человека), для которых построить парное линейное уравнение регрессии дохода от возраста. Сделать выводы.
Задача 5. Приводится рейтинг регионов Сибирского федерального округа по производству промышленной продукции и сельскохозяйственной продукции за 2009 г.
Оценить корреляцию рангов с помощью коэффициента Спирмэна. Сделать выводы.
Задача 6. Супруги ранжировали 8 жизненных ценностей по степени предпочтения. Результаты приведены в таблице.
Оценить согласованность мнения жены и мужа с помощью коэффициента ранговой корреляции Спирмэна. Ответ: 0, 95.
Задача 7. В ходе социологического исследования респонденты должны были указать размер своего среднедушевого дохода в месяц и оценить состояние своего здоровья по 10-ти бальной шкале. После сопоставления этих показателей получены следующие результаты.
Оценить корреляцию рангов с помощью коэффициентов Спирмэна.
Задача 8. По данным задачи 2 темы «Сводка и группировка статистических данных» построить: 1) таблицу сопряженности образования и пола вида 2× 4; 2) таблицу сопряженности образования и дохода вида 4× 3 (интервалы групп по доходу установить самостоятельно). Оценить тесноту связи, используя коэффициенты взаимной сопряженности Чупрова, Пирсона и Крамера.
Задача 9. В одном из исследований изучалась склонность людей передавать плохие и хорошие новости. На ветровых стеклах автомобилей, припаркованных у почтовых ящиков, были оставлены почтовые открытки с указанием почтового адреса (всего 180 штук), содержащие либо хорошие (нейтральные) либо плохие новости (в качестве плохой новости использовалось, например, сообщение о супружеской неверности второй половины адресата). В процессе исследования подсчитывалось количество отправленных открыток, дошедших до указанного адреса. Результаты представлены в таблице. Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 584; Нарушение авторского права страницы