Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ТЕМА 10. СТАТИСТИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ



МЕРЫ СВЯЗИ

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

Необходимая обусловленность явления множеством факторов называ­ется детерминизмом. Признак, характеризующий следствие, называется результативным (y); признак, характеризующий причину, - факторным (x).

Для исследования стохастических связей широко используется метод сопоставления параллельных рядов факторного и результативного призна­ков, метод аналитической группировки (см. тему «Сводка и группировка статистических данных), корреляционный анализ, регрессионный анализ и непараметрические ме­тоды.

В общем виде задача статистики в области изучения взаимосвязей со­стоит в оценке направления, силы и формы (аналитического выражения) влияния факторных признаков на результативный. Для ее решения приме­няют методы корреляционного и регрессионного анализа.

Задачи корреляционного анализа сводятся к измерению тесноты из­вестной связи между варьирующими признаками, определению неизвест­ных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.

Задачами регрессионного анализа является выбор типа модели (формы связи), установление степени влияния независимых переменных на зави­симую и определение расчетных значений зависимой переменной (функ­ции регрессии).

Решение всех этих задач приводит к использованию корреляционно-регрессионного анализа.

Наиболее разработанной в теории статистики является методология так называемой парной корреляции, рассматривающая влияние вариации одного фак­торного признака на результативный признак и представляющая собой од­нофакторный корреляционный и регрессионный анализ.

Важнейшим этапом построения регрессионной модели (уравнения рег­рессии) является установление в анализе исходной информации математи­ческой функции. Регрессионный анализ проводится по количественным признакам. Выбор типа функции может опираться на графический метод, теоретические знания об изучаемом явлении, опыт предыдущих аналогич­ных исследований, или осуществляться эмпирически – перебором и оцен­кой функций разных типов и т.п.

Уравнение парной линейной связи имеет вид:

yt = a0 + a1x, (10.1)

где yt - теоретические значения результативного признака, полученные по уравнению регрессии;

a0, a1 - параметры (коэффициенты) уравнения регрессии.

Параметры уравнения a0 и a1 исчисляют по следующим формулам:

(10.2)

(10.3)

Поскольку а0 является средним значением y в точке x = 0, его экономи­ческая интерпретация часто затруднена или вообще невозможна.

Коэффициент парной линейной регрессии a1 имеет смысл показателя силы связи между вариацией факторного признака и вариацией результа­тивного признака. Уравнение показывает среднее значение изменения ре­зультативного признака при изменении факторного признака на одну еди­ницу его измерения. Знак a1 указывает направление этого измерения. Оп­ределив параметры a0 и a1, и подставив их в уравнение связи, можно определить зна­чения yt, зависящие только от заданного значения х.

Построение регрессионной модели может быть дополнено корреляци­онным анализом.

При линейной форме связи признаков, измеренных в интервальной шкале, применяется показатель тесноты связи – линейный коэффициент корреляции.

(10.4)

Значение линейного коэффициента корреляции принимает значения в интервале от –1 до +1. Отрицательные значения коэффициента указывают на обратную связь, положительные – на прямую связь между признаками.

Чем ближе коэффициент корреляции по модулю к 1, тем теснее связь между признаками, при его равенстве 1 связь – функцио­нальная. В остальных случаях можно пользоваться шкалой Фишера:

Значения коэффи­циента корреляции Характеристика связи между x и y
до 0, 2 практически отсутствует
0, 2 – 0, 4 слабая
0, 4 – 0, 6 умеренная (средняя)
0, 6 – 0, 8 сильная
свыше 0, 8 очень сильная

Квадрат линейного коэффициента корреляции называется линейным коэффициентом детерминации, который характеризует долю объясненной дисперсии в общей дисперсии результативного признака.

Самым простым показателем тесноты связи является коэффициент Фехнера, который учитывает совпадение или несовпадение знаков откло­нений от средних уровней. Значение этого коэффициента по абсолютной величине не превышает 1. Отрицательное значение свидетельствует об об­ратной связи. Однако по коэффициенту Фехнера ничего нельзя сказать о форме связи, кроме того он характеризует только несовпадение знаков от­клонений, а не их величину.

Теснота связи может быть измерена эмпирическим корреляционным отношением на основе аналитической группировки, в этом случае фактор­ный признак может быть любого вида, а результативный только количественным. Для измерения этой связи на основе аналитической группи­ровки следует определить эмпирическое корреляционное отношение

, (10.5)

где – межгрупповая дисперсия результативного признака. Межгрупповая дисперсия определяется по формуле:

, (10.6)

где – среднее значение результативного признака по отдельным группам,

– общее среднее значение результативного признака по всей сово­купности обследованных лиц,

m – численность единиц в каждой группе.

- общая дисперсия результативного признака, определяется по формуле: (10.7)

Корреляционное отношение принимает значения от 0 до 1; направле­ние связи по значению корреляционного отношения определить нельзя, а теснота связи оценивается по шкале Фишера.

Корреляционное отношение в квадрате представляет собой коэффици­ент детерминации, который характеризует долю объясненной дисперсии в общей дисперсии результативного признака.

Если исходные значения признаков можно заменить их рангами, то линейный коэффициент корреляции примет форму коэффициента корре­ляции рангов Спирмэна.

(10.8)

где d – разница между рангами факторного и результативного призна­ков;

n – количество единиц в совокупности.

Коэффициент Спирмэна принимает значения от -1 до +1. Интерпрети­руется также как и парный коэффициент линейной корреляции.

Для оценки тесноты связи между качественными (атрибутивными) признаками используются непара­метрические методы. Здесь речь идет только об установлении наличия связи и измерении ее тесноты. При использовании непараметрических методов строится корреляционная таб­лица (таблица сопряженности), где по строкам следуют упорядоченные значения одного признака, а по столбцам - другого. По данным корреляционной таблицы для из­мерения тесноты связи между признаками используют коэффициенты вза­имной сопряженности Чупрова, Пирсона, Крамера и другие.

Коэффициент Чупрова (10.9)

Коэффициент Пирсона (10.10)

Коэффициент Крамера (10.11)

Где φ 2 – критерий фи-квадрат, исчисляемый по формуле:

(10.12)

mij – количество единиц совокупности, находящихся на пересечении i-той строки и j-того столбца;

Мi, Mj - сумма значений, соответственно по i-той строке и j-тому столбцу;

n, k – количество выделенных групп у признаков, т.е., соответственно количество строк и столбцов.

Коэффициенты взаимной сопряженности принимают значения от 0 до 1. Чем ближе значение к 1, тем теснее связаны между собой анализируе­мые признаки.

Если по каждому из признаков выделено только по две группы (аль­тернативный признак), то взаимную сопряженность признаков можно оце­нить на основе коэффициентов контингенции и ассоциации.

Коэффициент контингенции (10.13)

Для ускорения расчетов коэффициент взаимосвязи альтернативных признаков рассчитывают в форме коэффициента ассоциации:

(10.14)

Где a, b, c, d – количество единиц совокупности, представленных в таблице сопряженности следующим образом:

a b a+b
c d c+d
a+c b+d a+b+c+d

 

РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ

Задача 1.

По группе студентов одной специальности дневной формы обучения известно количество посещенных практических занятий (из 20 возможных в семестре) и балльная оценка (из возможных 100 баллов). Данные представлены в таблице.

Количество практик Количество баллов Количество практик Количество баллов

По результату аналитической группировки оценить тесноту связи ме­жду количеством явок на занятия и набранным количеством баллов с помощью эмпирического корреляционного отношения.

Решение.

Результат аналитической группировки представлен в таблице (см. решение типовой задачи в теме «Сводка и группировка статистических данных»).

Группы по количеству явок на практические занятия Количество человек Среднее количество баллов, полученных за семестр
2 – 6, 5 1, 7
6, 5 – 11 17, 5
11 – 15, 5 41, 2
15, 5 – 20
Итого 42, 6

Для исчисления эмпирического корреляционного отношения необхо­димо определить общую и межгрупповую дисперсии результативного признака. Общую дисперсию считаем по простой формуле, так как данные по полученным баллам не сгруппированы.

Межгрупповую дисперсию вычисляем с учетом численности человек в каждой группе.

 

Эмпирическое корреляционное отношение составит:

Таким образом, по шкале Фишера связь между посещением занятий и количеством полученных баллов очень тесная (свыше 0, 8).

Коэффициент детерминации составляет 0, 812 (подкоренное выраже­ние), т.е. количество полученных баллов на 81, 2% объясняется посещаемостью.

 

 

ЗАДАЧИ ДЛЯ РЕШЕНИЯ

Задача 1.

На основе аналитической группировки, проведенной в задаче 2 темы «Сводка и группировка статистических данных», оценить тесноту связи между факторным и результативным признаками с помощью эмпирического корреляционного отношения.

Задача 2.

Известны распределения сотрудников по заработной плате и полу.

Группы по заработной плате, тыс. руб Кол-во женщин Кол-во мужчин
до 7
7 - 10
10 - 15
15 - 20
свыше 20
Итого

1. Исчислить дисперсию заработной платы по совокупности мужчин, женщин и всех сотрудников (принять во внимание расчеты, проведенные по теме «Средние величины»). Проверить правило сложения дисперсий;

2. Оценить тесноту связи между полом и заработной платой с помощью эмпирического корреляционного отношения.

 

Задача 3.

По регионам Сибирского федерального округа известны следующие данные за 2008 г.

Регионы ВРП на душу населения, тыс. руб Инвестиции в основной капитал на душу населения, тыс. руб
Р. Алтай 90, 23 33, 11
Р. Бурятия 132, 07 25, 18
Р. Тыва 78, 04 12, 72
Р. Хакасия 137, 8 24, 28
Алтайский край 107, 42 17, 5
Забайкальский край 126, 0 35, 63
Красноярский край 256, 13 85, 19
Иркутская обл. 182, 2 42, 09
Кемеровская обл. 204, 04 38, 79
Новосибирская обл. 174, 42 38, 35
Омская обл. 175, 06 29, 82
Томская обл. 242, 8 74, 08

По данным СФО:

1) построить парное линейное уравнение регрессии ВРП от размера инвестиций. Сделать выводы.

2) исчислить парный коэффициент линейной корреляции;

3) исчислить коэффициент Фехнера.

Задача 4.

Из исходных данных задачи 2 темы «Сводка и группировка статистических данных», отобрать совокупность лиц до 55 лет (22 человека), для которых построить парное линейное уравнение регрессии дохода от возраста.

Сделать выводы.

 

Задача 5.

Приводится рейтинг регионов Сибирского федерального округа по производству промышленной продукции и сельскохозяйственной продукции за 2009 г.

  Регионы Производство промышленной продукции Производство продукции сельского хозяйства
Р. Алтай
Р. Бурятия
Р. Тыва
Р. Хакасия
Алтайский край
Забайкальский край
Красноярский край
Иркутская обл.
Кемеровская обл.
Новосибирская обл.
Омская обл.
Томская обл.

Оценить корреляцию рангов с помощью коэффициента Спирмэна. Сделать выводы.

 

Задача 6.

Супруги ранжировали 8 жизненных ценностей по степени предпочтения. Результаты приведены в таблице.

Ценности Ранги жены Ранги мужа
Здоровье
Любовь
Богатство
Свобода
Мудрость
Познание
Развитие
Творчество

Оценить согласованность мнения жены и мужа с помощью коэффициента ранговой корреляции Спирмэна.

Ответ: 0, 95.

 

Задача 7.

В ходе социологического исследования респонденты должны были указать размер своего среднедушевого дохода в месяц и оценить состояние своего здоровья по 10-ти бальной шкале. После сопоставления этих показателей получены следующие результаты.

Размер среднедушевого денежного дохода в месяц, руб Средний балл оценки здоровья
менее 1 прожиточного минимума 3, 4
около прожиточного минимума 5, 6
более 1 прожиточного минимума 6, 1
более 2 прожиточных минимумов 7, 2
более 3 прожиточных минимумов 6, 8

Оценить корреляцию рангов с помощью коэффициентов Спирмэна.

 

Задача 8.

По данным задачи 2 темы «Сводка и группировка статистических данных» построить:

1) таблицу сопряженности образования и пола вида 2× 4;

2) таблицу сопряженности образования и дохода вида 4× 3 (интервалы групп по доходу установить самостоятельно).

Оценить тесноту связи, используя коэффициенты взаимной сопряженности Чупрова, Пирсона и Крамера.

 

 

Задача 9.

В одном из исследований изучалась склонность людей передавать плохие и хорошие новости. На ветровых стеклах автомобилей, припаркованных у почтовых ящиков, были оставлены почтовые открытки с указанием почтового адреса (всего 180 штук), содержащие либо хорошие (нейтральные) либо плохие новости (в качестве плохой новости использовалось, например, сообщение о супружеской неверности второй половины адресата). В процессе исследования подсчитывалось количество отправленных открыток, дошедших до указанного адреса.

Результаты представлены в таблице.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-08-24; Просмотров: 584; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.037 с.)
Главная | Случайная страница | Обратная связь