Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Понятие и виды структурных характеристик вариационных рядов.



Обычно средней степенной для анализа распределения недостаточно. Структурные средние применяются для первоначального анализа распределения признаков в совокупности. Из множества структурных средних рассмотрим моду, медиану, квартиль, дециль и перцентиль.

Мода

Мода это наиболее часто встречающаяся варианта вариационного ряда.

В ранжированном ряду мода отсутствует.

В дискретном вариационном ряду мода определяется визуально, как значение признака с наибольшей частотой.

 

Таблица 6

       
 
 
   

 


Для определения моды дискретного ряда строится полигон распределения. Расстояние от оси ординат до наивысшей точки графика есть мода

В интервальном ряду мода определяется по формуле:

где - начальное значение интервала, содержащего моду;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота интервала, следующего за модальным.

Если модальный интервал первый или последний, то недостающая частота (предмодальная или послемодальная) берется равной нулю

Рассчитаем моду в интервальной ряду на основе данных таблицы 2.

 

 

 
 

 

 


 

Рисунок 3. Гистограмма распределения

Чаще всего встречаются ряды с одним модальным значением признака. В вариационном ряду может быть одна мода или несколько мод. В последнем случае ряд называется мультимодальный. Наличие двух мод и более свидетельствует о неоднородности рядов распределения.

Медиана

Медиана – это величина варьирующего признака, делящая совокупность на две равные части: со значениями признака меньше медианы и со значениями признака больше медианы, то есть медиана - это варианта, лежащая в середине вариационного ряда и делящая его на две равные части.

Определение медианы в ранжированном ряду:

В ранжированном вариационном ряду с нечетным числом единиц совокупности медианой является значение признака у средней в ряду единицы, т. е. находится та единственная варианта, справа и слева от которой находится одинаковое число вариант:

 
 


Пример:

Таблица 7

Номер фермерского хозяйства Урожайность, ц/га
№ 5
№ 1
№ 3
№ 2
№ 4

Ме = 151 ц/га

То есть, у половины фермерских хозяйств урожайность меньше, чем 151 ц/га, а у половины больше, чем 151 ц/га.

В ранжированном вариационном ряду с четным числом единиц совокупности медианой является расчетное значение средней арифметической простой у двух средних позиций вариационного ряда, то есть находятся две варианты, справа и слева от которых располагается одинаковое количество вариант. Ме равна средней арифметической из двух значений

 

Таблица 8

Номер фермерского хозяйства Урожайность, ц/га
№ 5
№ 1
№ 3
№ 2
№ 4
№ 6

Ме = (151 + 154) / 2 = 152, 5 ц/га

То есть, у половины фермерских хозяйств урожайность меньше, чем 152, 5 ц/га, а у половины больше, чем 152, 5 ц/га.

Определение медианы в дискретном вариационном ряду:

В дискретном вариационном ряду медианой является значение того варианта признака, у которого накопленная частота впервые превышает половину численности совокупности.

Таблица 9

 

= 140/2 = 70;

Для интервального ряда медиана определяется по следующей формуле:

 

где xМе - начало медианного интервала;
hМе - величина медианного интервала;
fМе - частота медианного интервала;
SМе-1 - накопленная частота
предмедианного интервала.

Таблица 10

 

 
 

 

 


Это означает, что у половины рабочих производительность труда меньше 252, 5 м, а у другой половины больше 252, 5м.

Для графического определения медианы последнюю ординату кумуляты делят пополам. Через полученную точку проводят прямую, параллельную оси x до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой представленного на графике распределения.

 

Рисунок 4. Кумулята распределения

Для графического определения медианы по огиве выполняют обратные действия, поскольку в огиве накопленные частоты помещают на оси абсцисс, а значения признака – на оси ординат.

При нормальном симметричном распределении средняя величина совпадает с модой и медианой. Если распределение по форме близко к нормальному, то медиана находится между модой и средней величиной, причем ближе к средней, чем к моде.

В практических расчетах Мо и Ме могут быть величинами, далеко отстоящими друг от друга. Для более четкой фиксации характера распределения используют другие структурные средние: квартили, квинтили, децили и перцинтили.

 

Квартили и квинтили

При значениях признака, делящих совокупность на четыре равные части, рассчитываются квартилем распределения. Они обозначаются Qj с подписным значком номера квартиля.

Q1 1: 3;
Q2 2: 2 (Q2=Ме);
Q3 3: 1.

Первый (нижний) квартиль отсекает от совокупности ¼ часть единиц с минимальными значениями, а третий (верхний) отсекает ¼ часть единиц с максимальными значениями, то есть как бы отбрасывают нетипичные, случайные значения признака. С помощью квартилей определяют границы, где находятся 50% единиц, наиболее характерные для этой совокупности.

Для расчета Q1 (первого квартиля) используется следующая формула:

 

где xQ1 - начало интервала, содержащего 1-й квартиль;
hQ1
- величина интервала, содержащего 1-й квартиль;
SQ1 -1
- накопленная частота предшествующего
интервала;
fQ1
- частота интервала, содержащего Q1.

 

Интервалом, содержащим Q1, является тот интервал, для которого накопленная частота впервые превышает ¼ от суммы частот (табл. 10).

Это означает, что ¼ рабочих имеет производительность труда меньше, чем 234м., а ¾ имеет производительность труда больше.

Для расчета Q3 используется формула:

Все обозначения аналогичны Q1.
Интервалом, содержащим Q3, является тот интервал, для которого накопленная частота впервые превышает ¾ от суммы частот (табл. 10).

 
 

 

 


Таким образом, общая формула расчета квартиля под номером i:

 

 

 


Значения признака, делящий ряд на пять равных частей, называются квинтилями. Их расчет производится аналогично расчету квартилей.

Децили

Децили - это варианты, которые делят ранжированную совокупность на 10 равных частей.

Общая формула для расчета децилей:

 


где xDi - начало интервала, содержащего i-й дециль;
hDi - величина интервала, содержащего i-й дециль;
fDi - частота интервала, содержащего Di;
SDi-1 - накопленная частота предшествующего
интервала.

Интервалом, содержащим Di, является тот интервал, для которого накопленная частота впервые превышает i/10 от суммы частот (табл. 10).

 
 

 


Это означает что, 60% рабочих имеют производительность труда меньше 259, 6м, а 40% - больше.

Практическим примером использования децилей является децильный коэффициент дифференциации населения. Население делится на 10 частей по уровню дохода. Берут первые 10% и последние 10%. Считают, что средний доход последней группы не должен быть больше, чем в 10 раз среднего дохода первой группы. В России официально это превышение составляет 14-16 раз, неофициально – 20 и более раз.

Перцентиль делит ранжированную совокупность на 100 равных частей. Формулы аналогичны формулам медианы, квартиля и дециля

 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-07-13; Просмотров: 2099; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.028 с.)
Главная | Случайная страница | Обратная связь