Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Лекция 3. Сводка и группировка статистических данных



Сводка – научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных, систематизацию, группировку материалов, составление таблиц, получение итогов по группам и в целом. Программа сводки включает определение групп и подгрупп, системы показателей и видов таблиц. По технике и способу выполнения сводка может быть ручной либо механизированной.

Группировка – разбиение совокупности на группы, однородные по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Устойчивое разграничение объектов называется классификацией или стандартом, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Метод группировки основывается на двух категориях – группировочном признаке и интервале.

Группировочный признак – признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Он может носить как количественный, так и качественный характер. В ряде случаев группировка, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.

Интервал очерчивает количественные границы групп и представляет собой промежуток между максимальным и минимальным значениями признака в группе. Интервалы бывают равные, неравные, закрытые (когда имеется верхняя и нижняя граница) и открытые (когда одна из границ отсутствует).

Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования взаимосвязи факторных и результативных признаков. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная и аналитическая.

В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки.

Простая группировка выполняется по одному признаку. Среди простых группировок особо выделяются ряды распределения. Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака применяется один показатель – численность группы.

Возьмем условный пример дискретного ряда распределения студентов заочного отделения по росту:

№ п/п
Рост, см

Данный ряд является ранжированным, так как значения роста упорядочены по возрастанию.

Построим интервальный ряд распределения студентов по росту, для чего необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при дальнейшем анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной (иначе для сопоставимости придется частоты делить на единицу интервала - полученное значение называется плотностью).

Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, то не проявится закономерность вариации; если групп будет чрезмерно много, то случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

или

где k – число групп (округляемое до ближайшего целого числа); N – численность совокупности.

В нашем примере про студентов по формуле Стерждесса определим число групп: k = 1 + 3, 322lg20 = 5, 32. Так как число групп не может быть дробным, то округляем k = 5, 32 до ближайшего целого числа по правилам округлений - 5.

Зная число групп, рассчитывают длину (размах) интервала по формуле:

В нашем примере про студентов h = (184 - 152)/5 = 6, 4 (см). То есть для построения интервального ряда распределения нужно 20 студентов разбить на 5 групп с интервалом по 6, 4 см. Представим интервальный ряд распределения студентов по росту в виде таблицы:

Рост, см 152 - 158, 4 158, 4 - 164, 8 164, 8 - 171, 2 171, 2 - 177, 6 177, 6 - 184 Итого
Число студентов

Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи.

По отношениям между признаками выделяют: иерархические группировки, выполняемые по двум и более признакам, при этом значения второго признака определяются областью значений первого (например, классификация отраслей промышленности по подотраслям); неиерархические группировки, когда строгой зависимости значений второго признака от первого не существует.

По очередности обработки информации группировки бывают первичными, составленные на основе первичных данных, и вторичные, являющиеся результатом перегруппировки ранее уже сгруппированного материала.

В соответствии со временным критерием различают статические группировки, дающие характеристику совокупности на определенный момент или за определенный период, и динамические, показывающие переходы единиц из одних групп в другие.

 

 

5.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-03-22; Просмотров: 1135; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.013 с.)
Главная | Случайная страница | Обратная связь