Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ
В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных собирают не для того, чтобы получить характеристики каждого отдельного элемента совокупности, а для того, чтобы получить характеристики совокупности в целом. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения. В статистической практике этот этап статистического исследования называют группировкой. Группировка представляет собой разбиение совокупности на группы, однородные по какому-либо признаку. Группировка основывается на группировочном признаке и интервале, который представляет собой промежуток между минимальным и максимальным значением признака в группе. Интервалы могут быть равными и неравными, открытыми и закрытыми. Под закрытым интервалом понимают интервал, имеющий как нижнюю, так и верхнюю границу, например (100; 200)). Под открытым интервалом понимают интервал, одна из границ которого равна (например, свыше 500). При определении числа групп и величины интервалов следует иметь в виду, что число объектов в выделенных группах должно быть достаточным, чтобы характеристики, рассчитанные для отдельных групп, были статистически достоверными.
Существуют рекомендации по выбору числа групп k:
Число групп также можно определить по формуле
Наличие равных интервалов облегчает вычисление различных статистических характеристик. Величина интервала вычисляется по формуле , где xmax − максимальное значение признака в исследуемой совокупности; xmin − минимальное значение признака в исследуемой совокупности. Затем определяются границы каждого интервала: для первого интервала: от xmin до xmin +D; для второго интервала: от xmin+D до xmin +2D; …………. для k-го интервала: от xmin+(k-1)D до xmax.
Существуют 4 типа группировок: типологическая, структурная, аналитическая и комбинационная. Типологическая группировка служит для исследования распределения совокупности по какому-либо одному качественному признаку (цвет, тип упаковки товара и т.п.). Структурная группировка служит для исследования распределения совокупности по одному количественному признаку. Ее результаты представляются в виде таблицы
Аналитическая группировка служит для выявления зависимости между признаками. При этом выделяют признак-фактор и признак-результат. Группировка осуществляется по признаку-фактору. В каждой группе рассчитывается среднее значение признака-результата. Анализируя изменение средних значений признака-результата от группы к группе, можно сделать вывод о наличии или отсутствии взаимосвязи между признаками. Различие групповых средних позволяет утверждать, что признаки взаимозависимы. Если изменение величины признака-фактора в определенном направлении вызывает изменение признака-результата в том же направлении, то говорят, что связь положительная, а в противном случае − отрицательная. Результаты аналитической группировки представляются в виде таблицы
Проследить зависимость между признаками можно также на основе комбинационной группировки, которая осуществляется одновременно по двум признакам.
Здесь ni j− количество случаев совместного появления i-й градации признака-фактора (i = 1, …, k) и j-й градации признака-результата (j = 1, …, m). Если наибольшие числа каждой строки и каждого столбца располагаются вдоль " главной диагонали" таблицы, то можно сделать вывод, что связь положительная и близкая к линейной. Если наибольшие числа располагаются вдоль другой диагонали таблицы, то можно сделать вывод, что связь отрицательная и близкая к линейной. Если числа во всех клетках примерно одинаковые, то связи между признаками нет.
Пример 1. Собраны данные о численности работников на 30 предприятиях сферы торговли.
Провести структурную группировку этих предприятий по признаку численности работников. В данной ситуации признак принимает ограниченное число целых значений. Поэтому нет необходимости вводить интервалы, а просто подсчитать количество предприятий, где число работников равно 10, 11, 12 и т.д. Например, только одно предприятие имеет 10 работников, а 11 работников имеется на 3-х предприятиях. Результаты таких расчетов приведены в таблице
Пример 2. Имеются данные о средней недельной заработной плате на 30 предприятиях (тыс. руб.)
Заметим, что максимальная заработная плата (xmax) равна 11, 8 т.р., а минимальная (xmin) равна 5, 6 т.р. В соответствии с приведенными выше рекомендациями выберем число групп (k) равным 5. Тогда Рассчитаем границы всех интервалов. Для первого интервала: от 5, 6 до 5, 6+1, 24=6, 84 Для второго интервала: от 6, 84 до 6, 84+1, 24=8, 08 Для третьего интервала: от 8, 08 до 8, 08+1, 24=9, 32 Для четвертого интервала: от 9, 32 до 9, 32+1, 24=10, 56 Для пятого интервала: от 10, 56 до 10, 56+1, 24=11, 8 В первый интервал (от 5, 6 до 6, 84) попадают предприятия с номерами 3, 6, 7, 8, 12, 16, 22 (всего 7 предприятий). Проделывая аналогичные расчеты для других интервалов, окончательно получим результаты, приведенные в таблице.
Пример 3. В таблице приведены данные о численности работников и объемах выпуска продукции на 1 человека по 16 предприятиям.
Выполним аналитическую группировку, считая число работников признаком - фактором, а объем выпуска продукции – признаком - результатом. Зададим число групп (k), равным 3. Заметим, что Тогда Рассчитаем границы интервалов. Для первого интервала: от 365 до 365+3072=3437 Для второго интервала: от 3437 до 3437+3072=6509 Для третьего интервала: от 6509 до 6509+3072=9581 Заметим, что в первый интервал попадут предприятия с номерами 1, 2, 3, 4, 5, 9, 10, 11, 12, 13, 14 (всего 11 предприятий). Рассчитаем по этим предприятиям среднее значение признака - результата
Во второй интервал попадут предприятия с номерами 8, 15, 16 (всего 3 предприятия). Среднее значение признака – результата для этих предприятий составит
В третий интервал попадут предприятия с номерами 6 и 7. Среднее значение признака – результата для этих предприятий составит
Полученные результаты расчетов сведены в таблицу аналитической группировки
Анализ полученных результатов показывает, что среднее значение объема выпуска продукции на 1 человека устойчиво растет от группы к группе, а следовательно между количеством работников и объемом выпуска продукции на 1 человека имеется положительная связь. Для проведения комбинационной группировки рассчитаем интервалы для признака – результата. Зададим число групп (m), равным 3. Заметим, что . Тогда
Рассчитаем границы интервалов. Для первого интервала: от 31, 8 до 31, 8+22, 1=53, 9 Для второго интервала: от 53, 9 до 53, 9+22, 1=76, 0 Для третьего интервала: от 76, 0 до 98, 0 Результаты комбинационной группировки представлены в таблице
Из данной таблицы видно, что наибольшие значения каждого столбца и каждой строки лежат на главной диагонали. Поэтому можно сделать вывод о положительной связи между численностью работников предприятия и объемом выпуска продукции на 1 работника.
Задание 1 В табл. 1 приведены 5 показателей деятельности торговых предприятий. В соответствии с таблицей выберите номера 2-х показателей
На основании имеющихся данных выполнить: 1. Структурную группировку по первому и второму показателям, приняв число групп, равным 5. 2. Аналитическую группировку, считая первый показатель признаком-фактором, а второй – признаком-результатом. 3. Комбинационную группировку при числе групп по обоим признакам, равным 3.
Т а б л и ц а 1 Показатели деятельности торговых предприятий за год
Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 856; Нарушение авторского права страницы