Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Тема 3. СВОДКА И ГРУППИРОВКА
МЕТОДИЧЕСКИЕ УКАЗАНИЯ Собранный в ходе статистического наблюдения материал представлен в хаотическом порядке и не позволяет судить о сущности исследуемого явления. Для анализа материал необходимо обработать. Сводка представляет собой научную обработку собранного материала. Значение сводки: 1) систематизирует материал; 2) выявляет типические черты, взаимосвязи и взаимозависимости. Элементы сводки: 1) группировка собранного материала; 2) разработка системы показателей для характеристики каждой группы и совокупности в целом; 3) подсчет групповых и общих итогов и размещение их в таблицах. Организация сводки может проводится: - централизованно (когда весь материал обрабатывается в одном центре); - децентрализовано (по этапам). Основу первичной обработки статистической информации составляет группировка – это сведение единиц совокупности в однородные группы по характерному признаку. Значение группировки состоит в том, что она систематизирует материал; обеспечивает отход от случайного к закономерному; устанавливает связи и зависимости. В процессе проведения группировки решаются следующие вопросы: 1) выбор группировочного признака, т.е. того признака по которому образуются группы, его выбор определяется целью и задачами исследования; 2) определение числа групп, которое, в первую очередь, зависит от типа признака: - при группировке по атрибутивному признаку число групп обычно совпадает с числом атрибутов; - по альтернативному признаку – две группы; - при группировке по количественному (вариационному) признаку число групп определяется на основе так называемого формального и неформального подходов. Формальный подход определения числа групп основан на использовании формулы Стерджесса: , где N – количество единиц в совокупности (объем совокупности). Формула Стерджесса применима при достаточно большом объеме совокупности (100 и более единиц) и нормальном распределении группировочного признака. Неформальный подход основан на знаниях и пожеланиях исследователя в зависимости от характера изменчивости признака и от численности совокупности: чем больше численность совокупности и медленнее меняется признак, тем большее количество групп необходимо выделить (обычно выбирается от двух до семи). 3) определение размера групп. Группы могут быть равные и неравные. В том случае, когда явление развивается равномерно целесообразно образовать равные группы. Длина равновеликих интервалов определяется по формуле: (3.1) где - максимальное значение группировочного признака; - минимальное значение группировочного признака; - число групп. Границы интервалов могут быть: - закрытыми, если границы определены точно (например, «от 2 до 6»); - открытыми - в первой группе «до», в последней «свыше» (например, «6 и выше»). 4) выбор системы показателей для характеристики каждой группы, определяется задачами группировки и сводки. 4) выбор системы показателей для характеристики каждой группы. Определяется задачами группировки. Первичной характеристикой статистической совокупности в сгруппированном виде является ряд распределения, т.е. ряд числовых показателей, характеризующий распределение единиц совокупности по конкретному признаку. Ряд распределения состоит из двух элементов: 1) варианта ряда (x) – это значения группировочного признака; 2) частота (вес) (f) – это величина, показывающие, сколько раз повторяется данная варианта. Частоты могут выражаться в удельном весе (%) и тогда их называют частостями. Ряды распределения различают по выражению варианты: атрибутивные, альтернативные, вариационные. В свою очередь вариационные ряды распределения могут быть: дискретные – это ряды, в которых варианты выражены определенным, как правило, целым числом; интервальные – это ряды, в которых значения варианты заданы в интервале. Ряды распределения можно изобразить на графике в виде полигона и гистограммы частот. Дискретные ряды распределения удобнее представлять на полигоне частот, а интервальные на гистограмме частот. Гистограммой распределения называют графическое изображение интервального ряда распределения в виде столбиковой диаграммы (чертежа, наглядно показывающего соотношение между разными величинами). Высота столбика соответствует частоте, основание столбика - величине интервала, если интервалы неравные. Полигон частот представляет собой линейную диаграмму. Существуют различные подходы в классификации группировок. По числу группировочных признаков выделяют: - простые – это группировки, построенные по одному группировочному признаку; - комбинационные – построенные по двум и более признакам. По этапу проведения группировки выделяют: - первичные – это группировки собранного в ходе статистического наблюдения материала (первичного материала); - вторичные – это перегруппировка сгруппированных данных. По решаемым задачам выделяют: - типологические – группировки, которые решают задачу выделения социально-экономических типов (например, по источнику средств существования, по формам собственности и т.п.); - структурные – решают задачу изучения состава совокупности по тем или иным признакам (например, изучение дифференциации населения по доходам); - аналитические – помогают установить связи и зависимости (например, между уровнем дохода и удельным весом расходов на питание). Аналитическую группировку можно представить на графике, в виде линейной или столбиковой диаграммы, где по оси x отображаются значения факторного признака, а по оси y значения результативного признака. РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ Задача 1. По группе студентов одной специальности дневной формы обучения известно количество посещенных практических занятий (из 20 возможных в семестре) и балльная оценка (из возможных 100 баллов). Данные представлены в таблице.
На основе имеющихся данных: 1. построить интервальный ряд распределения, выделив 4 группы с равными интервалами по количеству явок на практические занятия; 2. построить аналитическую группировку для установления взаимосвязи между количеством явок на занятия и количеством баллов. Решение. 1. Для построения интервального вариационного ряда с равными интервалами, прежде всего, необходимо определить длину равного интервала, используя соответствующую формулу: Где 20 – максимальное количество явок на практики в течении семестра; 2 –минимальное. Сформируем интервалы групп: 1 группа: 2 – 6, 5 (исчисляется как 2+4, 5=6, 5) 2 группа: 6, 5 – 11 3 группа: 11 – 15, 5 4 группа: 15, 5 – 20 Подсчитаем, сколько человек попадает в каждую группу: 1 группа: в интервал от 2 до 6 (включительно) явок попадает 3 человека: 3-й, 5-й и 7-й по порядку из списка; 2 группа: в интервал от 7 (включительно) до 10 (включительно) явок попадает 6 человек: 9-й, 13-й, 14-й, 17-й, 21-й, 27-й по порядку из списка; 3 группа: в интервал от 11 до 15 явок попадает 12 человек: 1-й, 4-й, 8-й, 11-й, 16-й, 18-й, 19-й, 23-й, 25-й, 26-й, 28-й, 29-й по порядку из списка; 4 группа: в интервал от 16 до 20 явок попадает 9 человек: 2-й, 6-й, 19-й, 12-й, 15-й, 20-й, 22-й, 24-й, 30-й по порядку из списка. Результаты группировки представим в таблице:
По результатам группировки видно, что наибольшее число студентов из группы посетило около трети от всех практических занятий в семестре. Удельный вес исчисляется деление численности человек отдельной группы на общую численность человек, например, по первой группе: 3: 30=0, 1*100=10%. 2. Методика проведения аналитической группировки предполагает группировку единиц совокупности по факторному признаку и исчисление средних показателей результативного признака. В нашем примере факторный признак – количество явок на практики, результативный – количество баллов. Используя группировку, проведенную в первом пункте, рассчитаем средний балл по каждой группе: 1 группа: 1, 7 (исчисляем по данным исходной таблицы как простую среднюю: суммируем баллы по студентам, попавшим в первую группу, и делим на их численность, т.е. 1+2+2=5; 5: 3=1, 7) 2 группа: 17, 5 = (16+24+14+15+14+22): 6; 3 группа: 41, 2 = (28+45+41+50+43+53+43+49+44+34+20+44): 12; 4 группа: 75 = (85+78+73+82+97+47+88+87+38): 9; по всей студенческой группе: 42, 6 = (5+105+494+675): 30. Результаты группировки представим в таблице (см. на следующей стр.) В результате проведенной группировки явно видно, что между количеством явок на занятия и итоговой оценкой, имеется прямая связь, т.е., в среднем итоговые баллы тем выше, чем чаще студенты посещали занятия.
ЗАДАЧИ ДЛЯ РЕШЕНИЯ
Задача 1. Имеются следующие данные о числе членов семьи в 50 обследованных семьях: 3 4 5 4 3 1 2 5 5 3 4 3 1 6 3 4 2 3 1 5 3 4 4 3 6 2 1 4 3 4 3 5 2 3 4 5 3 5 2 3 4 6 7 2 3 4 1 3 5 4 Построить дискретный вариационный ряд распределения. Указать элементы ряда распределения, сделать выводы.
Задача 2. Имеются следующие сведения по данным обследования 30 лиц, ведущим самостоятельное хозяйство (одиночки). Используя имеющуюся информацию: 1. указать виды исследуемых признаков; 2. построить ряды распределения: альтернативный, атрибутивный, вариационно-интервальный с равными и неравными интервалами (группировочные признаки и количество групп выбирать по собственному желанию); частоты распределений представить в абсолютном и относительном видах; 3. ряды распределения представить на графике в виде полигона или гистограммы; 4. провести аналитическую группировку (факторный и результативный признаки выбрать самостоятельно), зависимость между признаками отразить на графике; 5. построить комбинационную группировку по половозрастному признаку; с помощью аналитической группировки проанализировать его зависимость с доходами. Результаты интерпретировать.
Задача 3. Имеются следующие данные по 24 предприятиям
С целью изучения зависимости выпуска продукции от размера основных фондов провести группировку предприятий по стоимости основных фондов, выделив 4 группы с равными интервалами. Для каждой группы и всей совокупности определить: 1) число предприятий; 2) размер основных фондов (всего и в среднем на предприятие); 3) численность рабочих (всего и в среднем на предприятие). Полученные результаты представить в таблице. Сделать выводы.
Задача 4. Известны данные о распределении промышленных предприятий двух областей:
С целью приведения данных к сопоставимому виду провести вторичную группировку в трех вариантах, пересчитав данные: 1) второй области в соответствии с группировкой первой области; 2) первой области в соответствии с группировкой второй области; 3) обеих областей на основе следующей группировки: до 100; 100-500; 500-1000; 1000-5000; свыше 5000.
ПРИМЕРЫ ТЕСТОВЫХ ЗАДАНИЙ
Задание 1. Известны следующие данные о численности рабочих 15 предприятий: 210, 218, 240; 300, 318, 80, 218, 210, 240, 300, 318, 240, 200, 210, 280. При проведении группировки с образованием четырех групп с равновеликим интервалом, его величина будет равна: 1) 218; 2) 40; 3) 29, 5; 4) 60.
Задание 2. Статистической группировкой называется: 1) расчленение совокупности на группы и подгруппы по определенным признакам; 2) собирание статистических данных по определенным объектам, группам.
Задание 3. Имеются ряды, характеризующие: 1) распределение студентов по специальностям, 2) распределение населения по общественным группам; 3) распределение СМИ по выручке от рекламной деятельности. Укажите вариационные ряды распределения.
Задание 4. В распределении населения страны по регионам вариантой является: 1) население; 2) страна; 3) регионы.
Задание 5. Выявление и изучение связи между явлениями проводятся в статистике при помощи группировок: 1) типологических, 2) структурных, 3) аналитических, 4) атрибутивных.
Задание 6. Урожайность сахарной свеклы и количество внесенных удобрений характеризуется следующими данными:
Это группировка: 1) структурная, 2) аналитическая, 3) типологическая, 4) количественная.
Задание 7. Распределение рабочих завода по уровню месячной заработной платы в 2000 г. характеризуется следующими данными:
Это распределение: 1) вариационное; 2) атрибутивное; 3) дискретное; 4) интервальное.
Задание 8. Известны данные о распределении студентов по среднему баллу успеваемости. Вариантами будут являться: 1) балл успеваемости, 2) число студентов.
Задание 9. В распределении регионов по численности студентов вузов частотой является: 1) число регионов, 2) число студентов; 2) наименование регионов.
Во всех тестовых заданиях возможно любое количество правильных ответов (от отсутствия правильного ответа до всех вариантов включительно). Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 1193; Нарушение авторского права страницы