Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Группировка статистических данных и ее роль в анализе информации
Однимиз основных наиболее распространенных методов обработки и анализа первичной статистической информации является группировка. Под группировкой понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения структуры и взаимосвязей. Следовательно, с помощью группировок решаются три задачи: - разделение всей совокупности на качественно однородные группы - выделение социально-экономических типов. Эти группировки называются типологическими (например, группировки хозяйственных объектов по формам собственности, населения по общественным группам и др.); - характеристика структуры явления и структурных сдвигов. Эти группировки называются структурными (например, определение значения каждого вида транспорта в транспортном балансе страны, изучение состава населения по полу, возрасту и другим признакам и т.д.); - изучение взаимосвязей между отдельными признаками изучаемого явления. Такие группировки называются аналитическими (например, группировка предприятий определенной отрасли экономики по уровню производительности труда для выявления ее влияния на себестоимость продукции). Разграничение трех видов группировки является в известной мере условным. Во многих случаях одна и та же группировка дает возможность решать все три задачи. Признак, на основе которого производится подразделение единиц наблюдения на группы, называется группировочным признаком или основанием группировки. Группировка может выполняться по одному признаку (простая группировка) и по нескольким признакам (комбинированная группировка). Группировочные признаки могут быть атрибутивными и количественными. Атрибутивные признаки регистрируются в виде текстовой записи (например, профессия рабочих, социальная группа населения). Количественные признаки имеют цифровое выражение (стаж работы, размер дохода). При группировке по атрибутивному признаку число групп определяется количеством соответствующих наименований, если число этих наименований не очень велико. Если признак имеет большое количество разновидностей, то при группировке ряд наименований объединяют в одну группу. Для обоснованного объединения их в группы разрабатываются классификации. В отличие от группировок при классификации группировочные признаки установлены заранее на длительный период для решения многих задач, в то время как группировки выполняются для целей конкретного исследования. Примерами могут служить классификации отраслей экономики, автотранспортных предприятий по целевому назначению (грузовые, автобусные, таксомоторные и др.). При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака и задач исследования. Если количественный признак меняется прерывно (дискретно), т.е. может принимать только некоторые - чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака. При непрерывном изменении признак принимает любые значения (например, стаж работы или возраст рабочих), поэтому группы ограничиваются значениями признака в интервале «от - до». Интервалом называется разница между максимальным и минимальным значениями признака в каждой группе. На практике используются три вида интервалов: равные, неравные (постепенно увеличивающиеся) и специализированные. Равные интервалы используются, если нужно охарактеризовать количественные различия в величине признака внутри групп одинакового качества (например, при группировке рабочих определенной профессии по проценту выполнения норм выработки). Величина равного интервала исчисляется по формуле
,
где Xmax и Xmin - соответственно наибольшее и наименьшее значения признака в изучаемой совокупности; n - принятое число групп. Для расчета величины интервала по этой формуле необходимо заранее установить число групп (при числе наблюдений более 20 используют 4-5 групп). Возможен и другой способ определения величины интервала, не требующий предварительного установления числа групп. В этом случае используется формула Стерджесса. Выполняя расчет величины интервала по этой формуле, следует знаменатель предварительно округлить до целого числа, поскольку количество групп не может быть дробным. , где n - число наблюдений. Величину интервала обычно округляют до целого (всегда большего) числа, исключение составляют случаи, когда изучаются малейшие колебания признака. Неравные интервалы (постепенно увеличивающиеся) часто применяются в аналитических группировках. В этом случае интервалы выбираются так, чтобы число единиц в образованных группах было достаточно велико (т.е. чтобы группы были приблизительно одинаково заполнены). Специализированные интервалы используются в типологических группировках; границы устанавливаются там, где намечается переход от одного качества к другому. Наметить точки перехода можно только на основе теоретического анализа, используя для выделения типов не отдельные, изолированные признаки, а совокупность признаков, характеризующих различные стороны изучаемого явления. Интервалы группировки могут быть закрытыми и открытыми. Закрытые интервалы - это обычные интервалы, имеющие как нижние (т.е. «от»), так и верхние (т.е. «до») границы. Открытые интервалы - это интервалы, имеющие какую-либо одну границу - верхнюю или нижнюю. Они применяются тогда, когда признак изменяется неравномерно в широких пределах, причем большие (или малые) значения признака встречаются нечасто. Следующей за группировкой ступенью систематизации и обобщения материалов статистического наблюдения является статистическая сводка. Под статистической сводкой в узком смысле слова понимается подсчет числа единиц в подгруппах и группах, выделенных при группировке, и подведение итогов по количественным признакам. Результаты группировки и сводки материалов оформляются в виде статистических таблиц. Над таблицей помещается заголовок, отражающий в сжатой форме ее основное содержание, время и место, к которым относятся изложенные в таблице данные.
Решение типовых задач 1. Имеются следующие данные по заработной плате водителей за сентябрь:
Для выявления зависимости заработной платы водителей от уровня квалификации и процента выполнения норм выработки произвести аналитическую группировку. Интервалы группировки водителей по проценту выполнения норм выработки разработать самостоятельно. На основе выполненной группировки построить комбинационную таблицу. Сформулировать вывод. Решение Для решения задачи необходимо произвести группировку водителей по двум признакам-факторам: сначала - на группы по квалификации, затем внутри каждой группы - на подгруппы по проценту выполнения норм выработки. По проценту выполнения норм выработки принимаются две подгруппы: Результаты группировки представлены во вспомогательной табл. 1.1. На основе вспомогательной таблицы по каждой подгруппе определяют численность и итог признака (общую сумму заработной платы), результаты оформляют в виде комбинационной таблицы (табл. 1.2).
Таблица 1.1 Вспомогательная таблица
Таблица 1.2 Зависимость заработной платы водителей от классификации и процента выполнения норм выработки
Из данных табл. 1.2 следует, что с ростом квалификации водителей и процента выполнения норм выработки увеличивается заработная плата. Так, заработная плата водителей I класса, выполняющих норму выработки на 110% и выше, на 32, 5% превышает заработную плату водителей II класса, выполняющих норму от 100 до 110%.
Популярное:
|
Последнее изменение этой страницы: 2016-03-22; Просмотров: 1521; Нарушение авторского права страницы