Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
ТЕМА 6. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВАРИАЦИИ
1. Понятие вариации и построение вариационных рядов. 2. Показатели центра распределения. 3. Показатели размера и интенсивности вариации. 4. Показатели формы распределения.
Природа социально-экономических явлений такова, что они обладают свойством изменчивости. Это и обусловливает необходимость в проведении статистического анализа. Если бы данные не изменялись, то не было бы необходимости собирать, обобщать и анализировать данные о множестве явлений, т.е., проще говоря, применять статистические методы. Там, где присутствует изменчивость данных, существует и риск, поскольку невозможно предугадать, что произойдет в будущем. Для того чтобы управлять риском, необходимо уметь измерять изменчивость, или вариацию. Вариацией называется различие значений признака у разных единиц совокупности в один и тот же период или момент времени. Первым этапом изучения вариации является построение вариационного ряда — упорядоченного распределения единиц совокупности по возрастающим или убывающим значениям признака и подсчет числа единиц с тем или иным значением. Вариационный ряд — это ряд распределения, построенный по количественному признаку. Ряд распределения, построенный по атрибутивному признаку, называется атрибутивным. Существуют три формы вариационного ряда: ранжированный, дискретный и интервальный. Ранжированный ряд — это перечень единиц совокупности в порядке возрастания (убывания) значений изучаемого признака. Например, список предприятий, расположенных в порядке возрастания уровня рентабельности каждого предприятия. Дискретный вариационный ряд — это таблица, состоящая из двух строк или граф: конкретных значений признака и числа единиц совокупности, имеющих то или иное значение. Например, распределение студентов группы по результатам экзамена:
Интервальный вариационный ряд — это таблица, состоящая из двух строк или граф: интервалов значений признака и числа единиц совокупности, попадающих в данный интервал (частот). Например, распределение предприятий по числу работников:
На графике дискретный вариационный ряд изображается в виде полигона распределения, а интервальный — в виде гистограммы (столбиковой диаграммы). Для характеристики среднего значения признака в вариационном ряду используются показатели центра распределения, к которым, кроме средней арифметической величины, относятся мода и медиана. Также существуют другие показатели, характеризующие структуру вариационного ряда. Мода — значение признака, наиболее часто встречающееся в исследуемой совокупности. Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой. Для интервальных вариационных рядов мода определяется по формуле: где хмо— нижняя граница значения интервала, содержащего моду; iмо— величина модального интервала; fмо— частота модального интервала, т.е. интервала, имеющего наибольшую частоту; fмо-1 — частота интервала, предшествующего модальному, fмо+1 — частота интервала, следующего за модальным. Медиана — значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности, делящее ее на две равные части. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда. Медиана интервального ряда распределения определяется по формуле где xMе — нижняя граница значения интервала, содержащего медиану; iМе— величина медианного интервала; ∑ f — сумма частот; SМе-1 — сумма накопленных частот, предшествующих медианному интервалу; fМе — частота медианного интервала. Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Например, можно найти значение признака у единиц, делящих ряд на четыре равные части, десять или сто частей. Эти величины называются квартили, децили и перцентили. Остановимся на расчете показателей децилей, нашедших широкое применение в анализе дифференциации различных социально-экономических явлений. Общая схема расчета децилей следующая: 1) поскольку децили отсекают десятые части совокупности, по накопленным частостям определяют интервалы, куда попадают порядковые номера децилей: для первой децили — интервал, где находится вариант, отсекающий 10 % совокупности с наименьшими значениями признака; для второй — 20 % и т. д.; для девятой децили — интервал, содержащий вариант, отсекающий 90 % с наименьшими значениями, или, что то же самое, 10 % с наибольшими значениями признака; 2) рассчитывают величину децилей по формулам, аналогичным формуле для нахождения медианы. Например, первая и девятая децили находятся по формулам: где — начала интервалов, где находятся первая и девятая децили; — величины интервалов, где находятся первая и девятая децили; — общая сумма частот (частостей); — суммы частот (частостей), накопленных в интервалах, предшествующих интервалам, в которых находятся первая и девятая децили; — частоты (частости) интервалов, содержащих первую и девятую децили. Соотношение децильных доходов в социальной статистике получило название коэффициента децильной дифференциации доходов населения (КD): Основной характеристикой центра распределения является средняя арифметическая величина, опирающаяся на всю информацию об изучаемой совокупности единиц. Однако в ряде случаев средняя арифметическая должна быть дополнена или заменена модальным значением или медианой. Медиана не зависит от значений, расположенных по обе стороны от нее, поэтому ее значение лучше использовать в рядах распределения с расплывчатыми концами или в рядах распределения, в которых имеются чрезмерно малые или большие значения (выбросы). Мода используется при изучении спроса населения, когда интерес представляет определение модального размера (или модели), т.е. пользующегося наибольшим спросом. В симметричных рядах распределения все названные показатели равноправны, поскольку = Ме = Мо, но предпочтение отдается средней арифметической. Для асимметричных рядов распределения медиана часто является предпочтительной характеристикой центра распределения, поскольку занимает положение между средней арифметической и модой. Не меньшее значение, чем характеристики центра распределения, имеют показатели, характеризующие степень рассеивания значений признака вокруг средней величины. Размах вариации (R) является наиболее простым измерителем вариации признака: где — наибольшее значение варьирующего признака; — наименьшее значение признака. Среднее линейное отклонение (d) представляет собой среднюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения: — невзвешенное среднее линейное отклонение; — взвешенное среднее линейное отклонение, где — i-й вариант осредняемого признака, — вес i-го варианта. Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной: — невзвешенная; — взвешенная. Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней величины: — невзвешенное; — взвешенное. Среднее квадратическое отклонение — величина именованная, имеет размерность осредняемого признака. Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха, или среднего линейного отклонения, или среднего квадратического отклонения к средней арифметической. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному). Различают следующие относительные показатели вариации: - коэффициент осцилляции: - линейный коэффициент вариации: - коэффициент вариации: Показатели асимметрии и эксцесса. Степень асимметрии может быть определена с помощью коэффициента асимметрии (Аs): где — средняя арифметическая ряда распределения; — мода; — среднее квадратическое отклонение. При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. Если Аs > 0, то больше моды, следовательно, имеется правосторонняя асимметрия. Если As < 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3. В практических расчетах часто в качестве показателя асимметрии применяется отношение центрального момента третьего порядка к среднему квадратическому отклонению данного ряда в кубе, т.е. Это дает возможность определить не только величину асимметрии, но и проверить наличие асимметрии в генеральной совокупности. Принято считать, что асимметрия выше 0, 5 (независимо от знака) считается значительной. Асимметрия меньше 0, 25 — незначительная. Для симметричных распределений может быть также рассчитан показатель эксцесса, характеризующий крутизну распределения: где — центральный момент четвертого порядка. При симметричном распределении = 0. Если > 0, распределение является островершинным; если < 0 — плосковершинным.
Контрольные вопросы 1. Что такое вариация и каковы этапы ее статистического изучения? 2. Какие виды графиков применяются для изображения вариационного ряда? 3. Какими показателями характеризуется центр распределения? 4. Как определить моду и медиану в интервальном ряду? 5. С помощью каких показателей можно оценить размеры вариации? 6. Для чего вычисляются относительные показатели вариации? 7. Каким по знаку будет значение коэффициента при наличии левосторонней асимметрии? 8. Что характеризует эксцесс распределения? 9. В чем состоит правило сложения дисперсий?
Задачи 6.1. Распределение студентов одного из факультетов по возрасту характеризуется следующими данными:
Вычислите: а) размах вариации; б) среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; д) относительные показатели вариации возраста студентов, е) моду; ж) медиану распределения студентов по возрасту. 6.2. По данным задачи 5.1 для всего населения рассчитайте: а) моду и медиану распределения безработных по продолжительности безработицы; б) показатели вариации продолжительности безработицы; в) асимметрию распределения. Постройте график распределения и сделайте выводы об однородности и симметричности распределения. 6.3. По данным задачи 5.2 для всего населения рассчитайте: а) моду и медиану распределения работников по возрасту; б) показатели вариации возраста работников; в) асимметрию распределения. Постройте график распределения и сделайте выводы об однородности и симметричности распределения. 6.4. По данным задачи 5.3 для всего населения рассчитайте: а) моду и медиану распределения безработных по возрасту; б) показатели вариации возраста безработных; в) асимметрию распределения. Постройте график распределения и сделайте выводы об однородности и симметричности распределения. 6.5. По данным задачи 5.4 по Гродненской области и Республике Беларусь рассчитайте: а) моду и медиану распределения населения по размеру располагаемых ресурсов на душу населения; б) показатели вариации размера располагаемых ресурсов. Постройте графики распределения и сравните однородность распределения населения по размеру располагаемых ресурсов в Гродненской области и Республике Беларусь. 6.6. По данным задачи 5.6 по городскому и сельскому населению Республики Беларусь рассчитайте: а) моду и медиану распределения населения по размеру располагаемых ресурсов на душу населения; б) показатели вариации размера располагаемых ресурсов. Постройте графики распределения и сравните однородность распределения городского и сельского населения по размеру располагаемых ресурсов в Республике Беларусь. 6.7. По данным задачи 5.7 по Гродненской области и Республике Беларусь рассчитайте: а) моду и медиану распределения предприятий по среднесписочной численности ППП; б) показатели вариации среднесписочной численности ППП. Постройте графики распределения и сравните однородность распределения предприятий по среднесписочной численности ППП в Гродненской области и Республике Беларусь. 6.8. По данным задачи 5.8 по Гродненской области и Республике Беларусь рассчитайте: а) моду и медиану распределения предприятий по объему продукции; б) показатели вариации объема продукции. Постройте графики распределения и сравните однородность распределения предприятий по объему продукции в Гродненской области и Республике Беларусь. 6.9. По данным задачи 5.9 по стройорганизациям государственной и частной форм собственности Гродненской области рассчитайте: а) моду и медиану распределения стройорганизаций по численности работников; б) показатели вариации численности работников. Постройте графики распределения и сравните однородность распределения стройорганизаций государственной и частной форм собственности по численности работников. 6.10. По данным задачи 5.10 по стройорганизациям государственной и частной форм собственности Беларуси рассчитайте: а) моду и медиану распределения стройорганизаций по численности работников; б) показатели вариации численности работников. Постройте графики распределения и сравните однородность распределения стройорганизаций государственной и частной форм собственности по численности работников. 6.11. По данным задачи 5.11 о стаже работы двух категорий работников (рабочих и служащих) рассчитайте: а) моду и медиану распределения рабочих и служащих по стажу работы; б) показатели вариации стажа работы. Постройте графики распределения и сравните однородность распределения работников по стажу работы. 6.12. Определите медиану, используя следующие данные о нормах выработки семи работников (изделие А, шт.): 20, 18, 19, 22, 24, 16, 21.
|
Последнее изменение этой страницы: 2017-03-15; Просмотров: 439; Нарушение авторского права страницы