Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Показатели размера и интенсивности вариации
Вторая важнейшая задача при определении общего характера распределения – это оценка степени его однородности. Однородность статистических совокупностей характеризуется величиной вариации (рассеяния) признака, т.е. несовпадением его значений у разных статистических единиц. Для измерения вариации в статистике используются абсолютные и относительные показатели. К абсолютным показателям вариации(показатели размера вариации)относятся: 1. Размах колебаний (вариации) R. (5.8) Размах вариации характеризует только крайние значения признака. Он часто используется в практической деятельности, например, различие между max и min пенсией, заработной платой в различных отраслях и т.д. 2. Среднее линейное отклонение . Среднее линейное отклонениепредставляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической. Этот показатель рассчитывается по формулам простой и взвешенной средней арифметической: (5.9) (5.10) 3. Дисперсия (). Дисперсияпредставляет собой среднюю из квадратов отклонений индивидуальных значений признака (вариант) от их средней величины. В зависимости от исходных данных дисперсия вычисляется по формулам простой и взвешенной средней арифметической: (5.11) (5.12) На дисперсии основаны почти все методы математической статистики. Ее можно рассчитать, пользуясь формулой квадратов: (5.13) В этом случае дисперсия определяется как разница между средней из квадратов индивидуальных значений признаков и квадратом среднего значения признака. Дисперсия имеет ряд свойств, к которым относятся: 1) Дисперсия постоянной равна нулю. 2) Уменьшение всех вариант на одно и то же число не приводит к изменению дисперсии. 3) Уменьшение всех вариант в k раз приводит к уменьшению дисперсии в k2 раз. Размерность дисперсии соответствует квадрату размерности исследуемого признака, поэтому данный показатель не имеет экономической интерпретации. Для сохранения экономического смысла рассчитывается ещё один показатель вариации – среднее квадратическое отклонение. 4. Среднее квадратическое отклонение (СКО): (5.14) Среднее квадратическое отклонение используется для оценки надежности средней: чем меньше σ, тем надежнее, тем лучше средняя представляет исследуемую совокупность. Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются именованными величинами и имеют такую же размерность и наименование, как и исследуемый признак. Относительные показатели вариации (показатели интенсивность вариации)предназначены для оценки и сравнения вариации нескольких признаков по одной совокупности или же вариации одного и того же признака по нескольким совокупностям. Базой для их исчисления является среднее значение признака. 1) Коэффициент относительного размаха вариации (коэффициент осцилляции) показывает, сколько процентов составляет размах вариации от среднего значения признака. (5.15) 2) Относительное линейное отклонение показывает, сколько процентов составляет среднее линейное отклонение от среднего значения признака. (5.16) 3) Коэффициент вариации является самым распространенным относительным показателем вариации. (5.17) Во-первых, с его помощью сравнивают интенсивность вариации для двух и более рядов распределения. Чем меньше коэффициент вариации, тем меньше интенсивность вариации, тем ряд устойчивее. Во-вторых, делают вывод о количественной однородности или неоднородности совокупности. Если распределение одновершинное и коэффициент вариации не превышает 33 %, то совокупность считается однородной и возможно ее дальнейшее исследование. Для характеристики совокупности используют и. Если коэффициент вариации больше 33 %, то совокупность неоднородна и необходимо выяснить причины этой неоднородности. Среднее значение признака для такой совокупности фиктивно. Наряду с оценкой вариации количественных признаков часто встает задача оценки вариации качественных альтернативных признаков. Например: годная и бракованная продукция, успевающие и не успевающие студенты. Эквивалентом наличия исследуемого качественного признака является единица, а отсутствия – ноль. Долю единиц, обладающих исследуемым признаком, обозначают p, а не обладающих – q. Соответственно сумма долей дает единицу. Построим ряд распределения качественного альтернативного признака, учитывая введенные обозначения и параметры (табл. 5.4): Таблица 5.4 Ряд распределения качественного альтернативного признака
Найдем среднее арифметическое значение для этого параметра: = w . (5.18) Как видно, среднее значение при исследовании качественного альтернативного признака совпадает с долей единиц, обладающих этим признаком. Найдем значение дисперсии: (5.19) Дисперсия при исследовании качественного альтернативного признака рассчитывается как произведение доли единиц, обладающих этим признаком, на долю единиц им не обладающих. Отсюда среднее квадратическое отклонение: σ =. Тогда коэффициент вариации может быть посчитан по формуле: % = % (5.20)
Внутригрупповая и межгрупповая вариации
По результатам аналитической группировки можно рассчитать не только общую дисперсию, но еще и внутригрупповую и межгрупповую дисперсии. Общая дисперсия характеризует колеблемость или вариацию исследуемого признака, возникающую под влиянием всех возможных факторных признаков. Для признака xi она рассчитывается по формуле (5.12), а для доли – по формуле (5.19). Внутригрупповая дисперсия рассчитывается по формуле: , (5.21) где – это среднее значение признака в i группе. Для доли: (5.22) Внутригрупповая дисперсия измеряет вариацию признака внутри каждой группы, вызванную влиянием всех факторов, кроме группировочного. По совокупности в целом вариация значений признака, вызванная влиянием всех факторов кроме групировочного, характеризуется средней из внутригрупповых дисперсий: (5.23) Межгрупповая дисперсия рассчитывается по формуле: (5.24) Для доли: (5.25) Эта дисперсия характеризует вариацию исследуемого признака, вызванную влиянием факторного признака, положенного в основание группировки. Между тремя видами дисперсий существует связь, которая называется правилом сложения дисперсий: (5.26) Зная два любых значения, можно всегда найти третье. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияет на вариацию исследуемого признака вариация признака, положенного в основание группировки. Оценка вклада выполняется с помощью двух коэффициентов: 1) Эмпирический коэффициент детерминации: (5.27) Данный коэффициент показывает, какая часть вариации исследуемого признака вызвана вариацией признака, положенного в основании группировки. 2) Эмпирическое корреляционное отношение: (5.28) Эмпирическое корреляционное отношение характеризует тесноту связи между вариацией исследуемого признака и вариацией группировочного признака. Значение изменения: 0≤ ≤ 1. Чем ближе к 1, тем теснее связь между признаками. =1, при и. Связь функциональная. В этом случае изменение исследуемого признака происходит только под воздействием группировочного признака, а влияние прочих факторов отсутствует. =0, при и. В этом случае на изменение исследуемого признака влияет изменение всех прочих факторных признаков, кроме группировочного.
Моменты распределения
Момент распределения – это средняя арифметическая тех или иных степеней отклонений индивидуальных значений признака от определенной величины. В общем виде можно записать: , (5.29) где A – величина, от которой рассчитывают отклонение; α – степень отклонения, определяющая порядок момента. В зависимости от того, какая величина принята за А, различают три вида моментов распределения: 1) А=0 – начальные моменты. (5.30) 2) А= – центральные моменты. (5.31) 3) А=А – условные моменты (). (5.32) В зависимости от величины α в статистической практике используют моменты 1, 2, 3, 4 порядка, которые представлены в таблице 5.5: Таблица 5.5 Моменты распределения
Рассмотрев представленные формулы, мы видим: 1. Начальный момент первого порядка совпадает со средней арифметической и может использоваться для характеристики центра распределения. 2. Центральный момент первого порядка всегда равен нулю, в соответствии с нулевым свойством средней арифметической. 3. Центральный момент второго порядка совпадает со значением дисперсии и используется для оценки степени колеблемости признака. 4. Центральный момент третьего порядка для симметричного распределения равен нулю. Его используют при определении показателя асимметрии. 5. Центральный момент четвертого порядка используется при расчете показателя, характеризующего выпад вершины распределения. Его называют показатель эксцесса. Начальные моменты 2, 3, 4 порядка, а также условные моменты самостоятельного значения не имеют, а могут использоваться для упрощения вычислений. Например: =.
Популярное:
|
Последнее изменение этой страницы: 2017-03-11; Просмотров: 890; Нарушение авторского права страницы