Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Глава 6. Показатели вариации
Понятие вариации Показатели вариации Правило сложения дисперсий Показатели структуры распределения 6.5. Показатели формы распределения
Понятие вариации Статистическая совокупность содержит однокачественные и в то же время варьирующие единицы в пределах изучаемой закономерности. Поэтому для того чтобы судить о типичности средней, ее следует дополнить показателями, характеризующими вариацию величины изучаемого признака. В этой связи обязательным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации. Термин «вариация» происходит от лат. variatio – изменение, колеблемость, различие. Различают случайную и систематическую вариацию. Средняя величина дает обобщающую характеристику всей совокупности единиц, типический уровень признака, которым обладают все единицы. При этом два ряда распределения, имеющие одинаковую среднюю арифметическую величину , могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака (рис 6.1).
Рис. 6.1. Вариация величины изучаемого признака
Поэтому следует учитывать два обстоятельства: 1) если индивидуальные значения признака мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой свойств совокупности; 2) если ряд распределения характеризуется значительным рассеиванием индивидуальных значении признака , то средняя арифметическая будет ненадежной характеристикой этой совокупности и ее практическое применение будет ограничено. Таким образом, в ряде случаев ряды распределения, построенные по одному и тому же признаку, могут иметь разную степень вариации этого признака при одной и той же величине его среднего уровня. Средняя величина не показывает структуру совокупности. Исследование вариации в статистике имеет большое значение, так как помогает изучить сущность явления. Измерение вариации, выяснение ее причин, выявление влияния отдельных факторов дают важную информацию для принятия обоснованных управленческих решений. Обязательным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации. Показатели вариации
Для измерения вариации признака используются абсолютные и относительные показатели вариации. Показатели вариации рассчитываются для статистических совокупностей, упорядоченных путем группировок, классификаций, построения рядов распределений. Расчет показателей вариации позволяет: 1) дать характеристику отклонения отдельных значений признака от общей средней; 2) оценить однородность статистической совокупности. Для характеристики размера вариации в статистике применяются абсолютные показатели вариации: • размах вариации (R); • среднее линейное отклонение ( ); • дисперсия ; • среднее квадратическое отклонение . Размах вариации R (размах колебаний) - представляет собой разность между максимальным хтax. и минимальным xmin. значениями признака: Размах вариации зависит от величины только крайних значений признака и не отражает его колеблемость внутри совокупности. Для группировок с открытым интервалами (первым и последним), когда неизвестны реальные минимальные и максимальные значения признака, расчет размаха вариации некорректен. Поэтому область его применения ограничена достаточно однородными совокупностями. В частности, на практике он находит применение в предупредительном контроле качества продукции. Более точно характеризуют вариацию признака показатели, основанные на учете колеблемости всех значений признака. Среднее линейное отклонение и среднее квадратическое отклонение показывают, на сколько в среднем отличаются индивидуальные значения признака от его среднего значения. Эти показатели имеют те же единицы измерения, что и варианты признака, и его средняя величина. Порядок расчета показателей различен для несгруппированных и сгруппированных данных. Среднее линейное отклонение ( ) - это средняя арифметическая из абсолютных значений отклонений отдельных вариантов признака от средней арифметической . Для расчета этого показателя применяют следующие формулы: • для несгруппированных данных (простое): где: - индивидуальные значения признака у единицы совокупности; - средняя величина признака в совокупности; n - число единиц совокупности. • для сгруппированных данных (взвешенное): Простое среднее линейное отклонение вычисляется в случае, когда каждый вариант повторяется один раз, а расчет взвешенного среднего линейного отклонения производится на основе вариационного ряда с неравными частотами. В расчетах по указанным формулам отклонения представлены без учета знака. Это объясняется тем, что по свойству средней арифметической сумма отклонений индивидуальных значений признака от средней равна нулю. Поэтому сфера применения среднего линейного отклонения как меры вариации признака ограничена, за исключением тех случаев, когда суммирование показателей без учета знаков имеет экономический смысл. В связи с этим более широкое распространение в качестве показателя степени вариации получило среднее квадратическое отклонение . Дисперсия - это средний квадрат отклонений значений признака от их средней величины. В зависимости от исходных данных, дисперсию можно вычислять по средней арифметической простой или взвешенной. Для ее расчета используют следующие формулы: • для несгруппированных данных (простая): • для сгруппированных данных (взвешенная): Формулу для расчета дисперсии можно преобразовать: Таким образом, дисперсия равна разности средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,
При использовании этой формулы исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от его средней величины. В результате, за счет этого уменьшается ошибка, связанная с округлением значений промежуточных вычислений. Свойства дисперсии Дисперсия обладает рядом свойств, которые позволяют упростить ее вычисления: 1. дисперсия постоянной величины равна нулю; 2. если все варианты значений признака уменьшить на одно и то же число С, то дисперсия не изменится (это означает, что дисперсия не зависит от начала отсчета); 3. если все варианты значений признака уменьшить (увеличить) в к раз, то дисперсия уменьшится (увеличиться) в к2 раз (это означает, что величина дисперсии зависит от масштаба измерения исследуемого признака); 4. Дисперсия алгебраической суммы независимых случайных величин равна сумме их дисперсий: 5. Свойство минимальности дисперсии: , т.е. для любого постоянного числа, не равного средней арифметической, справедливо равенство, Дисперсия не дает представления об однородности совокупности, по ней трудно дать экономическую интерпретацию, так как она рассчитывается в квадратных единицах. Эту проблему можно преодолеть, рассчитав среднее квадратическое отклонение. В ходе расчетов следует помнить, что размах вариации, среднее линейное и среднее квадратическое отклонение являются именованными величинами, т.е. имеют ту же единицу измерения, что и изучаемый признак. Дисперсия единицы измерения не имеет. Среднее квадратическое отклонение является абсолютной мерой вариации и представляет собой корень квадратный из дисперсии: Смысловое содержание этого показателя такое же, как и среднего линейного отклонения: чем меньше его величина, тем однороднее совокупность и тем, соответственно, типичнее средняя величина. Формулы для расчета среднего квадратического отклонения имеют следующий вид: • для несгруппированных данных (простое): • для сгруппированных данных (взвешенное): Величина часто используется в качестве единицы измерения отклонений от средней арифметической. Отклонение, выраженное в , называется нормированным (стандартизованным). Среднее квадратическое отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних. В симметричных распределениях среднее квадратическое отклонение составляет приблизительно 1, 25 среднего линейного отклонения, т.е. или Это соотношение зависит от наличия в совокупности резких отклонений и может служить индикатором «засоренности» совокупности нетипичными, выделяющимися из основной массы единицами. Дисперсия и среднее квадратическое отклонение являются наиболее широко применяемыми показателями вариации. Это объясняется тем, что они входят в большинство теорем теории вероятностей, служащих фундаментом математической статистики. Также дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов на вариацию признака. В последующих главах будет показано, как дисперсия используется для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений и т.д. Квартильное отклонение , где: и - соответственно третий и первый квартиль распределения. Оно применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений. В симметричных или умерено асимметричных распределениях выполняется равенство: Так как на квартальное отклонение не влияют отклонения всех значений признака, то его следует использовать, когда определение среднего квадратического отклонения затруднительно или невозможно. Например, этот показатель может применяться для рядов распределения с открытыми интервалами, где в качестве характеристики центра распределения использовалась медиана. Дисперсия и среднее квадратическое отклонение используются в следующих случаях: § расчеты, связанные с организацией выборочного наблюдения; § оценка полученных на основе выборки статистических показателей; § построение показателей тесноты корреляционной связи. В условиях нормального (симметричного) распределения существует следующая зависимость между величиной среднего квадратического отклонения и количеством наблюдений ( правило «трех сигм»): § в пределах располагается 0, 683 количества наблюдений; § в пределах располагается 0, 954 количества наблюдений; § в пределах располагается 0, 997 количества наблюдений. Отклонение ±3 можно считать максимально возможным. Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака (или медиане). К ним относятся: § Коэффициент осцилляции: § Относительно линейное отклонение: § Относительный показатель квартильной вариации: § Коэффициент вариации: Наиболее часто применяется коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Чем больше величина коэффициента вариации , тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации (табл. 6.1). Таблица 6.1 Шкала определения степени однородности совокупности
Следует заметить, что приведенная выше шкала оценки однородности совокупности достаточно условна. Дело в том, что вопрос о степени интенсивности вариации каждого изучаемого признака должен решаться индивидуально, исходя из сравнения наблюдаемой вариации с некоторой ее обычной интенсивностью, принимаемой за норму. Наиболее часто исходят из того, что совокупность считается однородной, если коэффициент вариации не превышает 33 %. Пример. По данным о распределении сотрудников гостиницы по стажу определить абсолютные и относительные показатели вариации. Сделать вывод об однородности совокупности (табл. 6.2). Таблица 6.2 Вспомогательная таблица для расчета показателей вариации
Решение. Для расчета показателей вариации необходимо определить средний стаж сотрудников: года. Среднее линейное отклонение : года. Дисперсия Среднее квадратическое отклонение : года. Таким образом, каждое индивидуальное значение стажа сотрудников отклоняется от их среднего стажа на 3, 55 года. Относительное линейное отклонение ; %. Коэффициент вариации : > 33 % - совокупность является неоднородной. Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 2604; Нарушение авторского права страницы