Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Показатели вариации и способы их расчета.
Для того, чтобы охарактеризовать степень рассеяния отдельных значений признака вокруг его среднего значения, в статистике используются показатели вариации. Показатели вариации делятся на 2 группы: 1) Абсолютные - размах вариации; - среднее линейное отклонение; - дисперсия; - среднее квадратическое отклонение; 2) Относительные - коэффициенты осцилляции; - коэффициенты вариации; - относительные линейные отклонения.
Относительные показатели вычисляются как отношение абсолютных показателей к среднему арифметическому или медиане. Рассмотрим их: 1) Вариационный размах (амплитуда колебаний). Показывает насколько велико различие между единицами совокупности, имеющими наименьшее и наибольшее значения признаков R = Xmax - Xmin К недостаткам этого показателя можно отнести тот факт, что очень низкое(или высокое) значение признака может быть вызвано какими-то случайными факторами, т.е. иметь аномальный характер. В этих случаях размах вариации дает искаженную амплитуду колебания признака. Прежде всего поэтому необходимо очистить наблюдения от различных выбросов. 2) Среднее линейное отклонение.
Простая формула: Взвешенная формула: 3) Дисперсия. Простая формула: Взвешенная формула: 4) Коэффициент осцилляции. Отношение размаха вариации к средней величине:
5) Линейный коэффициент вариации.
6) Коэффициент вариации. Используется для оценки однородности совокупности близкой к нормальной, при этом совокупность считается однородной, если £ 33%.
5.2. Вариация альтернативного признака. Энтропия распределения.
В ряде случаев возникает необходимость в измерении дисперсии альтернативных признаков, т.е. тех признаков, которыми обладают одни единицы совокупности и не обладают другие. Пример: Бракованная продукция; работа по получаемой специальности.
Значения альтернативного признака обычно задается 0, если объект этим признаком не обладает, и 1, если объект этим признаком обладает. Пусть p=m/n – доля единиц совокупности, обладающих признаком, а q - доля единиц совокупности, не обладающих этим признаком p + q=1 Тогда среднее значение альтернативного признака: Максимальное значение дисперсии max=0, 25 при р=0, 5. Данные показатели могут быть использованы, например, для расчета среднего процента бракованной продукции при статистическом приемочном контроле. Обобщенной характеристикой различий внутри ряда служит энтропия распределения.
ОПР: Энтропия - мера неопределенности данных наблюдений. Она зависит от числа проявляющегося признака и от вероятности каждого из них. где рi –вероятности различных значений случайных величин.
Если все варианты равновероятны, то энтропия максимальна. Например, при n=2 и p=0.5 =1. Показатель энтропии позволяет также измерять количество информации. Чем больше вероятность случайного события, тем меньше информации несет его осуществление, т.е. в случае p=1 =0.
Виды дисперсий в совокупности, разделенной на группы. Правило сложения дисперсий. Можно определить 3 показателя вариации признака совокупности: 1. 0 – общая дисперсия; 2. d2 Х – межгрупповая дисперсия; 3. – средняя из внутригрупповых дисперсий. Рассмотрим их: 1) Общая дисперсия
2) Межгрупповая дисперсия Характеризует вариацию изучаемого признака, возникающую под влиянием признака-фактора, положенного в основание группировки.
где к - число групп nj - число единиц в j-ой группе - среднее по j-ой группе - среднее по всей совокупности 3) Внутригрупповая дисперсия Внутригрупповая дисперсия отражает часть вариации, происходящей под влиянием неучтенных факторов, которая не зависит от группировочного признака.
Средняя из внутригрупповых дисперсий по совокупности в целом - вариация значений признака под влиянием прочих факторов.
Правило сложения дисперсий: общая дисперсия, которая возникает под влиянием всех факторов, равна сумме средней из внутригрупповых и межгрупповой:
Эмпирическое корреляционное отношение показывает какая доля общей дисперсии приходится на дисперсию, обусловленную вариацией группировочного признака. hÎ [0; 1]. В случае h=0 группировочный признак не влияет на результат, если h=1, то результативный признак изменяется только в зависимости от группировочного признака, влияние прочих факторов на него равно 0.
Выборочное наблюдение. ОПР: Выборочным называется такое несплошное наблюдение, при котором признаки регистрируются у отдельных единиц изучаемой совокупности. Получаемые в процессе исследования результаты с определенной вероятностью распределяются на всю генеральную совокупность. Генеральной совокупностью называется вся исходная изучаемая статистическая совокупность, из которой формируется выборка. Отбор единиц может быть повторным и бесповторным. При повторном отборе попавшая в выборку единица подвергается регистрации, а затем возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Число единиц генеральной совокупности, участвующих в отборе, остается в этом случае постоянным. На практике повторный отбор обычно используют в тех случаях, когда объем генеральной совокупности неизвестен. Например, при проведении маркетинговых исследований мы не можем точно оценить количество покупателей супермаркета, т.к. один и тот же покупатель может дважды прийти в этот магазин. При бесповторном отборе попавшая в выборку единица подвергается исследованию и в дальнейшей процедуре отбора не участвует. Такой отбор происходит, если объем генеральной совокупности четко определен. Получаемые в этом случае результаты являются более точными, чем при повторном отборе. В выборочную совокупность могут отбираться не только отдельные единицы, но и группы единиц. В первом случае отбор называется индивидуальным, а во втором - групповым. Ошибки репрезентативности обусловлены тем, что выборочная совокупность не может соответствовать по всем параметрам генеральной совокупности. Средняя ошибка выборки: где -дисперсия генеральной совокупности n – объем выборки На практике неизвестна, поэтому при . При определении возможных границ значений характеристик генеральной совокупности рассчитывается предельная ошибка выборки. Вероятность предельной ошибки подчиняется нормальному закону: P(D£ tm)=F(t), где D- ошибка, tm -двукратная средняя ошибка выборки. Обычно берут при t =2 p=0, 954.
В зависимости от состава и структуры генеральной совокупности выбирается вид выборки. К наиболее распространенным на практике видам относятся: 1) Простая случайная выборка. 2) Систематическая выборка (выборка из генеральной совокупности, которая упорядочена). 3) Типическая выборка (происходит из генеральной совокупности, разделенной на группы). 4) Серийная выборка (из генеральной совокупности происходит отбор целых групп, внутри которых производится сплошное исследование).
Методы отбора единиц в выборочную совокупность. Формирование выборочной совокупности должно быть основано на принципе случайности. Опишем один из методов обеспечения данного принципа. Метод случайной сортировки. 1) Каждой единице генеральной совокупности присваивается случайное число, получаемого с помощью датчика случайных чисел, находящихся от 0 до 1. 2) Единицы генеральной совокупности ранжируются в соответствии с полученным числом. 3) Отбираются первые m единиц. Простая случайная выборка. Данная выборка заключается в отборе единиц из генеральной совокупности без разделения ее на группы или серии, при этом средней ошибкой повторной выборки будет: С учетом выбранного уровня вероятности считается предельная ошибка и оценивается среднее для выборки: где - среднее по выборке, - среднее по генеральной совокупности. Если выборка без повтора, то где n- объем выборки, N- объем генеральной совокупности. При подготовке выборочного наблюдения необходимо определить минимальный необходимый объем выборки, который обеспечит требуемую точность при данном уровне вероятности. Таким образом, минимально возможный объем выборки с повторениями: Аналогично, для выборки без повторений получим:
Расчет необходимого объема выборки предполагает, что на начальном этапе проведения выборочного наблюдения мы обладаем информацией о вариации изучаемых признаков. Источником этой информации могут быть: 1) Результаты исследования объекта за предшествующий период. 2) Результаты исследования аналогичных объектов. 3) Специально проведенное небольшое по объему выборочное исследование данного объекта, целью которого является лишь изучение вариации.
Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 1122; Нарушение авторского права страницы