Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Выборки. Эмпирическая функция распределения
Изучение всего набора элементов генеральной совокупности часто оказывается невозможным из-за больших материальных затрат или бесконечности генеральной совокупности. В этом случае применяется выборочный метод. Сущность выборочного метода заключается в том, что из генеральной совокупности извлекается выборка. На выборке производят нужные исследования, а полученные результаты распространяют на всю совокупность. Пусть для изучения количественного признака Х из генеральной совокупности извлечена выборка объема n. Наблюдаемые значения хi признака Х называют вариантами, а последовательность вариантов, записанную в возрастающем порядке, – вариационным рядом. Статистическим распределением выборки называется перечень хi и соответствующих им частот тi или относительных частот vi. Статистическое распределение выборочной совокупности можно представить графически в виде полигона или гистограммы. Полигоном частот выборочной совокупности называется ломаная линия, соединяющая точки с координатами . Гистограммой выборочной совокупности называется фигура, составленная в декартовой системе координат из прямоугольников, основаниями которых являются частичные интервалы , а высоты соответственно равны , где . Эмпирической функцией распределения называется функция , где nх – число вариант в выборке, меньших х; п – объем выборки. Эмпирическая функция распределения при больших п служит оценкой неизвестной функции распределения генеральной совокупности. Эмпирическая функция распределения обладает следующими свойствами: 1) ; 2) эмпирическая функция распределения является неубывающей функцией, т. е. если , то ; 3) если – наименьшая варианта, а – наибольшая варианта, то при и при .
Точечные оценки неизвестных параметров распределения Статистической оценкой неизвестного параметра генеральной совокупности называется функция от наблюдаемых значений случайной величины Х. Сами наблюдаемые значения (варианты) рассматриваются как значения п независимых СВ , имеющих тот же закон распределения, что и изучаемая СВ Х. Поэтому статистические оценки также являются случайными величинами. Статистическая оценка называется точечной, если она определяется одной величиной. Точечная оценка, математическое ожидание которой равно оцениваемому параметру, называется несмещенной, в противном случае – смещенной. Несмещенной оценкой для математического ожидания генеральной совокупности является – выборочная средняя:
.
Смещенной оценкой для дисперсии генеральной совокупности является выборочная дисперсия , а несмещенной оценкой для дисперсии генеральной совокупности является исправленная выборочная дисперсия . , ,
Оценка параметра q называется состоятельной, если она сходится по вероятности к оцениваемому параметру при неограниченном числе испытаний, т. е. для любого сколь угодно малого e > 0 выполнено предельное равенство . Один и тот же параметр может иметь несколько оценок, которые обладают различными дисперсиями при ограниченном числе опытов. Чем меньше эта дисперсия, тем меньше вероятность совершить ошибку при оценке параметра. Поэтому в качестве оценки берется та, которая обладает минимальной дисперсией (эффективная).
Интервальные оценки неизвестных параметров Распределения Статистическая оценка называется интервальной, если она характеризуется двумя случайными величинами: началом и концом интервала. В качестве интервальной оценки используются доверительные интервалы. Пусть является статистической оценкой неизвестного параметра q. Тогда при некоторых e > 0 вероятность близка к единице, т. е. неизвестный параметр q с вероятностью g накрывается интервалом . Вероятность g называется доверительной вероятностью или надежностью оценки. Интервал, который с заданной надежностью накрывает неизвестный параметр, называется доверительным интервалом. Доверительный интервал для неизвестного математического ожидания нормально распределенной СВ при известном среднем квадратическом отклонении s генеральной совокупности определяется неравенством ,
где t – значение функции Лапласа , при котором Если среднее квадратическое отклонение σ нормально распределенной СВ неизвестно, но по результатам выборки вычислены и s, то доверительный интервал для математического ожидания определяется неравенством
где находится из таблицы (приложение 5) по заданным значениям g и n. Доверительный интервал для среднего квадратического отклонения s нормально распределенной СВ определяется неравенством
,
где определяются из таблицы (приложение 6) по заданным g и ν = n – 1.
|
Последнее изменение этой страницы: 2017-05-06; Просмотров: 495; Нарушение авторского права страницы