Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Числовые характеристики выборки. Выборочное среднее – среднее арифметическое всех значений выборки
Выборочное среднее – среднее арифметическое всех значений выборки, находится по формуле . Выборочная дисперсия вычисляется по формуле . Выборочное СКО вычисляется по формуле . Исправленная выборочная дисперсия вычисляется по формуле . Исправленное выборочное СКО вычисляется по формуле .
Для группированной выборки формулы примут вид: , , , где – средняя точка интервала группированного ряда.
Доверительным интервалом называют интервал , который покрывает неизвестный параметр а с заданной вероятностью g; здесь – оценка параметра а, концы и – доверительные границы (они оценивают возможную погрешность), число g – доверительная вероятность или надежность. Число характеризует точность оценки. Доверительный интервал для математического ожидания при большом объеме выборки и неизвестном среднем квадратическом отклонении выражается формулой , где – функция, обратная функции Лапласа (приложение 1), т.е. такое значение аргумента в таблице функции Лапласа, для которого функция Лапласа равна g. Замечание. Если использовать таблицу значений функции Лапласа , то точность оценки находится по формуле .
Проверка статистической гипотезы о нормальном законе распределения генеральной совокупности с помощью критерия Пирсона
Постановка задачи. Относительно некоторой генеральной совокупности Х высказывается гипотеза Н (о возможных значениях числовых характеристик, о виде закона распределения…) которую называют статистической гипотезой. Из этой генеральной совокупности извлекается выборка . Требуется указать правило, при помощи которого можно было бы по каждой данной выборке решить вопрос о том, следует ли отклонить гипотезу Н или принять ее. Нулевой гипотезой (основной) называют основную выдвигаемую гипотезу . Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой гипотезе . Для проверки нулевой гипотезы используют специально подобранную случайную величину, которая рассчитывается по экспериментальной выборке, точное или приближенное распределение которой известно. Эту случайную величину К называют статистическим критерием. Зная закон распределения К можно определить вероятность попадания К в любой интервал, т.е. для любых значений а и b. Обозначим: . Уровнем значимости a называют условное достаточно малое значение вероятности , соответствующее практически невозможному событию . При этом область называют критической областью. Областью допустимых значений считают область , так как достаточно велика при малых a. Итак: при выбранном значении a для данной гипотезы известна критическая область , в которую с вероятностью критерий К попасть не должен. Если вычисленный по выборке критерий К оказался в критической области , говорят о несоответствии гипотезы фактическим данным, т.е. об отсутствии оснований принять гипотезу . Если критерий К оказался вне критической области , говорят о соответствии гипотезы фактическим данным, т.е об отсутствии оснований отвергать гипотезу . При статистической проверке правильности выдвигаемой гипотезы могут быть допущены ошибки двух родов: ошибка первого рода состоит в том, что гипотеза отвергнута, а она верна; ошибка второго рода состоит в том, что гипотеза принята, а она не верна.
Критерием согласия называют критерий проверки статистической гипотезы о предполагаемом законе неизвестного распределения СВ.
Критерий согласия Пирсона (критерий ).
Пусть выдвигается простая гипотеза , полностью определяющая вид функции распределения исследуемой СВ Х. При этом имеется выборка достаточно большого объема, которой соответствует определенный статистический ряд. В качестве критерия проверки справедливости гипотезы выбирается СВ: , где – теоретические относительные частоты появления величины , вычисленные в предположении гипотезы по известной плотности распределения вероятностей ; – теоретические абсолютные частоты появления . Эта величина при распределена по закону сr степенями свободы , где s – число различных значений СВ Х (количество интервалов группированной выборки), l – число параметров предполагаемого закона распределения. Распределение не обладает симметрией, поэтому критическая область выбирается односторонней , значение полностью определяются по уровню значимости a и данному значению по таблице распределения (приложение 2). Критерий использует тот факт, что случайная величина имеет распределение, близкое к нормальному . Чтобы это утверждение было достаточно точным, необходимо, чтобы для всех интервалов группированного статистического ряда выполнялось условие . Если в некоторых интервалах это условие не выполняется, то их следует объединять с соседними. Так как после объединения остается меньше интервалов, то число степеней свободы следует вычислять, используя число вновь полученных интервалов.
Пример Результаты измерений некоторой физической величины представлены в таблице:
1. Найти функцию распределения выборки и построить ее график. 2. Построить гистограмму относительных частот. 3. Найти числовые характеристики выборки: выборочное среднее и исправленную выборочную дисперсию . 4. Используя функцию Лапласа, построить доверительный интервал для математического ожидания, соответствующий доверительной вероятности . 5. С помощью критерия (Пирсона) проверить гипотезу о нормальном распределении генеральной совокупности при уровне значимости . Решение Объем выборки , длина интервала . Для нахождения эмпирической функции распределения , построения гистограммы относительных частот и вычисления числовых характеристик выборки дополним заданную таблицу следующими строками: строкой, в которой расположим средние точки каждого интервала, строкой относительных частот , строкой накопленных относительных частот и строкой, в которой вычислим высоты столбиков гистограммы относительных частот . Таблица 1
1. Эмпирическая функция распределения определяется по значениям накопленных относительных частот, которые расположены в шестой строке таблицы 1. Эта функция имеет скачки в точках – серединах интервалов группированного статистического ряда. Аналитическое выражение эмпирической функции распределения имеет вид: .
График эмпирической функции распределения изображен на рис. 1.
-0, 25 2, 25 4, 75 7, 25 9, 75 12, 25 14, 75 17, 25 х
Рис. 1
2. Построим гистограмму относительных частот, для этого на каждом интервале группированной выборки строим столбики, высоты которых вычислены в седьмой строке таблицы 1. График гистограммы изображен на рис. 2.
0, 108
0, 08
0, 064
0, 032 0, 028
0, 02 0, 012
Рис. 2
3. Найдем числовые характеристики выборки. Выборочное среднее находим по формуле , в нашем случае Исправленную выборочную дисперсию находим по формуле , в нашем случае .
4. При большом объеме выборки доверительный интервал для математического ожидания имеет вид . Используя таблицу значений функции Лапласа (приложение 1) находим . Вычислим , тогда доверительный интервал для математического ожидания имеет вид или .
5. Выдвигаем простую гипотезу о нормальном распределении генеральной совокупности. В качестве критерия проверки справедливости гипотезы выбирается случайная величина , где находятся по формуле вероятности попадания случайной величины в интервал в предположении гипотезы о нормальном законе , где – функция Лапласа. Замечание. Если использовать таблицу значений функции Лапласа , то вероятности попадания случайной величины в интервал в предположении гипотезы о нормальном законе распределения находится по формуле . Для соблюдения условия полагают , . Для вычисления критерия составим расчетную таблицу:
Таблица 2
Находим сумму элементов 11-ой и 12-ой строк таблицы 2, получаем . Критерий равен сумме элементов последней строки таблицы 12: . Находим критическую область . Так как уровень значимости по условию, число степеней свободы , то согласно таблице распределения - , критическая область имеет вид . Так как критерий не попал в критическую область , то нет оснований отвергать гипотезу о нормальном законе распределения генеральной совокупности.
|
Последнее изменение этой страницы: 2017-03-15; Просмотров: 424; Нарушение авторского права страницы