![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Расчет выборочных характеристик
С учетом рассчитанных точечных оценок параметров распределения функция плотности вероятностей и функция распределения будут иметь соответственно следующий вид:
При формировании статистического распределения выборки используются частоты, определенные по выборочным данным, поэтому их называют также эмпирическими. При построении теоретического закона распределения исследуемой случайной величины используют теоретическиечастоты, т.е. частоты определенные расчетным способом. Рассмотрим механизм расчета теоретических частот для дискретных и непрерывных случайных величин. Дискретные случайные величины Пусть имеются основания предположить, что изучаемая величина Х распределена по некоторому дискретному закону. Чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты наблюдаемых значений, т.е. находят теоретически частоту Выравнивающими ( теоретическими ) называют частоты
где n – объем выборки; Pi – вероятность наблюдаемого значения xi, вычисленная при допущении, что Х имеет предполагаемое распределение.
Пример 7.5. По данным примера 7.3 определить теоретические частоты Решение Пользуясь полученной в примере 7.3 формулой, найдем соответствующие вероятности при k= xi, затем, перемножив их на n, получим соответствующие теоретические частоты. Результаты расчетов представим в виде таблицы:
Таблица 6 Расчет теоретических частот
Сравнительно небольшое расхождение эмпирических и теоретических частот (рис. 2) подтверждает предположение о том, что рассматриваемое распределение подчинено закону Пуассона.
Рисунок 1. Полигон теоретических и эмпирических частот
Непрерывные случайные величины В случае непрерывного распределения, вероятности отдельных возможных значений равны нулю. Поэтому весь интервал возможных значений делят на k непересекающихся интервалов и вычисляют вероятности Pi попадания случайной величины X в i-ый частичный интервал, а затем, как и для дискретного распределения, умножают число испытаний на эти вероятности, т.е.
где n – объем выборки; Pi – вероятность попадания случайной величины Х в i-ый частичный интервал, вычисленная при допущении, что Х имеет предполагаемое распределение. К примеру, если имеются основания предположить, что случайная величина Х (генеральная совокупность) подчинена нормальному закону распределения, то вероятность попадания случайной величины Х в i-ый частичный интервал Pi вычисляются по следующей формуле:
где xi, xi+1 – границы i-го частичного интервала;
a, σ – соответственно математическое ожидание и стандартное отклонение случайной величины X;
Пример 7.6. По данным примера 7.4 о пределить теоретические частоты Решение Для расчета теоретических частот вычислим нормированные величины ui; ui+1: 1 интервал: -∞; 2 интервал: -1, 80; 3 интервал: -0, 91; 4 интервал: -0, 03; 5 интервал: 0, 86; 6 интервал: 1, 74; ∞.
Таблица 7 Расчет теоретических частот
Наглядно расхождение эмпирических и теоретических частот можно показать с помощью полигона (рис. 3).
Рисунок 2. Полигон теоретических и эмпирических частот
3 этап : проверка гипотезы о законе распределения. Как бы хорошо ни был подобран теоретический закон распределения, между эмпирическим и теоретическим распределениями неизбежны расхождения. Закономерно возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, теоретический закон распределения подобран неудачно. Для ответа на данный вопрос служат критерии согласия. Пусть необходимо проверить нулевую гипотезу H0 о том, что исследуемая случайная величина X подчиняется определенному закону распределения. Для проверки гипотезы H0 выбирают некоторую случайную величину U, характеризующую степень расхождения теоретического и эмпирического распределений, закон распределения которой при достаточно больших n известен и практически не зависит от закона распределения случайной величины X. Зная закон распределения U, можно найти вероятность того, что U приняла значение не меньше, чем фактически наблюдаемое в опыте u, т.е. Наиболее часто в практике статистических исследований используются критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, А.Н. Колмогорова, Б.С. Ястремского. В χ 2-критерий Пирсона в качестве меры расхождения U берется величина χ 2, равная:
которая имеет χ 2-распределение с Схема применения χ 2-критерия для проверки гипотезы H0 сводится к следующему: 1) определяется мера расхождения эмпирических и теоретических часто χ 2; 2) для заданного уровня значимости α (как правило, принимается на уровне 0, 05 или 0, 01) по справочной таблице χ 2-распределения находят критическое значение 3) если расчетное значение χ 2 больше критического Примечание: статистика χ 2 имеет χ 2-распределение лишь при На практике кроме критерия χ 2 часто используют критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривают максимальное значение абсолютной величины разности между эмпирической и теоретической функциями распределения:
называемое статистикой критерия Колмогорова. Схема применения критерия Колмогорова: 1) строятся эмпирическая функция распределения и предполагаемая теоретическая; 2) определяется мера расхождения между теоретическим и эмпирическим распределением D и вычисляется величина:
3) если вычисленное значение λ окажется не больше критического λ α , определенного на уровне значимости α (λ 0, 05=1, 36; λ 0, 01=1, 63), то нулевая гипотеза H0 не противоречит опытным данным. Примечание: применение критерия Колмогорова в принципе возможно лишь тогда, когда теоретическая функция распределения задана полностью. Однако такие случаи в практике встречаются редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия χ 2 это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Такого рода поправок в критерии Колмогорова не предусмотрено. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров их оценки, вычисленные по выборке, то получим завышенное значение вероятности Пример 7.7. По данным примеров 7.3 и 7.5 на уровне значимости α =0, 05 проверить гипотезу H0 о том, что случайная величина Х – число поврежденных изделий, распределена по закону Пуассона. Для определения статистики χ 2 составим таблицу:
Таблица Расчет χ 2-критерия Пирсона
При расчете χ 2 объединяем последние три интервала для того, чтобы в объединенных интервалах частота была не менее 5 ( Так как новое число интервалов (с учетом объединения трех последних) m = 6, а закон Пуассона определяется r = 1 параметром, то число степеней свободы
Пример 7.8. По данным примеров 7.4 и 7.6 на уровне значимости α =0, 05 проверить гипотезу H0 о том, что случайная величина Х, распределена по нормальному закону. Для определения статистики χ 2 составим таблицу: Таблица Расчет χ 2-критерия Пирсона
Число интервалов m = 6, а нормальный закон определяется r = 2 параметрами, то число степеней свободы Проверим гипотезу о законе распределения также с помощью критерия Колмогорова. Для расчета значений функций распределения будем использовать следующую таблицу: Таблица 8 Расчет величины D
Так как вычисленное значение λ не больше критического λ α , определенного на уровне значимости α (λ 0, 05=1, 36), то нулевая гипотеза H0 не противоречит опытным данным.
|
Последнее изменение этой страницы: 2017-05-05; Просмотров: 216; Нарушение авторского права страницы