Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Расчет выборочных характеристик



Интервалы[хi; хi+1] Середина интервала ni
до 500 40006028, 896
500 – 1000 67301998, 568
1000 – 1500 17065497, 424
1500 – 2000 13860721, 690
2000 – 2500 63745442, 342
свыше 2500 47281486, 049
Итого - 249261174, 968

 

.

.

С учетом рассчитанных точечных оценок параметров распределения функция плотности вероятностей и функция распределения будут иметь соответственно следующий вид:

,

.

 

При формировании статистического распределения выборки используются частоты, определенные по выборочным данным, поэтому их называют также эмпирическими.

При построении теоретического закона распределения исследуемой случайной величины используют теоретическиечастоты, т.е. частоты определенные расчетным способом.

Рассмотрим механизм расчета теоретических частот для дискретных и непрерывных случайных величин.

Дискретные случайные величины

Пусть имеются основания предположить, что изучаемая величина Х распределена по некоторому дискретному закону. Чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты наблюдаемых значений, т.е. находят теоретически частоту каждого из наблюдаемых значений в предположении, что величина Х распределена по предполагаемому закону.

Выравнивающими ( теоретическими ) называют частоты , определяемые расчетным способом:

,

где n – объем выборки;

Pi – вероятность наблюдаемого значения xi, вычисленная при допущении, что Х имеет предполагаемое распределение.

 

Пример 7.5. По данным примера 7.3 определить теоретические частоты в предположении, что случайная величина Х (генеральная совокупность) распределена по закону Пуассона. Построить полигон эмпирических и теоретических частот.

Решение

Пользуясь полученной в примере 7.3 формулой, найдем соответствующие вероятности при k= xi, затем, перемножив их на n, получим соответствующие теоретические частоты. Результаты расчетов представим в виде таблицы:

 

Таблица 6

Расчет теоретических частот

k
P500(k) 0, 368 0, 368 0, 184 0, 061 0, 015 0, 003 0, 001 0, 000
183, 94 183, 94 91, 97 30, 66 7, 66 1, 53 0, 26 0, 04
ni

 

Сравнительно небольшое расхождение эмпирических и теоретических частот (рис. 2) подтверждает предположение о том, что рассматриваемое распределение подчинено закону Пуассона.

 

Рисунок 1. Полигон теоретических и эмпирических частот

 

Непрерывные случайные величины

В случае непрерывного распределения, вероятности отдельных возможных значений равны нулю. Поэтому весь интервал возможных значений делят на k непересекающихся интервалов и вычисляют вероятности Pi попадания случайной величины X в i-ый частичный интервал, а затем, как и для дискретного распределения, умножают число испытаний на эти вероятности, т.е.

,

где n – объем выборки;

Pi – вероятность попадания случайной величины Х в i-ый частичный интервал, вычисленная при допущении, что Х имеет предполагаемое распределение.

К примеру, если имеются основания предположить, что случайная величина Х (генеральная совокупность) подчинена нормальному закону распределения, то вероятность попадания случайной величины Х в i-ый частичный интервал Pi вычисляются по следующей формуле:

,

где xi, xi+1 – границы i-го частичного интервала;

; - нормированные величины;

a, σ – соответственно математическое ожидание и стандартное отклонение случайной величины X;

- функция Лапласа (табличная величина, приложение), причем - нечетная функция.

Пример 7.6. По данным примера 7.4 о пределить теоретические частоты в предположении, что случайная величина Х (генеральная совокупность) распределена по нормальному закону. Построить полигон эмпирических и теоретических частот.

Решение

Для расчета теоретических частот вычислим нормированные величины ui; ui+1:

1 интервал: -∞; ;

2 интервал: -1, 80; ;

3 интервал: -0, 91; ;

4 интервал: -0, 03; ;

5 интервал: 0, 86; ;

6 интервал: 1, 74; ∞.

 

Таблица 7

Расчет теоретических частот

Границы интерваловхi; хi+1 Границы интервалов ui; ui+1
-∞; 500 -∞; -1, 80 0, 0360 0, 0360 28, 18
500; 1000 -1, 80; -0, 91 0, 0360 0, 1814 0, 1454 113, 85
1000; 1500 -0, 91; -0, 03 0, 1814 0, 4881 0, 3067 240, 15
1500; 2000 -0, 03; 0, 86 0, 4881 0, 8051 0, 3170 248, 21
2000; 2500 0, 86; 1, 74 0, 8051 0, 9591 0, 1540 120, 58
2500; ∞ 1, 74; ∞ 0, 9591 0, 0409 32, 02
  Итого - - -

 

Наглядно расхождение эмпирических и теоретических частот можно показать с помощью полигона (рис. 3).

 

Рисунок 2. Полигон теоретических и эмпирических частот

 

3 этап : проверка гипотезы о законе распределения.

Как бы хорошо ни был подобран теоретический закон распределения, между эмпирическим и теоретическим распределениями неизбежны расхождения. Закономерно возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, теоретический закон распределения подобран неудачно. Для ответа на данный вопрос служат критерии согласия.

Пусть необходимо проверить нулевую гипотезу H0 о том, что исследуемая случайная величина X подчиняется определенному закону распределения. Для проверки гипотезы H0 выбирают некоторую случайную величину U, характеризующую степень расхождения теоретического и эмпирического распределений, закон распределения которой при достаточно больших n известен и практически не зависит от закона распределения случайной величины X.

Зная закон распределения U, можно найти вероятность того, что U приняла значение не меньше, чем фактически наблюдаемое в опыте u, т.е. . Если мала, то это означает в соответствии с принципом практической уверенности, что такие как в опыте, и бó льшие отклонения практически невозможны. В этом случае гипотезу H0 отвергают. Если же вероятность не мала, расхождение между эмпирическим и теоретическим распределениями несущественно и гипотезу H0 можно считать не противоречащей опытным данным.

Наиболее часто в практике статистических исследований используются критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, А.Н. Колмогорова, Б.С. Ястремского.

В χ 2-критерий Пирсона в качестве меры расхождения U берется величина χ 2, равная:

,

которая имеет χ 2-распределение с степенями свободы, где m – число интервалов эмпирического распределения (вариационного ряда); r – число параметров теоретического распределения.

Схема применения χ 2-критерия для проверки гипотезы H0 сводится к следующему:

1) определяется мера расхождения эмпирических и теоретических часто χ 2;

2) для заданного уровня значимости α (как правило, принимается на уровне 0, 05 или 0, 01) по справочной таблице χ 2-распределения находят критическое значение при числе степеней свободы ;

3) если расчетное значение χ 2 больше критического , т.е. , то гипотеза H0 отвергается, если , то гипотеза H0 не противоречит опытным данным.

Примечание: статистика χ 2 имеет χ 2-распределение лишь при , поэтому необходимо, чтобы в каждом интервале было достаточное количество наблюдений, по крайней мере, не меньше 5. Если какой-либо интервал не удовлетворяет данному требованию, то имеет смысл объединить его с соседним таким образом, чтобы в объединенных интервалах . В данном случае параметр m при расчете числа степеней свободы уменьшается на число таких объединенных интервалов.

На практике кроме критерия χ 2 часто используют критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривают максимальное значение абсолютной величины разности между эмпирической и теоретической функциями распределения:

,

называемое статистикой критерия Колмогорова.

Схема применения критерия Колмогорова:

1) строятся эмпирическая функция распределения и предполагаемая теоретическая;

2) определяется мера расхождения между теоретическим и эмпирическим распределением D и вычисляется величина:

;

3) если вычисленное значение λ окажется не больше критического λ α , определенного на уровне значимости α (λ 0, 05=1, 36; λ 0, 01=1, 63), то нулевая гипотеза H0 не противоречит опытным данным.

Примечание: применение критерия Колмогорова в принципе возможно лишь тогда, когда теоретическая функция распределения задана полностью. Однако такие случаи в практике встречаются редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия χ 2 это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Такого рода поправок в критерии Колмогорова не предусмотрено. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров их оценки, вычисленные по выборке, то получим завышенное значение вероятности , и, следовательно, бó льшее критическое значение λ α . В результате есть риск в ряде случаев принять нулевую гипотезу H0 о законе распределения случайной величины как правдоподобную, в то время как на самом деле она противоречит опытным данным.

Пример 7.7. По данным примеров 7.3 и 7.5 на уровне значимости α =0, 05 проверить гипотезу H0 о том, что случайная величина Х – число поврежденных изделий, распределена по закону Пуассона.

Для определения статистики χ 2 составим таблицу:

 

Таблица

Расчет χ 2-критерия Пирсона

i xi = k ni
183, 94 226, 80 1, 23
183, 94 226, 80 1, 23
91, 97 24, 70 0, 27
30, 66 0, 12 0, 00
7, 66 1, 80 0, 23
5 3 1, 53    
1 5 0, 26 1, 83 10, 05 5, 49
0, 04    
  8, 45

 

При расчете χ 2 объединяем последние три интервала для того, чтобы в объединенных интервалах частота была не менее 5 ( ).

Так как новое число интервалов (с учетом объединения трех последних) m = 6, а закон Пуассона определяется r = 1 параметром, то число степеней свободы . По таблице χ 2-распределения определяем . Так как (8, 45 < 9, 49), то гипотеза H0 согласуется с опытными данными.

 

Пример 7.8. По данным примеров 7.4 и 7.6 на уровне значимости α =0, 05 проверить гипотезу H0 о том, что случайная величина Х, распределена по нормальному закону.

Для определения статистики χ 2 составим таблицу:

Таблица

Расчет χ 2-критерия Пирсона

Границы интерваловхi; хi+1 Границы интерваловui; ui+1 ni
-∞; 500 -∞; -1, 80 28, 18 10, 11 0, 39
500; 1000 -1, 80; -0, 91 113, 85 1, 32 0, 01
1000; 1500 -0, 91; -0, 03 240, 15 8, 12 0, 03
1500; 2000 -0, 03; 0, 86 248, 21 7, 78 0, 03
2000; 2500 0, 86; 1, 74 120, 58 6, 66 0, 06
2500; ∞ 1, 74; ∞ 32, 02 1, 04 0, 03
  - 782, 99 0, 55

 

Число интервалов m = 6, а нормальный закон определяется r = 2 параметрами, то число степеней свободы . По таблице χ 2-распределения определяем . Так как (0, 55 < 7, 82), то гипотеза H0 согласуется с опытными данными.

Проверим гипотезу о законе распределения также с помощью критерия Колмогорова. Для расчета значений функций распределения будем использовать следующую таблицу:

Таблица 8

Расчет величины D

хi ui
-2, 68 0, 0037 0, 0037
-1, 80 0, 0360 0, 0041
-0, 91 0, 1788 0, 1814 0, 0026
-0, 03 0, 4891 0, 4880 0, 0011
0, 86 0, 8097 0, 8051 0, 0046
1, 74 0, 9604 0, 9591 0, 0013
2, 63 1, 0000 0, 9958 0, 0042
  = 0, 0046

 

.

Так как вычисленное значение λ не больше критического λ α , определенного на уровне значимости α (λ 0, 05=1, 36), то нулевая гипотеза H0 не противоречит опытным данным.

 


Поделиться:



Последнее изменение этой страницы: 2017-05-05; Просмотров: 200; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.034 с.)
Главная | Случайная страница | Обратная связь