Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Распределение функций нормальных случайных величин
Рассмотрим распределение некоторых с. в., представляющих функции нормальных величин, используемые в математической статистике. Распределение х2 (хи-квадрат или Пирсона) Рч| Распределением Хп с п степенями свободы называется распределе- ние суммы квадратов п независимых стандартных случайных величин, т. е. п t=i Плотность вероятности с. в. х2 зависит только от числа п, т. е. числа слагаемых. Если п = 1, то х2 — где X ~ N(0, 1), fX{x) = 2. V 27Г Плотность распределения с. в. равна (согласно (4.4)) 9iv) = ^fe6" 1' у > Плотность распределения Хп имеет вид 1 -2: 2 2, при х > 0, /*(*) = < 22Г(§) (О, при х ^ 0, ос где Г(р) = J tp~1e~t dt — гамма-функция Эйлера (Г(р) = (р — 1)! для о целых положительных р). С возрастанием числа степеней свободы п распределение х2 приближается к нормальному закону распределения (при п > 30 распределение х2 практически не отличается от нормального); Mxl = n, DXl = 2n. На практике, как правило, используют не плотность вероятности, а квантили распределения Хп- Квантилью распределения х2, отвечающей уровню значимости а, называется такое значение Хп ~ Ха, п> пРи котором оо P{xl> xln}= J fx*(x)dx = a. С геометрической точки зрения нахождение квантили Ха, п заключается в выборе такого значения Хп = чтобы площадь заштрихованной на рис. 56 фигуры была равна а. Значения квантилей приводятся в специальных таблицах-прило- жениях. Для стандартного нормального распределения квантили уровня а обозначаются через ±гга, причем иа является решением уравнения ФЫ = цр. Распределение Стьюдента
Рч] Распределением Стьюдента (или t-распределением) с п степенями свободы называется распределение с. в.
тп где Z ~ N(0, 1) — стандартная нормальная величина, независимая от Хп-распределения. Плотность вероятности распределения Стьюдента имеет вид
При п —оо распределение Стьюдента приближается (уже при п > 30 почти совпадает) к нормальному; мтп = о, = п> 2- На практике используют квантили ^-распределения: такое значение t = ta, что 2 оо P{\t\> t^ n} = 2 J /(i)< ft = a. t< x 2'" С геометрической точки зрения нахождение квантилей заключается в выборе такого значения t — ta, чтобы площадь заштрихованной на рис. 57 фигуры была равна а.
Распределение Фишера-Снедекора Распределением Фишера-Снедекора (или F-распределением) с т и п степенями свободы называется распределение с. в. 1., 2 F = iv2 ' где Хш и Хп — независимые с. в., имеющие х2-р& спределение соответственно с т и п степенями свободы. При п —> оо F-распределение стремится к нормальному закону. , л - „„ 2п2(т + п - 2) MF = —^Цг, п > 2, £ > F =---------------- Ь----------- п > 4. п-2' m(n-2)2(n-4)
На практике обычно используют квантили распределения: такое значение F — ЧТО оо J f(F) dF = С геометрической точки зрения нахождение квантили заключается в выборе такого значения F = FQym, ni чтобы площадь заштрихованной на рис. 58 фигуры была равна а.
Глава 5 Предельные теоремы теории вероятностей Рассмотрим ряд утверждений и теорем из большой группы так называемых предельных теорем теории вероятностей, устанавливающих связь между теоретическими и экспериментальными характеристиками случайных величин при большом числе испытаний над ними. Они составляют основу математической статистики. Предельные теоремы условно делят на две группы. Первая группа теорем, называемая законом больших чисел (коротко: ЗБЧ), устанавливает устойчивость средних значений: при большом числе испытаний их средний результат перестает быть случайным и может быть предсказан с достаточной точностью. Вторая группа теорем, называемая центральной предельной теоремой (коротко: ЦПТ), устанавливает условия, при которых закон распределения суммы большого числа случайных величин неограниченно приближается к нормальному. В начале рассмотрим неравенство Чебышева, которое можно использовать: а) для грубой оценки вероятностей событий, связанных со с. в., распределение которых неизвестно; б) доказательства ряда теорем ЗБЧ. Неравенство Чебышева Теорема 5.1. Если с. в. X имеет м. о. MX — а и дисперсию DX, то для любого е > 0 справедливо неравенство Чебышева Р{\Х-МХ\> £ }< 2£. (5.1) Г4 Q Докажем неравенство (5.1) для непрерывной с. в. X с плотностью f(x). Вероятность Р{\Х — а\^е} есть вероятность попадания с. в. X в область, лежащую вне промежутка [а — е, а + е]. Можно записать Ч-оо -ОО о+£ \х-а\^е
= I l'f(x)dx^ J {х~2а)2 f(x)dx, так как область интегрирования \х — а\ ^ е можно записать в виде \2 ^ Л uLis.y^j, ci wit^aj'tri х ^ - е' оо Р{\Х - а| ^ £ } ^ ^ J (х- affix) dx ^ ± J [х - a)2f(x) dx, [ж-а^е -оо так как интеграл от неотрицательной функции при расширении области интегрирования может только возрасти. Таким образом, оо Р{\Х J (х- a)2f(x) dx = ±DX, т.е. ~а\ Щ-. £ 1 Аналогично доказывается неравенство Чебышева и для дискретной с. в. X, принимающей значения х\, #2, • ■ • с вероятностями pi, p2- рз,...; только интегралы (вида J ) заменяются соответствующими суммами (вида ^ ). В Отметим, что неравенство Чебышева можно записать в другой форме: Р{\Х - MXI < е} > 1 - £ £ (5.2) £ В форме (5.2) оно устанавливает нижнюю границу вероятности события, а в форме (5.1) -— верхнюю. Неравенство Чебышева справедливо для любых с. в. В частности, для с. в. X = т, имеющей биномиальное распределение с матожиданием MX = а = пр и дисперсией DX = npq (п. 2.7), оно принимает вид Р{\т-пр\< £ }> 1-^ (5.3) для частости Щ (или п. 1.5) события в п независимых испытаниях, в каждом из которых оно может произойти с вероятностью р = М {—) = а, дисперсия которых D = неравенство Чебышева имеет вид Р{\Ш-Р\< £ }> 1-Ц. (5.4) Оценку вероятности попадания с. в. X в промежуток [е, оо) дает неравенство Маркова. Теорема 5.2 (Неравенство Маркова). Для любой неотрицательной с. в. X, имеющей м. о. MX и е > 0, справедливо неравенство: Р{Х ^е}^ MX, (5.5) □ Р{Х > с} = J f(x)dx < J f f(x)dx = I J xf(x)dx ^ £ £ £ ^±fxf(x)dx = Неравенство (5.5) можно записать в форме Р{Х< е}> 1 - (5.6) Г) Пример 5.1. Оценить с помощью неравенства Чебышева вероятность того, что отклонение с. в. X от своего м. о. будет меньше трех с. к. о., т. е. меньше Зсг^. Q Полагая е = 3< тх в формуле (5.2), получаем Р{\Х-МХ\ < 3< ТХ) > 1 - = 1 - I = I ~ °'8889- Эта оценка, как известно (п. 2.7), называется правилом трех сигм; для с. в. X ~ iV(a, < j) эта вероятность равна 0, 9973. • Теорема Чебышева Основное утверждение ЗБЧ содержится в теореме Чебышева. В ней и других теоремах ЗБЧ используется понятие «сходимости случайных величин по вероятности». Случайные величины Х\, Х2,..., Хп: ... сходятся по вероятности к величине А (случайной или неслучайной), если для любого е > О вероятность события {[А'п — А\ < е] при п —> оо стремится к единице, т. е. lim Р{\Хп ~А\< е} = 1 п—► оо (или Р{\Хп — А\ < е} —> ■ 1). Сходимость по вероятности символически записывают так: хп -JL^A. п—> оо Следует отметить, что сходимость по вероятности требует, чтобы неравенство \Хп — А\ < е выполнялось для подавляющего числа членов последовательности (в математическом анализе — для всех п > iV, где N — некоторое число), а при п —» оо практически все члены последовательности должны попасть в ^-окрестность А. Теорема 5.3 (ЗБЧ в форме П. JT. Чебышева, 1886 г.). Если случайные величины Х\у Х2, •.., Хп, ... независимы и существует такое число С > 0, что DXi ^ Су г = 1, 2,..то для любого е > О И» ■ р { я £ - к £ мх ' < 4 = W \ i-l i-l J т. е. среднее арифметическое этих случайных величин сходится по вероятности к среднему арифметическому их м.о.: i-l г=1 □ Так как DX{ ^ С, г = 1, 2,..., то
П ч / П v п г=1 i-l х г=1 = mdx! -f dx2 +... + dxn) ^ \{c + C +,.. + C) = -^Cn - £ rr гг rr Тогда, применяя к с. в. и i= 1 неравенство Чебышева (5.2), имеем
p{kiixi-kEMxi < 4
^ г=1 J
Переходя к пределу при п —> оо и учитывая, что вероятность любого события не превышает 1, получаем
* i=i i=i J Следствие. Если с. в. Xi, Х2, .. •, Хп, ... независимы и одинаково распределены, mxi — a, dxj = а2, то для любого е > О ^{IsE*-» < 4 = 1. т. е. среднее арифметическое с, в. сходится по вероятности к математическому ожиданию а: п Р, ч ► а. П-> 0о t=l Q Так как п ^^MXi = ±(МХ1+МХ2 +...±МХп) = ±(а+а+...+а) = ^-па = а, г=1 а дисперсии с. в. Х^ равны числу < т2, т. е. ограничены, то, применив ЗБЧ в форме Чебышева (5.7), получим утверждение (5.9). И Следствие (5.9) теоремы Чебышева обосновывает «принцип среднего арифметического с. в. Х{», постоянно используемый на практике. Так, пусть произведено п независимых измерений некоторой величины, истинное значение которой а (оно неизвестно). Результат каждого измерения есть с. в. Х{. Согласно следствию (5.9), в качестве приближенного значения величины а можно взять среднее арифметическое результатов измерений: п а ~ п Xi ~ Х' i—1 Равенство тем точнее, чем больше п. На теореме Чебышева основан также широко применяемый в статистике выборочный метод, суть которого в том, что о качестве большого количества однородного материала можно судить по небольшой его пробе. Теорема Чебышева подтверждает связь между случайностью и необходимостью: среднее значение случайной величины п i=i практически не отличается от неслучайной величины
i=i Пример 5.2. Глубина моря измеряется прибором, не имеющим систематической ошибки. Среднее квадратическое отклонение измерений не превосходит 15 м. Сколько нужно сделать независимых измерений, чтобы с вероятностью, не меньшей 0, 9, можно было утверждать, что среднее арифметическое этих измерений отличается от а (глубины моря) по модулю меньше, чем на 5 м?
О Обозначим через Xi результаты п независимых измерений глубины моря. Нужно найти число п, которое удовлетворяет неравенству (5.8): ^ г—1 г=1 ' где МХ{ = а, что означает отсутствие при измерениях систематической ошибки (т. е. измерения производятся с одинаковой точностью). По условию е = 5, С = 225, так как о = s/DX — 15м. Отсюда > 1 _ 225 > п о ^ 1 25п и, У' т.е. 0, 1 ^ n ^ 90. Измерение нужно проводить не менее 90 раз. Теорема Бернулли Теорема Бернулли исторически является первой и наиболее простой формой закона больших чисел. Она теоретически обосновывает свойство устойчивости относительной частоты (см. п. 1.5). Теорема 5.4 (ЗБЧ в форме Я. Бернулли, 1713 г.). Если вероятность появления события А в одном испытании равна р, число наступления этого события при п независимых испытаниях равно пд, то для любого числа е > 0 имеет место равенство
№Н< е)
т. е. относительная частота Р* (Л) события А сходится по вероятности к р вероятности р события А: Р*(А)--- у п—> оо Q Введем с. в. Х2,..., Хп следующим образом: Xi = 1, если в г-м испытании появилось событие А, а если не появилось, то Xi =0. Тогда число ид (число успехов) можно представить в виде п ПА = ^ Хг- i=1 М.о. и дисперсия с. в. Х{ равны: МХ{ ~ 1 • р + 0 • (1 — р) = р, DX{ = (0 — р)2(1 — р) -f (1 — р)2р = р(1 — р) = pq. Закон распределения с. в. Xi имеет вид
при любом г. Таким образом, с. в. Xi независимы, их дисперсии ограничены одним и тем же числом так как р(1-Р)=Р-Р2 = 1-(Р-±У Поэтому к этим с. в. можно применить теорему Чебышева (5.7): < Л = 1- ^ г=1 г=1 J i=1 i=l Следовательно, lim Р \ — р < 5} = 1. п—> оо к , ь I J Теорема Бернулли теоретически обосновывает возможность приближенного вычисления вероятности события с помощью его относительной частоты. Так, например, за вероятность рождения девочки можно взять относительную частоту этого события, которая, согласно статистическим данным, приближенно равна 0, 485. Неравенство Чебышева (5.2) для случайных величин п i= 1 принимает вид Р{№-Р\< е}^-Ц>. (5.11) Обобщением теоремы Бернулли на случай, когда вероятности pi появления события а в каждом из ть испытаний различны, является теорема Пуассона: п (5.12) п—юо " z—' t=l где pi — вероятность события а в г-м испытании. (С| Пример 5.3. Вероятность наличия опечатки на одной странице руко- писи равна 0, 2. Оценить вероятность того, что в рукописи, содержащей 400 страниц, частость появления опечатки отличается от соответствующей вероятности по модулю меньше, чем 0, 05.
Q Воспользуемся формулой (5.11). В данном случае р — 0, 2, q = 0, 8, п ~ 400, ? = 0, 05. Имеем
P{|^-0, 2| < 0, 05} т.е. р > 0, 84. Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 1280; Нарушение авторского права страницы