Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Точечные оценки параметров генеральной совокупности по выборочным совокупностям, их свойства. Точечные оценки для математического ожидания и дисперсии случайной величины



Пусть закон распределения случайной величины X содержит неизвестный параметр . Требуется на основании опытных данных найти подходящую оценку для параметра . Пусть

                                              (7.2.1)

наблюдаемые значения случайной величины X, получаемые в результате n независимых опытов. Но, с другой стороны, результат (7.2.1) можно представлять как набор n независимых случайных величин:

,                                           (7.2.2)

представляющих собой n независимых копий случайной величины X, именно  – случайная величина, представляющая собой результат i-го опыта, но имеющая тот же закон распределения, что исследуемая случайная величина X.

Случайная величина

,                                (7.2.3)

построенная на основе статистических данных (7.2.2), называется оценкой (точечной оценкой) параметра .  является случайной величиной, закон распределения которой зависит, во-первых, от закона распределения случайной величины X, во-вторых, от числа опытов n. Для того чтобы оценка имела практическую ценность, она должна обладать следующими свойствами:

1. Несмещенность. Оценка  называется несмещенной, если ее математическое ожидание равно оцениваемому параметру , т.е.

                                                    .                                                (7.2.4)

В противном случае (если ) оценка  называется смещенной.

Естественно в качестве оценки, т.е. приближенного значения неизвестного параметра, брать несмещенные оценки; в этом случае мы не делаем систематической ошибки в сторону завышения или занижения.

2. Состоятельность. Оценка  называется состоятельной, если она сходится по вероятности к оцениваемому параметру a при неограниченном возрастании n:

                                            при .                                       (7.2.5)

Состоятельность оценки означает, что при достаточно большом числе опытов n со сколько угодно большой достоверностью отклонение оценки от истинного значения параметра по модулю меньше любого заранее выбранного числа e > 0.

3. Эффективность. Оценки, обладающие свойством несмещенности и состоятельности, при ограниченном числе опытов могут отличаться дисперсиями. Чем меньше дисперсия оценки, тем меньше вероятность грубой ошибки при определении приближенного значения параметра. Поэтому необходимо, чтобы дисперсия оценки была минимальной, т.е. чтобы выполнялось условие:

                                                .                                            (7.2.6)

Оценка, обладающая свойством (7.2.6), называется эффективной, иначе, если при заданном объеме выборки имеет наименьшую дисперсию.

Условия несмещенности, состоятельности и эффективности являются условиями доброкачественности оценки, что является необходимым при обработке статистических данных.

Оценка для математического ожидания случайной величины

 

Пусть исследуется случайная величина X с математическим ожиданием . Обозначим через x1, x2,..., xn значения случайной величины, полученные в результате n независимых равноточных опытов, т.е. измерений, которые проводились в одинаковых условиях. В качестве оценки для  примем среднее арифметическое наблюдаемых значений

                                                   .                                               (7.2.7)

 в дальнейшем принято называть выборочной средней.

Оценка (7.2.7) является несмещенной, так как .

Оценка (7.2.7) является состоятельной, так как по теореме Чебышева (частный случай) имеем  при .

Эффективность оценки (7.2.7) выполняется лишь для узкого класса распределений, в частности, для нормального распределения .

 

Оценка для дисперсии случайной величины

В качестве оценки для дисперсии рассмотрим следующую величину:

                                              .                                           (7.2.8)

Оценку (7.2.8) принято называть выборочной дисперсией. Проверим ее на состоятельность и несмещенность. Преобразуем выражение (7.2.8) к другому виду:

.                                (7.2.9)

Первый член в выражении (7.2.9) представляет собой среднее арифметическое n наблюдаемых значений случайной величины X2, значит он сходится по вероятности к MX2. Второй член  сходится по вероятности к . Следовательно, правая часть (7.2.9) сходится по вероятности к величине , что означает, что оценка (7.2.8) состоятельная.

Теперь проверим, является ли выборочная дисперсия несмещенной оценкой:

.

 

Так как дисперсия  не зависит от того, в какой точке выбрать начало координат, выберем его в точке ; затем найдем математическое ожидание величины . Имеем .

В силу независимости случайных величин , , и, следовательно,

.                                     (7.2.10)

Очевидно, что выборочная дисперсия является смещенной оценкой. Однако, если умножить величину  на , то мы получим для дисперсии  оценку, обладающую свойством несмещенности, ибо

.

Эту оценку принято называть «исправленной» выборочной дисперсией и определять формулой

                                  .                             (7.2.11)

Величину  называют «исправленным» средним квадратическим отклонением. Так как множитель  стремится к 1 при , то оценка (7.2.11) будет также, как и , состоятельной.

Если имеем интервальное выборочное распределение, нетрудно убедиться, что формулы для выборочной средней (7.2.7), выборочной дисперсии (7.2.8) и «исправленной» выборочной дисперсии (7.2.11) можно переписать в виде

                                                                                                (7.2.12)

                                                                                     (7.2.13)

                                                                               (7.2.14)

здесь – среднее значение случайной величины X на интервале , т.е. =(xi-1+xi)/2.

 

Задача 7.2.1. Имеется статистический ряд для случайной величины X.

 

0-2 2-4 4-6 6-8 8-10
nx 3 4 10 5 3

 

Найти выборочную среднюю, выборочную дисперсию, «исправленную» выборочную дисперсию, «исправленное» среднее квадратическое отклонение.

Решение. Для удобства вычислений составим таблицу.

 

Wi
1 0,12 0,12 -4,08 16,65 1,988
3 0,16 0,48 -2,08 4,33 0,693
5 0,40 2,00 -0,08 0,01 0,04
7 0,20 1,40 1,92 3,69 0,738
9 0,12 1,08 3,92 15,37 1,844
    =5,08    

Значения  и  получены из таблицы с использованием формул (7.2.12), (7.2.13). Имеем .

7.3. Интервальные оценки. Доверительный интервал.
Нахождение доверительных интервалов для математического ожидания и дисперсии нормального распределения случайной величины

В ряде задач требуется не только найти с помощью статистических данных точечную оценку  для параметра  распределения, но и оценить ее точность и надежность, так как в силу случайности  приближенная замена  на может привести к серьезным ошибкам. Для точности оценки в математической статистике используют доверительные интервалы.

Пусть для параметра  распределения случайной величины Х получена несмещенная оценка . Задаем достаточно высокую вероятность  (например, ) и находим такое значение e > 0, для которого

.                                       (7.3.1)

Равенство (7.3.1) можно переписать в другом виде

.                             (7.3.2)

Последнее равенство (7.3.2) можно истолковать следующим образом: неизвестное значение параметра а с вероятностью попадает в интервал .

Но так как неизвестное значение параметра  является неслучайной величиной, оценка  этого параметра – случайной, то равенство (7.3.2) можно истолковать более точно следующим образом: интервал  с высокой вероятностью  покрывает неизвестный параметр .

Интервал  называется доверительным интервалом; центр его находится в точке , радиус его e. Вероятность  называется доверительной вероятностью или надежностью.

Итак, доверительный интервал  – это интервал с центром в точке  и радиусом e, который с высокой вероятностью (надежностью) покрывает неизвестный параметр . Найти доверительный интервал – это значит по статистическим данным найти центр интервала  и радиус его e> 0.

 

1. Доверительный интервал для оценки математического ожидания нормального распределения случайной величины с известным s

 

Пусть случайная величина X имеет нормальное распределение с неизвестным математическим ожиданием  и известной дисперсией s2. Пусть произведено n независимых опытов и на основании статистических данных получено выборочное среднее:

Задаем достаточно высокую доверительную вероятность g. Требуется построить доверительный интервал . Прежде всего, заметим, что случайная величина  также имеет нормальное распределение . Действительно,

Вероятность попадания случайной величины  с нормальным законом распределения в симметричный интервал с центром в точке и радиусом ε равен

                (7.3.3)

где  – функция Лапласа.

Обозначая , имеем Ф(t) = g/2. Затем по табл. 4 приложения находим t по значению Ф(t) = g/2; отсюда находится : . Таким образом, доверительный интервал имеет вид

                                          .                                       (7.3.5)

Задача 7.3.1. Случайная величина X имеет нормальное распределение с известным s=3. Найти доверительный интервал для оценки неизвестного математического ожидания а по его выборочному среднему , если известны объем выборки  и .

Решение. Имеем на основании формулы (7.3.4):

 t = , .

Из табл. 4 t = 1,96. Тогда . Таким образом,

.

 

2. Доверительный интервал для оценки математического ожидания
нормального распределения с неизвестным s

В отличие от предыдущего, случайная величина X имеет нормальное распределение N (a, s ) с неизвестным s. Пусть произведено n независимых испытаний, построены выборочная средняя  и “исправленная” выборочная дисперсия S2. Требуется построить доверительный интервал для оценки  математического ожидания.

Рассмотрим случайную величину

.                                       (7.3.6)

Распределение (7.3.6) является t – распределение или распределением Стьюдента с  степенями свободы.

Действительно, по определению, если  – случайная величина с нормальным распределением , а V – случайная величина, распределенная по закону c2 с k степенями свободы, то случайная величина распределена по закону Стьюдента с k степенями свободы.

Случайная величина  распределена по нормальному закону . Случайная величина

                                                                                           (7.3.7)

распределена также по нормальному закону (как линейная функция относительно нормального аргумента ) с законом .

Известно, что случайная величина

                                                                                         (7.3.8)

распределена по закону c2 с  степенями свободы. Поэтому случайная величина T распределена по закону Стьюдента.

С ростом степеней свободы распределение Стьюдента приближается к нормальному  и уже при  практически не отличается от него. Следовательно, при оценке неизвестных параметров по выборке малого объема  используют распределение Стьюдента (7.3.6). При построении доверительного интервала для математического ожидания речь идет о вероятности (7.3.1). Имеем

 или с учетом (7.3.6)

                                               .                                            (7.3.9)

Обозначая , получаем .

Таким образом, имеем

                                      .                                 (7.3.10)

Значение  определяется по вероятности  из табл. 5 приложения распределения Стьюдента. Затем, принимая во внимание, что , находим . Таким образом, доверительный интервал для оценки математического ожидания с неизвестным s имеет вид

                                         .                                     (7.3.11)

Задача 7.3.2. Случайная величина X имеет нормальное распределение. По выборке объемом n = 15 найдены выборочная средняя , “исправленное” среднее квадратическое отклонение . Определить интервальную оценку математического ожидания с доверительной вероятностью .

Решение. По табл. 5 приложения находим . Тогда . По формуле (7.3.11) получим доверительный интервал

.

Замечание. Пусть производится n независимых равноточных измерений некоторой физической величины, истинное значение которой  неизвестно и которая имеет нормальное распределение. Пусть  – результаты отдельных измерений, рассматриваемые как независимые случайные величины с одним и тем распределением, и имеют одно и то же математическое ожидание (истинное значение измеряемой величины), одинаковые дисперсии s2 (измерения равноточные). В этом случае истинное значение измерений физической величины оценивается с помощью среднего выборочного , для которого можно построить доверительный интервал (с неизвестным s) по методу, указанному в п. 2.

Задача 7.3.3. По данным 16-ти независимых равноточных измерений физической величины найдено выборочное среднее  и “исправленное” среднее квадратическое отклонение . Требуется оценить истинное значение случайной величины с надежностью .

Решение. Истинное значение измеряемой величины равно ее математическому ожиданию . Поэтому задача сводится к оценке математического ожидания (при неизвестном s) для нормального распределения с помощью доверительного интервала. Доверительный интервал находится с помощью формулы (7.3.11).

Используя табл. 5 приложения по =0,95 и , находим . Имеем

,

.

 

3. Доверительные интервалы для оценки среднего квадратического отклонения s нормального распределения

Пусть исследуемая случайная величина X генеральной совокупности распределена по закону N (a,s). По статистическим данным найдено “исправленное” среднее квадратическое отклонение S. Требуется найти для него доверительный интервал с надежностью g.

Требуется найти такое e > 0, чтобы выполнялось равенство

                                              .                                         (7.3.12)

Неравенство |s-S|<e с помощью ряда равносильных преобразований можно переписать в виде

.

 

Поэтому равенство (7.3.14) можно переписать в виде

P (|s-S|<e)=P ( <c< ) = g,                         (7.3.13)

где

.                                    (7.3.14)

Случайная величина (7.3.14) распределена по закону (имеет - распределение) с  степенями свободы. Плотность вероятности c-распределения с (n-1) степенями свободы имеет вид

Тогда равенство (7.3.13) можно переписать в виде . Из этого уравнения по заданным  и  можно найти ; для этого используется табл. 6 вероятности попадания случайной величины с - распределением в заданный интервал, зависящий от . После нахождения  доверительный интервал определяется равенством

                                            .                                       (7.3.15)

Задача 7.3.4. Количественный признак генеральной совокупности распределен по нормальному закону N (a,s). По выборке объема  найдено “исправленное” среднее квадратическое отклонение . Найти доверительный интервал для этой оценки с надежностью .

Решение. По табл. 6 приложения по и  найдем . Доверительный интервал имеет вид Ig = (1,24(1–0,44); 1,24(1+0,44)) = (0,69;1,79).

Замечание. В теории измерений принято точность измерений (точность измерительной системы) характеризовать с помощью s. Для оценки s используют “исправленное” среднее квадратическое отклонение . Поэтому для оценки точности измерений применяется доверительный интервал для , теория построения которого изложена выше.


Поделиться:



Последнее изменение этой страницы: 2019-05-08; Просмотров: 229; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.077 с.)
Главная | Случайная страница | Обратная связь