Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Оценки параметров распределения



По виду таблицы относительных частот или гистограммы можно строить гипотезу об истинном характере распределения величины Х. На практике, однако, редко встречается такое положение, когда изучаемый закон распределения неизвестен полностью. Чаще всего дело обстоит так, что вид закона распределения ясен заранее (из каких–либо теоретических соображений), а требуется найти только некоторые параметры, от которых он зависит.

Итак, допустим, что закон распределения случайной величины Х содержит некоторый параметр q. Численное значение этого параметра не указано (хотя оно и является вполне определенным числом). В связи с эти возникает следующая задача: исходя из набора значений х1, х2, …, х n величины Х, полученного в результате п независимых опытов, оценить значение параметра q.

Любая оценка для q –– обозначим ее  –– будет представлять собой, естественно, некоторое выражение, составленное из х1, х2, …, х n:

.

Тем самым  будет случайной величиной (принимающей свои значения в результате п опытов над Х).

Любой параметр  найденный по выборке, извлеченной из генеральной совокупности Х, является подходящей оценкой параметра q
этой совокупности, если:

                       1) ;

                       2) ;

                       3) дисперсия  является минимальной.

Параметр , удовлетворяющий условиям 1–3, называется соответственно несмещенной, состоятельной и эффективной оценкой параметра q генеральной совокупности признака Х.

Пусть х1, х2, …, х n –– выборка из генеральной совокупности.

Выборочной средней хВ называется число

.                                   (1)

Если х i –– варианты выборки, ni –– частоты вариант х і(і = 1, …, k),  –– объем выборки, то

.                                         (2)

Выборочная средняя является несмещенной, состоятельной и эффективной оценкой для математического ожидания генеральной совокупности.

Пример 1. Выборочным путем были получены следующие данные о массе 20 морских свинок при рождении (в г): 30, 30, 25, 32, 30, 25, 33, 32, 29, 28, 27, 36, 31, 34, 30,23, 28, 31, 36, 30. Найти выборочную среднюю.

Итак,  г.

Если варианты х і –– большие числа, то для облегчения вычисления выборочной средней применяют следующий прием. Пусть С –– константа. Так как , то формула (1) преобразуется к виду:

.

Константу С (так называемый ложный нуль) берут такой, чтобы разности ui=xiC (условные варианты) были небольшими. В качестве С выгодно принять число близкое к выборочной средней. Поскольку выборочная средняя неизвестна, число С выбирают на «глаз».

Пример 2. Найти выборочную среднюю по данному распределению выборки объема п = 10:

 

х і 1250 1270 1280
ni 2 5 3

 

Решение. Первоначальные варианты –– большие числа, поэтому перейдем к условным вариантам и і = х і – 1270.

В итоге получим распределение условных вариант:

 

 

и і – 20 0 10
ni 2 5 3

 

Найдем искомую выборочную среднюю:

 

Выборочной дисперсией  называется среднее арифметическое квадратов отклонений наблюдаемых значений признака Х от выборочной средней .

Если все значения х1, х2, …, х k признака выборки объема п различны, то

                                        (3)

Если же значение признака х1, х2, …, х k имеют соответственно частоты п1, п2, …, п k, причем п1 + п2 + … + п k = п, то

Более удобна формула

Если первоначальные варианты х і –– большие числа, то целесообразно вычесть из всех вариант одно и то же число С, равное выборочной средней или близкое к ней, т.е. перейти к условным вариантам
ui = xiC (дисперсия при этом не изменится).

Тогда

Если первоначальные варианты являются десятичными дробями с k десятичными знаками после запятой, то, чтобы избежать действий с дробями, умножают первоначальные варианты на постоянное число С = 10k, т.е. переходят к условным вариантам ui= Cxi. При этом дисперсия увеличится в С2 раз. Поэтому .

Выборочная дисперсия  является состоятельной, но смещенной оценкой дисперсии . Несмещенной и состоятельной оценкой  является исправленная выборочная дисперсия

или

Величина S называется исправленным средним квадратичным отклонением.

Более удобна формула

.

В условных вариантах она имеет вид

,

причем если , то ; если , то . При малом объеме выборки (п £ 30) пользуются исправленной выборочной дисперсией S2; при больших же п (п > 30) практически безразлично, какой из двух оценок
(DB или S2) пользоваться.

Пример 2. Получена таблица частот пятибалльных оценок по контрольной работе у 40 учащихся класса:

 

Оценка 2 3 4 5
Относительная частота

 

Найти: а) выборочное среднее значение оценки; б) выборочную дисперсию; в) исправленную выборочную дисперсию; г) выборочное среднее квадратическое отклонение ; д) исправленное выборочное среднее квадратическое отклонение S.

Решение.

а)

б)

в)

г)

д)

Пример 3. С плодового дерева случайным образом отобрано 10 плодов. Их веса х1, х2, …, х10 (в граммах) записаны в первой колонке приведенной ниже таблицы. Обработаем статистические данные выборки. Для вычисления  и S введем ложный нуль С = 250 и все необходимые при этом вычисления сведем в указанную таблицу:

 

i xi xiC (xiC)2
1 2 3 4 5 6 7 8 9 10 225 274 305 253 220 245 211 234 230 231 – 25 24 55 3 – 30 – 5 – 39 – 16 – 20 – 19 625 576 3025 9 900 25 1521 256 400 261
Сумма   – 72   7598

 

Следовательно,

 (г);

Отсюда:  (г).

Итак, оценка генеральной средней веса плода равна 243 г со средней квадратической ошибкой 9 г.

Оценка генерального среднего квадратического отклонения веса плода равна 28 г.

Пусть проведено п опытов, в результате которых получены следующие значения системы величин (X, Y) : (xi, yi), i = 1, 2, …, n. За приближенные значения М(Х), М(Y), D(Х) и D(Y) принимают, как известно, их выборочные значения

Для характеристики связи признаков Х и Y вводится момент корреляции

.

Выборочным коэффициентом корреляции называют величину

Выборочный коэффициент корреляции r служит основной оценкой для тесноты связи между Х и Y.

Свойства выборочного коэффициента корреляции аналогичные свойствам коэффициента корреляции между случайными величинами Х и Y.

Коэффициент корреляции принимает значения на отрезке [– 1; 1], т.е.
–1 £ r £ 1.

В зависимости от того, насколько ½r½ приближается к 1, различают слабую, умеренную и сильную связь, т.е. чем ближе ½r½ к 1, тем связь теснее.

Если r = ± 1, то корреляционная связь между Х и Y представляет собой линейную зависимость.

Пример 5. Вычислить выборочный коэффициент корреляции по данным следующей таблицы:

xi 71 72 73 74 75 76 77 78 79 80
yi 8,6 8,9 8,9 9,0 9,1 9,2 9,2 9,2 9,3 9,4

Решение. Результаты наблюдений и нужные вычисления собраны в таблице. С = 70 и С¢ = 9,0 –– ложные нули.

 

xi yi xi – С yi – С ¢
71 72 73 74 75 76 77 78 79 80 8,6 8,9 8,9 9,0 9,1 9,2 9,2 9,2 9,3 9,4 1 2 3 4 5 6 7 8 9 10 – 0,4 – 0,1 – 0,1 0,0 0,1 0,2 0,2 0,2 0,3 0,4   – 4,5 –3,5 – 2,5 –1,5 – 0,5 0,5 1,5 2,5 3,5 4,5 20,25 12,25 6,25 2,25 0,25 0,25 2,25 6,25 12,25 20,25 – 0,48 – 0,18 – 0,18 0,08 0,02 0,12 0,12 0,12 0,22 0,32 0,2304 0,0324 0,0324 0,0064 0,0004 0,0144 0,0144 0,0144 0,0484 0,1024   2,16 0,63 0,45 – 0,12 – 0,01 0,06 0,18 0,30 0,77 1,44
Сумма   55 0,8   82,5   0,496 5,86
       

Вычисляем:

.

Так как модуль коэффициента корреляции близок к 1, то зависимость между Х и Y можно считать близкой к линейной.

 

Упражнения

1. Найти выборочную среднюю по данным следующей таблицы:

 

Длина хоботка у 6 пчел (в мм)

6,54 6,71 6,70 6,69 6,70 6,62

 

2. Выборочная совокупность задана таблицей распределения:

 

xi 4 7 10 15
п i 10 15 20 5

 

    Найти выборочные среднюю  и дисперсию DB.

3. Выборочным путем были получены следующие данные об урожайности ржи в совхозе:

 

Урожайность, ц/га Число, га
18 20 21 10 20 20

 

Определить выборочную среднюю  и исправленное среднее квадратическое отклонение S .

4. Ниже приведены результаты измерения роста (в см) случайно     отобранных 100 студентов.

 

Рост (см) 154–158 158–162 162–166 166–170 170–174 174–178 178–182
Число студентов 10 14 26 28 12 8 2

 

Найти выборочную среднюю и выборочную дисперсию роста     обследованных студентов.

Указание. Найти середины интервалов и принять их в качестве вариант.

5. Найти выборочную дисперсию по данному распределению выборки     объема п = 100:

 

xi 340 360 375 380
п i 20 50 18 12

 

Указание. Перейти к условным вариантам и i = xi360.

5. Найти исправленную выборочную дисперсию по данному распределению выборки объема п = 100:

 

xi 1250 1275 1280 1300
п i 20 25 50 5

 

Указание. Перейти к условным вариантам и i = xi1275.

7. Вычислить выборочный коэффициент корреляции по данным следующей     таблицы:

 

xi 92 91 90 86 85 85 85 83 80 78 80 83
у i 84 85 84 81 76 77 75 79 78 78 76 75

 

 


Поделиться:



Последнее изменение этой страницы: 2019-04-10; Просмотров: 1547; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.039 с.)
Главная | Случайная страница | Обратная связь