Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ, ВЫБОРКА.



ЛЕКЦИЯ №

СТАТИСТИКА

Математическая статистика разрабатывает математический аппарат прикладной статистики, т.е. находит и с помощью теории вероятностей обосновывает различные методы обработки и анализа результатов наблюдений.

Одна из задач статистики - сделать имеющуюся информацию более сжатой, систематизированной, четкой, наглядной. Здесь помощь оказывают как математические приемы, так и диаграммы, таблицы, графики.

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ, ВЫБОРКА.

Пусть требуется изучить совокупность однотипных объектов (людей, деталей, машин, заболеваний и пр.) относительно некоторого признака, количественного или качественного. Скажем, если объекты - это детали, то количественным признаком может быть контролируемый размер детали, а качественным - ее стандартность. В обоих случаях с деталью признак можем рассматривать как случайную величину X: в первом случае - непрерывную, во втором - как дискретную (условившись, что нестандартность детали означает (Х=0), а стандартность (Х=1)).

Все интересующее нас множество объектов (а также совокупность значений признака, присущего объектам) принято называть генеральнойсовокупностью.

В статистике применяют два основных подхода: метод сплошных наблюдений (описательная статистика) и выборочный метод. Метод сплошных наблюдений предполагает измерение всех элементов генеральной совокупности.

Выборочный метод основан на том, что из всей обследуемой совокупности, называемой генеральной, случайно отбирают часть элементов. Эту выбранную совокупность элементов называют выборкой и задают в виде х1 , хг ....,хn, где n - число выбранных элементов (объем выборки), x1 - значение исследуемого признака у первого элемента, х2 - значение признака у второго элемента и т.д.

Как видим, отличие метода сплошных наблюдений от выборочного метода в том, что при первом методе принимаются во внимание все имеющиеся в наличии элементы (объекты, единицы) совокупности, а при втором - выводы о свойствах всей генеральной совокупности делаются на основе анализа взятой из нее случайным образом части -выборки. Это существенно экономит время, силы и средства.

В ряде случаев генеральную совокупность большого объема мыслят как бесконечную, понимая под ней не только массу уже имею­щихся элементов, но и совокупность тех, какие появятся в будущем. Эта абстракция упрощает вычисления и позволяет сделать прогноз на будущее.

Случайный выбор элемента рассматривается как независимое наблюдение над случайной величиной X, распределенной так, как распределен признак в генеральной совокупности.

Те значения х1 , х2....,хn, какие признак X принял в n наблюдениях, называются реализациями cл.величины X.

Они образуют конкретную выборку 1 , х2,...,хn), на основании которой исследователь строит выводы о генеральной совокупности.

Выборочный метод широко применяется как в технике, так и в общественных и коммерческих исследованиях. В США, например, в большинстве крупных городов существуют коммерческие агентства, которые по заказам планируют и проводят выборочные исследования. В промышленности, торговле и обслуживании пользуются выборочным методом, чтобы повысить результативность работы предприятий. Опросы общественного мнения, финансовый контроль, контроль качества продукции - также сфера приложения этого метода.

Выборка называется представительной (репрезентативной), если она достаточно хорошо представляет вероятностные свойства генеральной совокупности. Репрезентативность выборки обычно достигается случайностью выбора, когда каждому элементу обеспечивается равная со всеми остальными элементами вероятность попасть в выборку.

УПРАЖНЕНИЯ.

Доказать тождество

2. Доказать, что:

а) при увеличении каждого элемента Xi выборки на 10 выбороч­ное среднее х увеличится на 10, a S2 не изменится.

б) при увеличении каждого элемента х1 выборки в 10 раз х среднее также возрастет в 10 раз, а дисперсия S2 в 100 раз.

В теории вероятностей употребляются характеристикизаконараспределения:

 

Деление на среднеквадратическое в соответствующей степени делает эти характеристики безразмерными. Асимметрия равна нулю для сим­метричных распределений, она больше нуля, если "хвост" распреде­ления тянется вправо.

У нормального распределения асимметрия и эксцесс нулевые. Если эксцесс больше нуля, это, как правило, означает, что график плотности в окрестности моды имеет более острую и более высокую вершину, чем нормальная кривая. Для более плосковершинных, чем нормальное, распределений эксцесс отрицателен.

По выборке мы находим приближенные значения асимметрии и эксцесса, строим оценки:

асимметрия выборки = m3/ S3 (4)

эксцесс выборки = m4/ s4 - 3 (5)

Когда наблюдения проводятся над системой (Х,У) двух случай­ных величин, то выборка состоит уже из пар чисел - значений Хи У: ( x1.,yi), (х2 , y2 ),.... (хn , yn ). Поxiмы можем построить расс­мотренные статистические моменты для X, по уi - для У. Связь меж­ду X и У, точнее, меру близости этой связи к линейной, выражает коэффициент корреляции:

Заменой средних μx μy на выборочные средние и дисперсий

на выборочные дисперсии получим оценку дляρxy-выборочный коэффициент корреляции rxy:

(6)

Эту формулу легко преобразовать к виду:

Как иρxy, выборочный коэффициент корреляции rxy заключен между -1 и +1. Если rxy =±1, то точки (х11 ) лежат строго на пря­мой, т.е. имеет место строгая линейная зависимость.

Пример 10. Испытана рессорная сталь на прочность прикруче­нии и изгибе. Х - прочность при кручении, У - прочность приизги­бе; (x1, y1 ) - прочность при кручении и изгибе i-ro образца стали.

Вычислить выборочный коэффициент корреляции rxy по выборке объема n=12, заданной в двух столбцах таблицы 3.

Таблица 3

Вычисление гxy

N   X1   У1   ∆X   ∆y   (∆X)2 (∆Y)2 (∆X) ∆Y  
исп.                              
      -37   -21        
      -21   -16        
      -4   -3        
      -7   -2        
               
               
      -17   -3        
        Q        
               
        -1       -3  
               
        -2       -2  
∑       -1          

 

∆x обозначает разность , а ∆у обозначает .

Сумма чисел в столбцах ∆x и ∆y теоретически должна всегда равняться нулю. В столбце ∆x сумма оказалась равной -1 (ане 0), потому что вместо точного значения х=87.9 было использовано ок­ругленное значение 88.

Выборочные дисперсии:

Выборочный коэффициенткорреляции:

Как видим, в среднем прочность на кручение почти вдвое боль­ше, чем при изгибе.

Близость коэффициента корреляции к 1 говорит о практически линейной связи между Х и У.

Статистические моменты вычисляются по случайной выборке и потому являются сл. величинами. Поэтому следует различать две ве­щи:

1) статистический момент как cл. величину и 2) конкретное значение этого момента, наблюденное по конкретной выборке. Для определенности рассмотрим выборочное среднее. Его следовало бы обозначить среднее X, когда выборочное среднее есть cл. величина, и обоз­начить среднее х, когда мы говорим о реализации х, т.е. о среднем арифме­тическом значении элементов конкретной выборки.

Точно так же и выборку, строго говоря, следует понимать в двух смыслах: 1) как систему (Х1 ,X2 , ...,Хn) n независимых одина­ково распределенных cл. величин, у каждой из которых закон расп­ределения тот же, что у cл. величины X, над которой проводятся наблюдения, и 2) как конкретную выборку x1 , x2,... xn, где x1 реализация cл. величины Х1 , ....xn -реализация величины Хn.

Выясним, какому закону подчиняется выборочное среднее Х=Хn, если наблюдения проводятся над нормальной cл. величиной

Как сумма нормальных величин X12+...+Хn,

 

числитель величины подчиняется нормальному закону. Найдем математическое ожидание и дисперсию величины «среднее X»

 

Таким образом (8)

Интуитивно ясно, что если взять ряд выборок (из n элементов каждая), то средние этих выборок должны вести себя куда более стабильно, чем исходная сл. величина X: меньше отклоняться μ и меньше "прыгать" от одной выборки к другой. Формула (8) это подтверждает: у величины среднее X тот же центр μ распределения, но дисперсия в n раз меньше: б2x- = б2/n.

Пример. Каким следует взять объем выборки п, чтобы выбо­рочное среднее подчинялось закону N(μ,0.1), если Х ~ N(μ,5)?

0.1 = DX = б2x-= 5/n, n=5/0.1=50.

По поводу формулы (8) надо добавить следующее. Соотношения MX = MX и DX = DX/n выведены без учета требования нормальности.

Если число наблюдений n велико, то каким бы ни было распределение у X, в силу центральной предельной теоремы выборочное среднее Хn подчиняется закону, близкому к нормальному; тем более близкому, чем больше n и чем ближе к нормальному закон распределения величины X. Так что формула (8) приближенно верна всегда.

С ростом объема n выборки плотность вероятности для среднее Хn концентрируется около центра μ и имеет нормальный вид, высота графика плотности пропорциональна n1/2

ВЫБОРОЧНЫЕ РАСПРЕДЕЛЕНИЯ

Эмпирическая функция распределения. По вариационному ряду или выборке легко построить эмпирическую функцию распределения F*(x) - оценку истинной функции распределения F(x) = P(X<x).

 
 


= число точек выборки, лежащих левее т х на оси ох, или

доля точек выборки слева от т. х. Так, = 0.4 означает, что в выборке 40% чисел имеют значение меньшее трех.

График строим так. Двигаясь слева направо вдоль оси ох, на каждой точке х1 ряда рисуем скачок функции, равный 1/n; меж­ду любыми соседними точками х1 и х1+1 функция постоянна, т.е. график - кусочно постоянная функция, имеющая ступенчатый вид.

Слева от точки х.( 1) равна О, справа от точки х.(n) - равна 1.

Теорема Гливенко

Советским математиком Гливенко была доказана теорема: При числе испытаний, стремящихся к бесконечности эмпирическая функция распределения равномерно сходится к теоретической функции распределения.

Пример 12. Построить график для выборки:

{0.17, 1.53, 0.99, 2.04, 0.56, 1.73, 0.95, 1.25, 0.75, 1.82}, n=10.

Упорядочим выборку: {0.17, 0.56, 0.75, 0.95, 0.99, 1.25, 1.53, 1.73, 1.82, 2.04}, и нанесем точки х( 1)(2) , ... , х(10) на ось х. Высота каждой ступеньки графика равна 1/n = 0.1 и число x n=10 .

Эмпирическая функция по статистическому распределению строится точно так же, как функция распределения дискретной cл. величины строится по ряду распределения вероятностей.

Сравним функции и F. F - неизвестная и неслучайная функ­ция, интересующая исследователя. Функция F содержит всю информа­цию о соответствующей величине X, ее можно назвать истинной или теоретической функцией и по ней можно найти, в частности, МХ и DХ и другие моменты распределения.

- функция, находимая по случайной выборке и потому слу­чайная.

С ростом объема n выборки функция приближается к F и

при большом n - практически совпадает с F.

При большом числе наблюдений над непрерывной cл. величиной X прибегают к группировке данных: ось х разбивают на 10-15 интерва­лов , I2 , . . . ,IК . Пусть - число наблюдений, попавших в интервал .

Длины интервалов не обязательно одинаковы.

По сгруппированным данным выборочное распределение выражают разными графиками, в первую очередь это:

1) кумулятивная кривая распределения (или график накопленной

частоты) - аппроксимация эмпирической функции распределения ;

2) гистограмма;

3) полигон частот.

Строятся они так.

Кумулятивная кривая. Взяв на оси ох точку - правый конец интервала = 1,2,...,к - отложим в ней по оси ординат накопленную частоту .

Построенные точки плоскости соединим последовательно прямоли­нейными отрезками. В точках разбиения кумулятивная кривая сов­падает с эмпирической функцией распределения , а между этими точками меняется линейно.

Гистограмма. На каждом интервале Ij оси абсцисс строим пря­моугольник с высотой hj = mj/(nIj), обеспечивающей площадь прямо­угольника, равную частоте mj/n (здесь lj= - длина интерва­ла Ij). Вся площадь под графиком гистограммы равна 1. Другой ва­риант гистограммы получим, если высоту hj берем равной mj , а все длины lj одинаковы.

Полигон. В середине каждого интервала Ij разбиения строим ординату, равную mj/n - частоте попадания наблюдений в этот ин­тервал. Соединяем полученные точки прямолинейными отрезками.

Другой вариант полигона получим, соединяя отрезками середины верхних сторон прямоугольников, образующих гистограмму.

Гистограмма и полигон являются эмпирическими аналогами плот­ности вероятности. Если n увеличивать, а длины lj интервалов уменьшать, то гистограмма и полигон неограниченно приближаются к кривой плотности вероятности cл. величины.

Пример 13. Построить три указанные кривые по сгруппированным данным, представленным в таблице 4 частот, n=200.

Таблица Сгруппированные данные

N интер-                          
вала                                            
Гранииы ин-                          
тервала Ij                          
Число mj                        
наблюдений                                              
Частота mj/n   0.035   0.055   0.075   0.120   0.245   0.205   0.130   0.085   0.035   0.015    

На рисунках 5,6 представлены три выборочные распределения. В

частности, на рис.5 в точке х=115 высота кумулятивной кривой W(х) равна 0.035+0.055+0.075=0.165, в точке х=140 W(х)=0.95, а W(150) = 1 .

 
 

Высота гистограммы в точке х=117 (рис.6) равна m4/nl = 0.120/5 = 0.024.

МЕТОД МОМЕНТОВ

Если параметр распределения сам является моментом, как МХ или DХ, то за его оценку в этом методе берут соответствующий статистический момент (например, или ). Когда интересует характеристика θ распределения, отличная от начального или центрального момента, ее выражают как функцию одного или нескольких моментов и затем в качестве аргументов этой функции вместо теоретических моментов подставляют статистические.

Например, если , то .

Пример. Найти формулу для оценки методом моментов срединного отклонения Е нормального распределения. Срединное отклонение , поскольку для нормальной величины X ~ N(μ,б2) вероятность Р{μ - 0, 674б<Х<μ+0, 6746 } = 1/2 .

Заменяя дисперсию в формуле на S2 - статистический центральный момент второго порядка, получим оценку срединного отклонения:

.

Пример.

Пусть неизвестный параметр - математическое ожидание. Тогда в нормальном распределении

Эта характеристика является состоятельной (закон больших чисел).

Пример.

Смещенная выборочная характеристика.

Пусть в нормальном распределении следует оценить дисперсию. Положим в качестве выборочной характеристики случайную величину

=

=

= ,

т.к.

Доказать, что выборочная характеристика

=

является несмещенной для дисперсии

=

ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ

Мы видели, что точечная оценка параметра есть случайная величина, имеющая некоторый разброс возле истинного значения параметра, а потому мы допускаем какую-то ошибку, приравнивая истинное значение параметра численному значению оценки. Здесь же мы рассмотрим вопрос получения интервальных оценок, т.е. возможность построения некоторого интервала, содержащего (накрывающего) истинное значение параметра с заданной вероятностью. Эту вероятность β называют по-разному: доверительной вероятностью, коэффициентом доверия или гарантией, а построенный интервал - доверительным. Доверительный интервал для параметра θ, соответствующий доверительной вероятности β, обозначим Iβ(θ) - это интервал для θ, построенный по случайной выборке (и потому случайный) и накрывающий истинное значение θ (постоянное и обычно неизвестное нам) с заданной вероятностью β, т.е.

(13)

Величина β влияет на величину интервала Iβ(θ): чем больше β, тем шире интервал. Принято брать β равным 0,95 или 0,99. Если, приняв β=0,99, мы по выборкам будем строить доверительные интервалы, то в среднем 1 на 100 интервалов не будет содержать истинное значение θ параметра, т.е. будет лежать в стороне от. θ (какой именно один из ста мы, конечно, не знаем, поскольку θ не известно).

Чтобы понять метод построения доверительных интервалов в простейших задачах, рассмотрим некоторые из них.

 

Пример 21.

По выборке с n=16 для нормальной величины с известной дисперсией σ2=64 найдено х=200. Построить доверительный интервал для генерального среднего (иначе говоря, для математического ожидания) μ, приняв β=0,95.

Решение. I β(μ)= ± δ, где δ = Кβσ/ -> Кβσ/ =1.96*8/ = 4

I0.95(μ)=200 4=(196;204).

Делая вывод, что с гарантией β=0,95 истинное среднее принадлежат интервалу (196,204), мы понимаем, что возможна ошибка.

Из 100 доверительных интервалов I0. 95 (μ) в среднем 5 не содержат μ.

Пример 22.

Каким в условиях предыдущего примера 21 следует взять n, чтобы вдвое сузить доверительный интервал? Чтобы иметь 2δ=4, надо взять

На практике часто пользуются односторонними доверительными интервалами. Так, если полезны или не страшны высокие значения μ, но не .приятны низкие, как в случае с прочностью или надежностью, то резонно строить односторонний интервал. Для этого следует максимально поднять его верхнюю границу. Если мы построим, как в примере 21, двусторонний доверительный интервал для заданного β, а затем максимально расширим его за счет одной из границ, то получим односторонний интервал с большей гарантией β' = β + (1-β) / 2 = (1+β)/2, например, если β = 0,90, то β = 0,90 + 0,10/2 = 0,95.

Например, будем считать, что речь идет о прочности изделия и поднимем верхнюю границу интервала до . Тогда для μ в примере 21 получим односторонний доверительный интервал (196,°°) с нижней границей 196 и доверительной вероятностью β'=0,95+0,05/2=0,975.

Практическим недостатком формулы (15)_является то, что она выведена в предположении, что дисперсия = σ2 (отсюда и = σ2/n) известна; а это бывает в жизни редко. Исключение составляет случай, когда объем выборки велик, скажем, n измеряется сотнями или тысячами и тогда за σ2 можно практически принять ее оценку s2 или .

Пример 23.

Положим, в некотором большом городе в результате выборочного обследования жилищных условий жителей получена следу­ющая таблица данных (пример из работы [6]).

Таблица 8

Исходные данные к примеру

Общая (полезная)   До   5.0-   10.0-   15.0-   20.0-   25.0-   Более  
площадь жилищ,   5.0   10.0   15.0   20.0   25.0   30.0   30.0  
приходящаяся на                              
1 человека, м                              
Число жителей                

 

Естественно допустить, что сл. величина X - общая (полезная) площадь (в м2), приходящаяся на одного человека подчиняется нор­мальному закону. Среднее μ и дисперсия σ2 не известны. Для μ тре­буется построить 95%-ный доверительный интервал. Чтобы по группи­рованным данным найти выборочные средние и дисперсию, составим следующую таблицу выкладок (табл.9).

Таблица 9

Вычисления X и 5 по сгруппированным данным

N группы з Общая площадь в расчете на 1 человека, м2 Число жителей в группе гj Середина интервала xj rjxj rjxj2
До 5.0 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
более 30.0 32.5 * 2697.5 87668.75
    - 19005.0 412250.0

В этой вспомогательной таблице по формуле (2) подсчитаны первый и второй начальные статистические моменты а1 и а2

 

Хотя дисперсия σ2 здесь неизвестна, из-за большого объема выборки можно практически применить формулу (15), положив в ней σ= =7.16.

Тогда δ=k0.95σ/ =1.96*7.16/ =0.46.

Доверительный интервал для генерального среднего при β=0,95 равен I0.95 (μ) = ± δ = 19 ± 0.46 = (18.54; 19.46).

Следовательно, среднее значение площади на одного человека в данном городе с гарантией 0.95 лежит в промежутке (18.54; 19.46).

 

2. Доверительный интервал для математического ожидания μ в случае неизвестной дисперсии σ2 нормальной величины. Этот интервал для заданной гарантии β строится по формуле ,где ν = n-1 ,

(16)

Коэффициент tβ,ν имеет тот же смысл для t – распределения с ν степенями свободы, что кβ для распределения N(0,1), а именно:

.

Другими словами, сл. Величина tν попадает в интервал (-tβ,ν; +tβ,ν) с вероятностью β. Значения tβ,ν даны в табл.10 для β=0.95 и β=0.99.

Таблица 10.

Значения tβ,ν

Число степеней ν
t0.95,ν 4.3 2.57 2.23 2.13 2.09 2.04 2.00 1.96
t0.99,ν 9.92 4.03 3.17 2.95 2.84 2.75 2.66 2.576

Возвращаясь к примеру 23, видим, что в нем доверительный интервал был построен по формуле (16) с коэффициентом tβ,υ=k0..95=1.96, т. к. n=1000.

Пример 24.Построить 99%-ный доверительный интервал для генерального среднего диаметра Д валика по "пробе" из 10 деталей, сработанных на токарном автомате, если отклонения х1 размеров этихваликов от номинального размера оказались следующими (в мк): 2, 1, -2, 3, 2, 4, -2, 5, 3, 4; n=10.

Находим

Строим доверительный интервал для среднего μ (отсчитываемого также от номинального размера) из условия

.

В таблице 10 для числа степеней свободы ν=10-1=9 1%-ный предел t0.99:9 отсутствует, есть для ν=5 и для ν=10: t0.99:5=4,03; t0.99:10=3,17. Линейная интерполяция дает t0.99:9= Откуда

Таким образом, согласующиеся с нашими опытными данными, иными словами, "допустимые" (с гарантией 99%) значения параметра μ лежат в интервале (-0.55, 4.55). Если коэффициент получать не интерполяцией, а из более подробных таблиц, то найдем точнее =3.25 и интервал Iβ(μ) будет чуть уже.

Заметим, что если бы мы приняли число s=2.28 за значение параметра б и применим формулу, то "классические" 99%-ные доверительные границы были бы значительно уже. В самом деле, вместо =3,34 мы бы взяли =2,58 и получили δ= , т.е. оказалось бы Этим мы значительно преувеличили бы действительную точность нашей оценки.

Пример 26.

Пусть частота безотказной работы при первых n испытаниях ракеты составила 0,96. Построить доверительный интервал для вероятности р безотказной работы ракеты в двух случаях х: а) n=1000, б) n=100.

Принять β=0.95

Решение.

а)

б)

В случае б) доверительный интервал крайне груб, поскольку требование npq > 10 не выполнено: npq и следует найти точный доверительный интервал для р, основанный на биноминальном распределении.

ПРИМЕРЫ

Рассмотрим сначала задачи проверки гипотез об интересующем нас параметре θ вида:

1) H0: θ=θ0; H1: θ θ0,

2) H0: θ=θ0; H1: θ<θ0,

3) H0: θ=θ0; H1: θ>θ0.

где θ0 - заданное конкретное число.

Такие гипотезы можно проверить посредствен построения доверительного интервала для θ.

Для проверки гипотезы вида 1) мы строим с доверительной вероятностью β=1-α доверительный двусторонний интервал Iβ (θ) для θ и проверяем, накрыл ли он число θ0.

Если θ0 Є Iβ(θ), то гипотеза Ho выдержала проверку, т.е. приемлема с уровнен значимости α. Если θ0 Iβ(θ), т.е. интервал не накрыл θ0, то гипотезу Н0 отбрасываем, принимая Н1.

При проверке гипотез вида 2) и 3) строится односторонний доверительный интервал, а именно, в случае 2) односторонний интервал Iβ(θ) с нижней границей хH; а в случае 3) с верхней границей хB . Если этот интервал покрывает θ0, гипотеза Н0 принимается, если не накрывает - отвергается.

Пример 29.

Допустим, при уровне значимости α=0,05, проверяется гипотеза Но: μ=109 против альтернативной, Н1: μ 109 для генерального среднего μ сл.величины X~N(μ, σ2 }. X - длина детали, μ=MХ. По техническим требованиям среднее μ должно равняться номинальному размеру μо=109, что и проверяется на основе выборки из n=31 детали. Их размеры мы здесь не приводим, а сразу даем подсчитанное выборочное среднее =100 и выборочную дисперсию s2=202. Находим доверительную вероятность β=1-α=1-0,05=0,95 и ν=n-1=30.

Далее .

=>гипотеза Н0 отклоняется. Вывод: генеральное среднее не равно по минимальному значению.

Пример 30.

При уровне значимости α=0,05 проверить гипотезу Н0: μ=106, H1: μ>106 по выборке предыдущего примера. Чтобы построить 95%-ый односторонний доверительный интервал для среднего, сначала строим 90%-ный двусторонний. . Но коэффициента t0.90.ν; нет в таблице 10. Зато в таблице 7 есть для сл.величины t30 квантиль уровня 0,95, равный 1,70. Значит, левее точки 1,70 лежит 0,95% площади распределения. А так как кривая t.-распределения симметричная, то 5% площади лежит не только правее точки 1,70, но и левее точки -1,70, а между -1,70 и +1,70 лежит 90% площади. Но t0.90.ν как раз обозначает такое число, что в интервале (-t0.90.ν; +t0.90.ν) заключено 90% площади, а остальная площадь поровну лежит слева и справа. Поэтому t0.90.30=1.70.

В результате

Двухсторонний доверительный 90%-й интервал найден: I0.90(μ)=100±6,2=(93,8; 106,2).

Опустив нижнюю границу интервала до - , мы увеличиваем доверительную вероятность β на величину и приходим к β=0.95.

Итак, получен 95% -й односторонний доверительный интервал для математического ожидания μ с верхней границей 106,2: I0.95(μ)=(- ; 106,2).

Число μо=106 принадлежит этому интервалу, поэтому приемлема гипотеза Н0 о том, что математическое ожидание μ (оно жe истинное среднее μ, генеральное среднее) равно 106.

Подчеркнем, что вывод о приемлемости основной гипотезы Н0, ее не противоречивости имеющимся данным не означают того, что доказана ее истинность. Так категорично утверждать нельзя. В последнем примере не противоречили бы тем же опытным данным гипотезы Н0: μ=100, или Н0: μ=105 и вообще бесконечное число промежуточных гипотез, из которых больше одной верной быть не может.

Не исключено, что основная гипотеза Н0 могла не противоречить данным только из-за их недостатка, а будь числo наблюдений больше в два-три раза, это противоречие наблюдениям выявилось бы.

Пример 31.

Сравниваются две марки бензина: А и В. На 11 автомашинах одинаковой мощности по кольцевому шассе испытан по разу Бензин марки А и В. Одна машина в пути вышла из строя н для нее данные по бензину В отсутствуют.






Читайте также:

Последнее изменение этой страницы: 2016-03-17; Просмотров: 228; Нарушение авторского права страницы


lektsia.com 2007 - 2017 год. Все права принадлежат их авторам! (0.204 с.) Главная | Обратная связь