Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Графическое изображение статистического закона распределения дискретной и непрерывной случайных величин



В таблице 1.1 представлен статистический закон распределения дискретной с.в.

Определение 1.7 Полигоном частот называют ломаную линию, отрезки которой соединяют точки (х1, m1), (х2, m2), (х3, m3), …, (хk, mk). Для построения полигона частот на оси абсцисс откладывают варианты , а на оси ординат – соответствующие им частоты mi и соединяют точки (хi, , mi) отрезками прямых.

Определение 1.8 Полигон относительных частот строится аналогично, за исключением того, что на оси ординат откладываются относительные частоты (рисунок 1.1).

 

Рисунок 1.1 – Графическое изображение статистического закона
распределения дискретной случайной величины

Статистический закон распределения непрерывной случайной величины (см таблицу 1.2) изображается следующим образом. На горизонтальной оси откладываются границы ci ячеек, затем на каждом полуинтервале [ci; ci+1) строятся прямоугольники высотой , . Такой график называется гистограммой (рисунок 1.2).

 

Рисунок 1.2 – Графическое изображение статистического закона
распределения непрерывной случайной величины

1.5 Построение доверительных интервалов для математического ожидания и среднего квадратического отклонения нормально распределенной случайной величины Х

До сих пор мы рассматривали точечные оценки, т.е. такие оценки, которые определяются одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. В связи с этим при небольшом объеме выборки пользуются интервальными оценками.

Пусть дана случайная выборка

{x1, x2, …, xn} (1.10)

есть некоторая совокупность значений, полученных в результате наблюдения за n объектами, характеризующимися с.в. Х:

1, Х2, …, Хn}. (1.11)

И пусть по этой выборке вычислена оценка некоторого параметра θ.

Определение 1.9 Статистика называется точечной оценкой параметра .

В силу того, что оценка строится по выборке, . Поскольку истинное значение параметра θ нам не известно, то мы на самом деле не знаем, как сильно оценка отличается от θ . Но для практического применения оценки мы должны знать насколько этой оценке можно доверять. В таких случаях строится интервальная оценка параметра θ.

Определение 1.10 Доверительным интервалом для параметра θ называется интервал , границы которого вычисляются по выборке (причем ) и который«накрывает» истинное значение θ с наперед заданной достаточно большой вероятностью :

.

При этом величина называется доверительной вероятностью .

На практике доверительные вероятности обычно выбираются из множества .

Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение s этого распределения известно. Требуется оценить неизвестное математическое ожидание a по выборочному среднему . Найдем доверительные интервалы, покрывающие параметр a с надежностью .

Будем рассматривать выборочное среднее , как случайную величину (т.к. меняется от выборки к выборке), и выборочные значения , как одинаково распределенные независимые случайные величины (эти числа также меняются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно a и среднее квадратическое отклонение – s.

Если исследуемая случайная величина Х подчиняется нормальному закону распределения с параметрами m и σ 2, причем для параметров m и σ 2 вычислены их оценки:

,

,

то доверительный интервал для математического ожидания имеет вид

, (1.12)

где находят по таблице критических точек распределения Стьюдента при уровне значимости α / 2 и числе степеней свободы .

Доверительный интервал для дисперсии имеет вид

 

, (1.13)

где и находят по таблице критических точек распределения χ 2 при уровне значимости α / 2,

1-α /2 и числе степеней свободы .

Доверительный интервал для среднего квадратического отклонения легко получается из формулы (1.13):

. (1.14)

1.6 Построение доверительных интервалов для математического ожидания и среднего квадратического отклонения, если случайная величина Х имеет произвольную функцию распределения

Пусть дана случайная выборка и функция распределения исследуемой случайной величины неизвестна. В таком случае строятся непараметрические доверительные интервалы. Предварительно вычислим оценку для математического ожидания по формуле (1.5) и оценку для среднего квадратического отклонения по формуле (1.7).

Доверительный интервал для математического ожидания имеет вид:

, (1.15)

где – критическая точка стандартного нормального распределения при уровне значимости 1 – α / 2). Если a = 0, 05, то .

Доверительный интервал для дисперсии строится следующим образом:

, (1.16)

где,

, (1.17)

где .

Доверительный интервал для среднего квадратического отклонения исследуемой случайной величины имеет вид:

, (1.18)

 

где d – вычисляется по формуле (1.17).

Лабораторная работа № 1

ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ

Цель работы: ознакомиться с основными понятиями математической статистики и методикой проведения первичного исследования статистических данных.

Задание : При проведении экспериментов фиксировались значения случайной величины X, характеризующей цены на мужскую зимнюю обувь (у.е). Произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х.

Пример выполнения лабораторной работы №1.

1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке неубывания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.

 

Таблица 1.3 – Расчетная таблица

Номер п/п Выборка, у.е. Вариацион- ный ряд, у.е.,    
-42, 160 1777, 466 -74937, 950 3159383, 959
-38, 160 1456, 186 -55568, 042 2120476, 502
-38, 160 1456, 186 -55568, 042 2120476, 502
-30, 160 909, 626 -27434, 308 827418, 732
-27, 160 737, 666 -20034, 998 544150, 537
-25, 160 633, 026 -15926, 924 400721, 410
-23, 160 536, 386 -12422, 690 287709, 512
-23, 160 536, 386 -12422, 690 287709, 512
-22, 160 491, 066 -10882, 014 241145, 424
-22, 160 491, 066 -10882, 014 241145, 424
-21, 160 447, 746 -9474, 297 200476, 122
-18, 160 329, 786 -5988, 906 108758, 542
-14, 160 200, 506 -2839, 159 40202, 496
-13, 160 173, 186 -2279, 122 29993, 252
-11, 160 124, 546 -1389, 929 15511, 606
-9, 160 83, 906 -768, 575 7040, 150
-9, 160 83, 906 -768, 575 7040, 150
-8, 160 66, 586 -543, 338 4433, 642
-7, 160 51, 266 -367, 062 2628, 162
-6, 160 37, 946 -233, 745 1439, 869
-6, 160 37, 946 -233, 745 1439, 869
-4, 160 17, 306 -71, 991 299, 484
-4, 160 17, 306 -71, 991 299, 484
-1, 160 1, 346 -1, 561 1, 811
0, 840 0, 706 0, 593 0, 498
0, 840 0, 706 0, 593 0, 498
0, 840 0, 706 0, 593 0, 498
4, 840 23, 426 113, 380 548, 759
6, 840 46, 786 320, 014 2188, 892
6, 840 46, 786 320, 014 2188, 892
6, 840 46, 786 320, 014 2188, 892
6, 840 46, 786 320, 014 2188, 892
8, 840 78, 146 690, 807 6106, 735
9, 840 96, 826 952, 764 9375, 197
11, 840 140, 186 1659, 798 19652, 002
12, 840 164, 866 2116, 874 27180, 666
12, 840 164, 866 2116, 874 27180, 666
13, 840 191, 546 2650, 991 36689, 717
13, 840 191, 546 2650, 991 36689, 717
15, 840 250, 906 3974, 345 62953, 620
18, 840 354, 946 6687, 175 125986, 379
22, 840 521, 666 11914, 842 272134, 998
23, 840 568, 346 13549, 359 323016, 721
24, 840 617, 026 15326, 916 380720, 591
25, 840 667, 706 17253, 513 445830, 768
26, 840 720, 386 19335, 150 518955, 413
27, 840 775, 066 21577, 826 600726, 684
30, 840 951, 106 29332, 097 904601, 862
32, 840 1078, 466 35416, 810 1163088, 050
55, 840 3118, 106 174115, 017 9722582, 533
Итого 21562, 720 41605, 690 25342680, 292

2) Найдем размах выборки = = 183-85 = 98 у.е.

3) Вычислим длину интервала = = 14.

4) Границы интервалов:

= 85, = 85+14 = 99,

= 99+14 = 113, = 113+14 = 127,

= 127+14= 141, = 141+14 = 155, = 155+14= 169, =169 +14 =183 .

5) Построим интервальный статистический ряд:

 

Таблица 1.4 – Интервальный статистический ряд

Границы интервалов , у.е. Частоты Частости
[85, 99] 4/50
(99, 113] 9/50
(113, 127 ] 11/50
(127, 141] 16/50
(141, 155] 7/50
(155, 169] 2/50
(169, 183] 1/50
итого

 

6) Вычислим числовые характеристики.

В качестве оценки математического ожидания используется среднее арифметическое наблюденных значений. Эта статистика называется выборочным средним.

 

.

 

По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.

.

Для определения выборочного значения медианы используется вариационный ряд. В нашем случае объем выборки = 50 – четное число, т.е. в качестве оценки медианы примем

= .

В качестве оценки дисперсии используется статистика = .

Оценка среднего квадратического отклонения

= .

 

Оценка коэффициента вариации .

Оценка коэффициента асимметрии .

Оценка коэффициента эксцесса

.

7) Построим гистограмму частот.

Рисунок 1.3 – Гистограмма частот

8) Построим интервальные оценки для неизвестных истинных значений и .

Объем выборки составил n = 50. Требуется с доверительной вероятностью определить интервальные оценки:

а) для средней цены на зимнюю обувь;

б) для дисперсии цены на зимнюю обувь;

в) для среднего квадратического отклонения цены на зимнюю обувь.

а) Средняя цена на обувь характеризуется генеральной средней a. Требуется найти интервальную оценку параметра a с доверительной вероятностью .

Применяем формулу

,

 

где , , , , значение определяем по таблицам распределения Стьюдента для и . . Подставим найденные значения в формулу:

 

у.е.

 

Таким образом, с вероятностью можно гарантировать, что средняя цена зимней обуви находится в пределах: .

 

б) определим интервальную оценку для дисперсии цены на зимнюю обувь.

Интервальная оценка дисперсии

 

.

 

По таблице процентных точек -распределения (см. приложение Г) найдем

;

 

.

 

Следовательно, .

Значит с доверительной вероятностью можно утверждать, что истинное значение дисперсии будет находиться в интервале

в) С доверительной вероятностью можно утверждать, что истинное значение среднего квадратического отклонения s будет находиться в интервале

 

 

7) Произведем первичную обработку полученной выборки с помощью ЭВМ:

Summary Statistics for Col_1

Count
Average 127, 16
Median 128, 0
Mode 134, 0
Variance 440, 056
Standard deviation 20, 9775
Coeff. of variation 16, 4969%
Minimum 85, 0
Maximum 183, 0
Range 98, 0
Stnd. skewness 0, 276588
Stnd. kurtosis -0, 251092

Рисунок 1.4 – Компьютерный расчет

Confidence Intervals for Col_1

95, 0% confidence interval for mean: 127, 16 +/- 5, 96175 [121, 198; 133, 122]

95, 0% confidence interval for standard deviation: [19, 0704; 29, 7078]

 

The StatAdvisor

This pane displays 95, 0% confidence intervals for the mean and standard deviation of Col_1. The classical interpretation of these intervals is that, in repeated sampling, these intervals will contain the true mean or standard deviation of the population from which the data come 95, 0% of the time. In practical terms, we can state with 95, 0% confidence that the true mean Col_1 is somewhere between 121, 198 and 133, 122, while the true standard deviation is somewhere between 17, 5232 and 26, 1408.

 

Вывод. В результате исследования выборки значений непрерывной случайной величины, характеризующей цены на мужскую зимнюю обувь, получили следующие результаты, у.е: минимальная цена – 85, максимальная – 183, средняя цена на мужскую зимнюю обувь – 127, 16, наиболее вероятная цена – 134, средневероятная цена – 128, среднеквадратическое отклонение цены на мужскую зимнюю обувь от среднего значения составило 20, 978. Оценка коэффициента вариации составила 16, 5%, что указывает на небольшую колеблемость признака относительно среднего значения, оценка коэффициента асимметрии составила 0, 090, оценка коэффициента эксцесса составила -0, 329. С доверительной вероятностью можно гарантировать, что средняя цена зимней обуви находится в пределах: , истинное значение дисперсии будет находиться в интервале , истинное значение среднего квадратического отклонения s будет находиться в интервале

 

 

Порядок выполнения работы

1 Изучить теоретические сведения.

2 Получить у преподавателя выборку значений случайной величины.

3 Произвести вручную первичную обработку статистических данных:

– построить вариационный ряд;

– построить сгруппированный или интервальный статистический ряд и его графическое изображение;

– вычислить точечные оценки числовых характеристик изучаемой случайной величины.

4 Произвести первичную обработку полученной выборки с помощью ЭВМ:

– записать выборку на диск;

– вычислить оценки числовых характеристик;

– построить гистограмму частот исследуемой выборки;

– построить интервальные оценки для неизвестных истинных значений и .

5 Сравнить результаты, полученные при ручном расчёте и расчёте на ЭВМ.

6 Сделать вывод о свойствах изучаемой случайной величины.

Контрольные вопросы

1 Что называется случайной величиной? Какие типы случайных величин вы знаете?

2 Что называется генеральной совокупностью?

3 Что называется выборкой? Какими свойствами должна обладать выборка?

4 Какая выборка называется репрезентативной?

5 Что называется вариационным рядом?

6Укажите последовательность проведения первичной обработки статистических данных.

7 Что называется выборочной статистикой; статистической оценкой параметра? Что представляют собой точечные и интервальные оценки?

8 Какие требования предъявляются к статистическим оценкам?

9 Какие статистики используются в качестве точечных оценок основных числовых характеристик? Какими свойствами они обладают?


Поделиться:



Последнее изменение этой страницы: 2017-05-05; Просмотров: 806; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.075 с.)
Главная | Случайная страница | Обратная связь