Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Интервальный вариационный ряд



 

Индекс интервала i Число покупателей (интервалы) Частота Относительная частота
148-151 1/200
151-154
154-157 5/200
157-160 7/200
160-163 21/200
163-166 38/200
166-169 39/200
169-172 38/200
172-175 21/200
175-178 15/200
Окончание таблицы 5  
Индекс интервала i Число покупателей (интервалы) Частота Относительная частота
178-181 8/200
181-184 3/200
184-187 3/200
187-190 1/200

=1

 

2) После составления вариационного ряда необходимо построить функцию распределения выборки или эмпирическую функцию F*(x)= , то есть функцию найденную опытным путём. Здесь – относительная частота события Х< х, n - общее число значений.

Эмпирическое распределение можно изобразить в виде полигона, гистограммы или ступенчатой кривой.

 

Построим выборочную функцию распределения. Очевидно, что для функция так как . На концах интервалов значения функции рассчитаем в виде «нарастающей относительной частоты» (Таблица 6).

Таблица 6

Расчёт эмпирической функции распределения

 

Индекс интервала i
1/200
1/200
1/200+5/200=6/200
6/200+7/200=13/200
13/200+21/200=34/200
34/200+38/200=72/200
Окончание таблицы 6
Индекс интервала i
72/200+39/200=111/200
111/200+38/200=149/200
149/200+21/200=170/200
170/200+15/200=185/200
185/200+8/200=193/200
193/200+3/200=196/200
196/200+3/200=199/200
199/200+1/200=200/200

 

 

Табличные значения не полностью определяют выборочную функцию распределения непрерывной случайной величины, поэтому при графическом изображении её доопределяют, соединив точки графика, соответствующие концам интервала, отрезками прямой (рис.1).

Полученные данные, представленные в виде вариационного ряда, изобразим графически в виде ломаной линии (полигона), связывающей на плоскости точки с координатами , где - среднее значение интервала , а - относительная частота.(таблица 7 и рис.2). На этом же рисунке отобразим пунктирной линией выравнивающие (теоретические) частоты.

Таблица 7

Дискретный вариационный ряд

 

Номер интервала i Среднее значение интервала Относительная частота Выборочная оценка плотности вероятности
149, 5 0, 005 0, 002
152, 5
155, 5 0, 025 0, 008
Окончание таблицы 7
158, 5 0, 035 0, 012
161, 5 0, 105 0, 035
164, 5 0, 19 0, 063
167, 5 0, 195 0, 065
170, 5 0, 19 0, 063
173, 5 0, 105 0, 035
176, 5 0, 075 0, 025
179, 5 0, 04 0, 013
182, 5 0, 015 0, 005
185, 5 0, 015 0, 005
188, 5 0, 005 0, 002

 

 
 

Рис.1

 
 

Рис.2

 

На основании полученных выборочных данных необходимо сделать предположение, что изучаемая величина распределена по некоторому определённому закону. Для того чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты полученных в наблюдениях значений, т.е. находят теоретически сколько раз величина Х должна была принять каждое из наблюдавшихся значений, если она распределена по предполагаемому закону. Для этого находят выравнивающие (теоретические) частоты по формуле:

(7)

где n – число испытаний,

- вероятность наблюдаемого значения , вычисленная при допущении, что Х имеет предполагаемое распределение.

Эмпирические (полученные из таблицы) и выравнивающие частоты сравнивают, и при небольшом расхождении данных делают заключение о выбранном законе распределения.

Предположим, что случайная величина Х распределена нормально (см. комментарии к задаче № 4). В этом случае выравнивающие частоты находят по формуле:

(8)

где n-число испытаний,

h-длина частичного интервала,

-выборочное среднее квадратичное отклонение,

( - середина i – го частичного интервала)

– функция Лапласа (9)

Результаты вычислений отобразим в таблице №8.

Сравнение графиков (рис.2) наглядно показывает близость выравнивающих частот к наблюдавшимся и подтверждает правильность допущения о том, что обследуемый признак распределён нормально.

 

Таблица 8

Расчёт выравнивающих частот

 

   
149, 5 152, 5 155, 5 158, 5 161, 5 164, 5 167, 5 170, 5 173, 5 176, 5 179, 5 182, 5 185, 5 188, 5 -19, 5 -16, 5 -13, 5 -10, 5 -7, 05 -4, 05 -1, 05 1, 95 4, 95 7, 95 10, 95 13, 95 16, 95 19, 95 -3 -2, 53 -2, 06 -1, 59 -1, 11 -0, 64 -0, 17 0, 31 0, 78 1, 25 1, 73 2, 2 2, 67 3, 15 0, 004 0, 02 0, 048 0, 11 0, 22 0, 33 0, 396 0, 38 0, 3 0, 18 0, 09 0, 04 0, 011 0, 003 0, 42 1, 55 4, 54 10, 68 20, 37 31, 0 37, 48 36, 0 28, 0 17, 34 8, 44 3, 37 1, 06 0, 26 0, 05 0, 01 0, 025 0, 055 0, 1 0, 155 0, 185 0, 18 0, 14 0, 085 0, 04 0, 015 0, 005

Интервальный вариационный ряд графически изобразим в виде гистограммы (рис.3). На оси Х отложим интервалы длиной h=3, а на оси Y значения , расчёт которых представлен в таблице №7. Площадь под гистограммой равна сумме всех относительных частот, т.е. единице.

Графическое изображение вариационных рядов в виде полигона и гистограммы позволяет получать первоначальное представление о закономерностях, имеющих место в совокупности наблюдений.

 


Рис.3

 

3) Найдём числовые характеристики вариационного ряда, используя таблицу №4.

Выборочная средняя ( ):

или , (10)

где - частоты,

а -объём выборки. Выборочная средняя является оценкой математического ожидания (среднего значения теоретического закона распределения).

В некоторых случаях удобнее рассчитать с помощью условных вариант. В нашем случае варианты - большие числа, поэтому используем разность:

(11)

где С – произвольно выбранное число (ложный нуль). В этом случае

. (12)

Для изменения значения варианты можно ввести также условные варианты путём использования масштабного множителя:

, (13)

где (b выбирается положительным или отрицательным числом).

. Здесь С – середина 8-го интервала.

Выборочная дисперсия ( ):

(14)

также может быть рассчитана с помощью условных вариант:

(15)

= (1*441+0*324+…+1*324)- 1, 95² =40, 21

Среднеквадратическое отклонение:

= (16)

= =6, 34

Найдем несмещённую оценку дисперсии и среднеквадратического отклонения («исправленную» выборочную дисперсию и среднеквадратическое отклонение) по формулам:

и (17)

 

= =40, 41 и S= 6, 34=6, 36

Доверительный интервал для оценки математического ожидания с надёжностью 0, 95 определяют по формуле:

P( -t Ф(t)= (18)

Из соотношения Ф(z)= /2 вычисляют значение функции Лапласа: Ф(z)=0, 475. По таблице значений функции Лапласа ( Приложение А) находят z=1, 96. Таким образом,

168, 55-1, 96 ,

167, 67< a< 169, 43.

Доверительный интервал для оценки среднего квадратичного отклонения случайной величины находят по формуле:

, (19)

где S – несмещённое значение выборочного среднего квадратичного отклонения;

q – параметр, который находится по таблице (Приложение В) на основе известного объёма выборки n и заданной надёжности оценки .

На основании данных значений =0, 95 и n=200 по таблице (Приложение В) можно найти значение q=0, 099. Таким образом,

,

5, 79 <

V= (20)

4) Проведём статистическую проверку гипотезы о нормальном распределении. Нормальный закон распределения имеет два параметра (r=2): математическое ожидание и среднее квадратическое отклонение. По выборочным данным (таблицы 5 и 7) полученные оценки параметров нормального распределения, вычисленные выше:

, , S=6, 36.

Для расчёта теоретических частот используют табличные значения функции Лапласа Ф(z). Алгоритм вычисления состоит в следующем:

- по нормированным значениям случайной величины Z находят значения Ф(z), а затем :

, =0, 5+Ф( ).

Например,

; ; Ф(-3, 0)=-0, 4987;

;

- далее вычисляют вероятности =P( ;

- находят числа , и если некоторое < 5, то соответствующие группы объединяются с соседними.

Результаты вычисления , , и приведены в таблице 9.

По формуле

= (21)

можно сделать проверку расчетов.

По таблице (приложения Г) можно найти число по схеме: для уровня значимости α =0, 05 и числа степеней свободы l=k-r-1=9-2-1=6 =12, 6. Следовательно, критическая область - (12, 6; ). Величина =15, 61 входит в критическую область, поэтому гипотеза о том, что случайная величина Х подчинена нормальному закону распределения, отвергается.

При α =0, 1 =10, 6. Критическая область - (10, 6; ). Величина =15, 61 также входит в критическую область и гипотеза о нормальном законе распределения величины Х отвергается.

При α =0, 01 =16, 8, (16, 8; ). В этом случае нет оснований отвергать гипотезу о нормальном законе распределения.

Таблица 9

Определение

 

i Ф( )
149, 5 -0, 500 0, 000 0, 0013 0, 0013 0, 26 -
149, 5 152, 5 -0, 449 0, 0013 0, 0059 0, 0046 0, 92 -
152, 5 155, 5 -0, 494 0, 0059 0, 02 0, 014 2, 8 -
155, 5 158, 5 -0, 48 0, 02 0, 057 0, 037 7, 4 2, 54
158, 5 161, 5 -0, 44 0, 057 0, 134 0, 077 15, 4 4, 58
161, 5 164, 5 -0, 37 0, 134 0, 26 0, 126 25, 2 0, 7
164, 5 167, 5 -0, 24 0, 26 0, 433 0, 1725 34, 5 0, 36
167, 5 170, 5 -0, 07 0, 433 0, 62 0, 188 37, 6 0, 06
170, 5 173, 5 0, 12 0, 62 0, 78 0, 16 1, 125
173, 5 176, 5 0, 28 0, 78 0, 89 0, 11 0, 045
176, 5 179, 5 0, 39 0, 89 0, 96 0, 07 0, 071
179, 5 182, 5 0, 46 0, 96 0, 99 0, 03 6, 125
182, 5 185, 5 0, 49 0, 99 0, 996 0, 006 1, 2 -
185, 5 188, 5 0, 496 0, 996 0, 999 0, 003 0, 6 -
188, 5 0, 5 0, 999 1, 0 0, 001 0, 2 -

, 0000

2 часть

1) Данные таблицы 3 сгруппируем в корреляционную таблицу 10.

2) Строим в системе координат множество, состоящее из 200 экспериментальных точек (рисунок 4).

По расположению точек делаем заключение о том, что экономико-математическую модель можно искать в виде .

3) Найдём выборочные уравнения линейной регрессии.

Для упрощения расчётов разобьём случайные величины на интервалы и выберем средние значения. Для величины Х указанные действия были выполнены в 1 части задания.

Таблица 10

Корреляционная таблица

 

  Y/X
                                           
                                           
                                         
                                         
                                           
                                       
                                       
                                   
                                 
                                 
                           
                               
                                   
                             
                             
                               
                           
Продолжение таблицы 10
                             
                         
                                 
                                 
                                   
                             
                                           
                                       
                                         
                                       
                                         
                                           
                                           
                                           
                                           
                                         
                                             
                                           

 
 

Рис.4

Для случайной величины Y, используя (1), получим h=2, число интервалов равно 13. Результаты внесём в таблицу со сгруппированными данными №11.

Находим средние значения , по формулам:

 

, (22)

, (23)

, (24)

. (25)

 

149, 5*86+155, 5(82+…+90)+…+188, 5*104=2986101

 

Используя формулы:

, (26)

, (27)

 

получим

 

= , =

 

 

Таблица 11

Сгруппированные данные выборки

 

   
  XY 149, 5 152, 5 155, 5 158, 5 161, 5 164, 5 167, 5170, 5173, 5 170, 5 173, 5 176, 5 179, 5 182, 5 185, 5 188, 5
                   
             
           
         
           
     
             
                 
                     
                     
                         
                             
                         
   

 

4) Вычисляем выборочный коэффициент корреляции по формуле:

. (28)

=

Принято считать, что если 0, 1< < 0, 3 – связь слабая, если 0, 3< < 0, 5 – связь умеренная, если 0, 5< < 0, 7 – связь заметная, если 0, 7< < 0, 9 – связь высокая, если 0, 9< < 0, 99 – связь весьма высокая.

Для данного примера связь между X и Y умеренная.

Затем получают выборочное уравнение линейной регрессии Y на X в виде:

(29)

и выборочное уравнение линейной регрессии X на Y:

. (30)

и

или

Вычисления сумм рекомендуем проводить с помощью пакетов прикладных математических программ (сегодня их существует много).

 

КОНТРОЛЬНЫЕ ЗАДАНИЯ № 1-№ 4

Вариант 1.

1. Фирма имеет три источника поставки комплектующих – фирмы А, В и С. На долю фирмы А приходится 50% общего объема поставок, В – 30% и С – 20%. Из практики известно, что 10% поставляемых фирмой А деталей бракованные, фирмой В – 5% и фирмой С – 6%.

1) Какова вероятность, что взятая наугад деталь была получена от фирмы А?

2) Какова вероятность, что взятая наугад и оказавшаяся бракованной деталь получена от фирмы А?

2. Накануне выборов 40% населения поддерживают «Партию квадратов», 40% - «Партию Кругов» и 20% еще не определились во мнении. Какова вероятность того, что, по крайней мере, половина из шести наудачу выбранных избирателей оказывают доверие «Партии квадратов»?

3. Имеется 8 изделий, из которых 3 дефектных. Для контроля взято наудачу 3 изделия. Случайная величина Х – число дефектных изделий в выборке.

1) Составить таблицу распределения Х.

2) Найти математическое ожидание M(X) и дисперсию D(Х).

3) Построить график функции распределения y = F(x)

4) Найти вероятность P(0, 5< X< 3).

4. Фирма «Клубок ниток» производит вязальные спицы. Наиболее популярны размеры

 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-09-01; Просмотров: 785; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.094 с.)
Главная | Случайная страница | Обратная связь