Интервальный вариационный ряд

Индекс интервала i	Число покупателей (интервалы)	Частота	Относительная частота
	148-151		1/200
	151-154
	154-157		5/200
	157-160		7/200
	160-163		21/200
	163-166		38/200
	166-169		39/200
	169-172		38/200
	172-175		21/200
	175-178		15/200
Окончание таблицы 5
Индекс интервала i	Число покупателей (интервалы)	Частота	Относительная частота
	178-181		8/200
	181-184		3/200
	184-187		3/200
	187-190		1/200

2) После составления вариационного ряда необходимо построить функцию распределения выборки или эмпирическую функцию F*(x)= , то есть функцию найденную опытным путём. Здесь – относительная частота события Х< х, n - общее число значений.

Эмпирическое распределение можно изобразить в виде полигона, гистограммы или ступенчатой кривой.

Построим выборочную функцию распределения. Очевидно, что для функция так как . На концах интервалов значения функции рассчитаем в виде «нарастающей относительной частоты» (Таблица 6).

Таблица 6

Расчёт эмпирической функции распределения

Индекс интервала i
	1/200
	1/200
	1/200+5/200=6/200
	6/200+7/200=13/200
	13/200+21/200=34/200
	34/200+38/200=72/200
Окончание таблицы 6
Индекс интервала i
	72/200+39/200=111/200
	111/200+38/200=149/200
	149/200+21/200=170/200
	170/200+15/200=185/200
	185/200+8/200=193/200
	193/200+3/200=196/200
	196/200+3/200=199/200
	199/200+1/200=200/200

Табличные значения не полностью определяют выборочную функцию распределения непрерывной случайной величины, поэтому при графическом изображении её доопределяют, соединив точки графика, соответствующие концам интервала, отрезками прямой (рис.1).

Полученные данные, представленные в виде вариационного ряда, изобразим графически в виде ломаной линии (полигона), связывающей на плоскости точки с координатами , где - среднее значение интервала , а - относительная частота.(таблица 7 и рис.2). На этом же рисунке отобразим пунктирной линией выравнивающие (теоретические) частоты.

Таблица 7

Дискретный вариационный ряд

Номер интервала i	Среднее значение интервала	Относительная частота	Выборочная оценка плотности вероятности
	149, 5	0, 005	0, 002
	152, 5
	155, 5	0, 025	0, 008
Окончание таблицы 7
	158, 5	0, 035	0, 012
	161, 5	0, 105	0, 035
	164, 5	0, 19	0, 063
	167, 5	0, 195	0, 065
	170, 5	0, 19	0, 063
	173, 5	0, 105	0, 035
	176, 5	0, 075	0, 025
	179, 5	0, 04	0, 013
	182, 5	0, 015	0, 005
	185, 5	0, 015	0, 005
	188, 5	0, 005	0, 002

Рис.1

Рис.2

На основании полученных выборочных данных необходимо сделать предположение, что изучаемая величина распределена по некоторому определённому закону. Для того чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты полученных в наблюдениях значений, т.е. находят теоретически сколько раз величина Х должна была принять каждое из наблюдавшихся значений, если она распределена по предполагаемому закону. Для этого находят выравнивающие (теоретические) частоты по формуле:

(7)

где n – число испытаний,

- вероятность наблюдаемого значения , вычисленная при допущении, что Х имеет предполагаемое распределение.

Эмпирические (полученные из таблицы) и выравнивающие частоты сравнивают, и при небольшом расхождении данных делают заключение о выбранном законе распределения.

Предположим, что случайная величина Х распределена нормально (см. комментарии к задаче № 4). В этом случае выравнивающие частоты находят по формуле:

(8)

где n-число испытаний,

h-длина частичного интервала,

-выборочное среднее квадратичное отклонение,

( - середина i – го частичного интервала)

– функция Лапласа (9)

Результаты вычислений отобразим в таблице №8.

Сравнение графиков (рис.2) наглядно показывает близость выравнивающих частот к наблюдавшимся и подтверждает правильность допущения о том, что обследуемый признак распределён нормально.

Таблица 8

Расчёт выравнивающих частот


149, 5 152, 5 155, 5 158, 5 161, 5 164, 5 167, 5 170, 5 173, 5 176, 5 179, 5 182, 5 185, 5 188, 5	-19, 5 -16, 5 -13, 5 -10, 5 -7, 05 -4, 05 -1, 05 1, 95 4, 95 7, 95 10, 95 13, 95 16, 95 19, 95	-3 -2, 53 -2, 06 -1, 59 -1, 11 -0, 64 -0, 17 0, 31 0, 78 1, 25 1, 73 2, 2 2, 67 3, 15	0, 004 0, 02 0, 048 0, 11 0, 22 0, 33 0, 396 0, 38 0, 3 0, 18 0, 09 0, 04 0, 011 0, 003	0, 42 1, 55 4, 54 10, 68 20, 37 31, 0 37, 48 36, 0 28, 0 17, 34 8, 44 3, 37 1, 06 0, 26		0, 05 0, 01 0, 025 0, 055 0, 1 0, 155 0, 185 0, 18 0, 14 0, 085 0, 04 0, 015 0, 005

Интервальный вариационный ряд графически изобразим в виде гистограммы (рис.3). На оси Х отложим интервалы длиной h=3, а на оси Y значения , расчёт которых представлен в таблице №7. Площадь под гистограммой равна сумме всех относительных частот, т.е. единице.

Графическое изображение вариационных рядов в виде полигона и гистограммы позволяет получать первоначальное представление о закономерностях, имеющих место в совокупности наблюдений.

Рис.3

3) Найдём числовые характеристики вариационного ряда, используя таблицу №4.

Выборочная средняя ( ):

или , (10)

где - частоты,

а -объём выборки. Выборочная средняя является оценкой математического ожидания (среднего значения теоретического закона распределения).

В некоторых случаях удобнее рассчитать с помощью условных вариант. В нашем случае варианты - большие числа, поэтому используем разность:

(11)

где С – произвольно выбранное число (ложный нуль). В этом случае

. (12)

Для изменения значения варианты можно ввести также условные варианты путём использования масштабного множителя:

, (13)

где (b выбирается положительным или отрицательным числом).

. Здесь С – середина 8-го интервала.

Выборочная дисперсия ( ):

(14)

также может быть рассчитана с помощью условных вариант:

(15)

= (1*441+0*324+…+1*324)- 1, 95² =40, 21

Среднеквадратическое отклонение:

= (16)

= =6, 34

Найдем несмещённую оценку дисперсии и среднеквадратического отклонения («исправленную» выборочную дисперсию и среднеквадратическое отклонение) по формулам:

и (17)

= =40, 41 и S= 6, 34=6, 36

Доверительный интервал для оценки математического ожидания с надёжностью 0, 95 определяют по формуле:

P( -t Ф(t)= (18)

Из соотношения Ф(z)= /2 вычисляют значение функции Лапласа: Ф(z)=0, 475. По таблице значений функции Лапласа ( Приложение А) находят z=1, 96. Таким образом,

168, 55-1, 96 ,

167, 67< a< 169, 43.

Доверительный интервал для оценки среднего квадратичного отклонения случайной величины находят по формуле:

, (19)

где S – несмещённое значение выборочного среднего квадратичного отклонения;

q – параметр, который находится по таблице (Приложение В) на основе известного объёма выборки n и заданной надёжности оценки .

На основании данных значений =0, 95 и n=200 по таблице (Приложение В) можно найти значение q=0, 099. Таким образом,

5, 79 <

V= (20)

4) Проведём статистическую проверку гипотезы о нормальном распределении. Нормальный закон распределения имеет два параметра (r=2): математическое ожидание и среднее квадратическое отклонение. По выборочным данным (таблицы 5 и 7) полученные оценки параметров нормального распределения, вычисленные выше:

, , S=6, 36.

Для расчёта теоретических частот используют табличные значения функции Лапласа Ф(z). Алгоритм вычисления состоит в следующем:

- по нормированным значениям случайной величины Z находят значения Ф(z), а затем :

, =0, 5+Ф( ).

Например,

; ; Ф(-3, 0)=-0, 4987;

;

- далее вычисляют вероятности =P( ;

- находят числа , и если некоторое < 5, то соответствующие группы объединяются с соседними.

Результаты вычисления , , и приведены в таблице 9.

По формуле

= (21)

можно сделать проверку расчетов.

По таблице (приложения Г) можно найти число по схеме: для уровня значимости α =0, 05 и числа степеней свободы l=k-r-1=9-2-1=6 =12, 6. Следовательно, критическая область - (12, 6; ). Величина =15, 61 входит в критическую область, поэтому гипотеза о том, что случайная величина Х подчинена нормальному закону распределения, отвергается.

При α =0, 1 =10, 6. Критическая область - (10, 6; ). Величина =15, 61 также входит в критическую область и гипотеза о нормальном законе распределения величины Х отвергается.

При α =0, 01 =16, 8, (16, 8; ). В этом случае нет оснований отвергать гипотезу о нормальном законе распределения.

Таблица 9

Определение

i		Ф( )
	149, 5	-0, 500	0, 000	0, 0013	0, 0013	0, 26	-
	149, 5 152, 5	-0, 449	0, 0013	0, 0059	0, 0046	0, 92	-
	152, 5 155, 5	-0, 494	0, 0059	0, 02	0, 014	2, 8	-
	155, 5 158, 5	-0, 48	0, 02	0, 057	0, 037	7, 4	2, 54
	158, 5 161, 5	-0, 44	0, 057	0, 134	0, 077	15, 4	4, 58
	161, 5 164, 5	-0, 37	0, 134	0, 26	0, 126	25, 2	0, 7
	164, 5 167, 5	-0, 24	0, 26	0, 433	0, 1725	34, 5	0, 36
	167, 5 170, 5	-0, 07	0, 433	0, 62	0, 188	37, 6	0, 06
	170, 5 173, 5	0, 12	0, 62	0, 78	0, 16		1, 125
	173, 5 176, 5	0, 28	0, 78	0, 89	0, 11		0, 045
	176, 5 179, 5	0, 39	0, 89	0, 96	0, 07		0, 071
	179, 5 182, 5	0, 46	0, 96	0, 99	0, 03		6, 125
	182, 5 185, 5	0, 49	0, 99	0, 996	0, 006	1, 2	-
	185, 5 188, 5	0, 496	0, 996	0, 999	0, 003	0, 6	-
	188, 5	0, 5	0, 999	1, 0	0, 001	0, 2	-

, 0000

2 часть

1) Данные таблицы 3 сгруппируем в корреляционную таблицу 10.

2) Строим в системе координат множество, состоящее из 200 экспериментальных точек (рисунок 4).

По расположению точек делаем заключение о том, что экономико-математическую модель можно искать в виде .

3) Найдём выборочные уравнения линейной регрессии.

Для упрощения расчётов разобьём случайные величины на интервалы и выберем средние значения. Для величины Х указанные действия были выполнены в 1 части задания.

Таблица 10

Корреляционная таблица

Y/X

Продолжение таблицы 10

Рис.4

Для случайной величины Y, используя (1), получим h=2, число интервалов равно 13. Результаты внесём в таблицу со сгруппированными данными №11.

Находим средние значения , по формулам:

, (22)

, (23)

, (24)

. (25)

149, 5*86+155, 5(82+…+90)+…+188, 5*104=2986101

Используя формулы:

, (26)

, (27)

получим

= , =

Таблица 11

Сгруппированные данные выборки

№
	XY	149, 5	152, 5	155, 5	158, 5	161, 5	164, 5	167, 5170, 5173, 5	170, 5	173, 5	176, 5	179, 5	182, 5	185, 5	188, 5

4) Вычисляем выборочный коэффициент корреляции по формуле:

. (28)

Принято считать, что если 0, 1< < 0, 3 – связь слабая, если 0, 3< < 0, 5 – связь умеренная, если 0, 5< < 0, 7 – связь заметная, если 0, 7< < 0, 9 – связь высокая, если 0, 9< < 0, 99 – связь весьма высокая.

Для данного примера связь между X и Y умеренная.

Затем получают выборочное уравнение линейной регрессии Y на X в виде:

(29)

и выборочное уравнение линейной регрессии X на Y:

. (30)

или

Вычисления сумм рекомендуем проводить с помощью пакетов прикладных математических программ (сегодня их существует много).

КОНТРОЛЬНЫЕ ЗАДАНИЯ № 1-№ 4

Вариант 1.

1. Фирма имеет три источника поставки комплектующих – фирмы А, В и С. На долю фирмы А приходится 50% общего объема поставок, В – 30% и С – 20%. Из практики известно, что 10% поставляемых фирмой А деталей бракованные, фирмой В – 5% и фирмой С – 6%.

1) Какова вероятность, что взятая наугад деталь была получена от фирмы А?

2) Какова вероятность, что взятая наугад и оказавшаяся бракованной деталь получена от фирмы А?

2. Накануне выборов 40% населения поддерживают «Партию квадратов», 40% - «Партию Кругов» и 20% еще не определились во мнении. Какова вероятность того, что, по крайней мере, половина из шести наудачу выбранных избирателей оказывают доверие «Партии квадратов»?

3. Имеется 8 изделий, из которых 3 дефектных. Для контроля взято наудачу 3 изделия. Случайная величина Х – число дефектных изделий в выборке.

1) Составить таблицу распределения Х.

2) Найти математическое ожидание M(X) и дисперсию D(Х).

3) Построить график функции распределения y = F(x)

4) Найти вероятность P(0, 5< X< 3).

4. Фирма «Клубок ниток» производит вязальные спицы. Наиболее популярны размеры

1 23	Поделиться: