Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ



Основные задачи математической статистики:

1.Разработка методологии сбора и группировки статистического материала, полученного в результате наблюдений за случайными процессами.

2.Разработка методов анализа полученных статистических данных. Этот анализ включает оценку вероятностей события, функции распределения вероятностей или плотности вероятности, оценку параметров известного распределения, а также оценку связей между случайными величинами.

 

ВЫБОРОЧНЫЙ МЕТОД

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРОЧНАЯ

Статистические данные представляют собой данные, полученные в результате обследования большого числа объектов или явлений.

Экспериментальные данные - это результаты измерения некоторых признаков объектов, выбранных из большой совокупности объектов.

Часть объектов исследования, определенным образом выбранная из более обширной совокупности, называется выборкой, а вся исходная совокупность, из которой взята выборка, - генеральной (основной) совокупностью.

Исследования, в которых участвуют все без исключения объекты, составляющие генеральную совокупность, называются сплошными исследованиями. Может использоваться выборочный метод, суть которого в том, что для обследования привлекается часть генеральной совокупности (выборка), но по результатам этого обследования судят о свойствах всей генеральной совокупности.

Предметом изучения в статистике являются варьирующиеся признаки (называемые статистическими). Они делятся на качественные и количественные.

Качественными признаками объект обладает либо не обладает. Они не поддаются непосредственному измерению (спортивная специализация, квалификация, национальность, территориальная принадлежность и т. п.).

Количественные признаки представляют собой результаты подсчета или измерения. В соответствии с этим они делятся на дискретные и непрерывные.

Например, измеряемая температура воздуха в некотором пункте – непрерывная случайная величина (может меняться на сколь угодно малую величину), и соответствующая генеральная совокупность представляет собой бесконечное множество значений.

Повторнойназывают выборку, при которой объект перед отбором следующего возвращается в генеральную совокупность. Бесповторнойназывают выборку, при которой отобранный объект в генеральную совокупность не возвращается.

Если выборка правильно отражает соотношения в генеральной совокупности, то ее называют репрезентативной(представительной). Например, результаты социологического опроса населения будут зависеть от того, в каком месте он проводится, среди каких групп.

 

ВАРИАЦИОННЫЙ РЯД. ПОЛИГОН ЧАСТОТ И ГИСТОГРАММА ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ

Пусть Х — некоторый признак изучаемого объекта или явления (температура, давление, срок службы электролампы или компьютера, вес студента, диаметр шарика для подшипника и т.п.). Генеральной совокупностью является мультимножество [2] всех возможных значений этого признака (их количество обозначим за N и назовем объемом генеральной совокупности ), а результаты n наблюдений над признаком Х дадут нам выборку объема n — первоначальные статистические данные, значения (простая выборка, не сгруппированные данные).

При этом значение получено при первом наблюдении случайной величины Х, – при втором наблюдении той же случайной величины и т.д.

Выборку преобразуют в вариационный ряд, располагая результаты наблюдений в порядке возрастания: Каждый член вариационного ряда называется вариантой.

Пример 4.1.

1. Измерена масса тела 10-ти детей 6-ти лет. Полученные данные образуют простой статистический ряд: 24 22 23 28 24 23 25 27 25 25.

2. Из 10000 выпущенных на конвейере электрических лампочек отобрано 300 штук для проверки качества всей партии. Здесь а

Отдельные значения статистического ряда называются вариантами. Если варианта хi появилась m раз, то число m называют частотой, а ее отношение к объему выборки m/nотносительной частотой.

Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется ранжированным рядом.

Пример 4.2. Для ранжированного ряда: 23 23 24 24 25 25 25 27 28 в нижеприведенной таблице в первой строке записаны все значения величины (варианты), во второй – соответствующие им частоты (безынтервальный вариационный ряд), в третьей – накопленные частоты, в четвертой – относительные частоты (табл.4.1).

 

Таблица 4.1. Значения вариант и их частот

Х
ni
nн
0.1 0.2 0.2 0.3 0.1 0.1

 

Полигоном частот называют ломаную линию, отрезки которой соединяют точки с координатами (хi; ni) (Рисунок 4.1. а)).

Отметим, что сумма частот статистического ряда равна объему выборки . Часто статистический ряд составляют, используя относительные частоты вариант: (k — количество различных вариант). Сумма относительных частот равна единице.

Полигоном относительных частот называют ломаную линию, отрезки которой соединяют точки с координатами (хi; hi).

 

а) б)

Рисунок 4.1. Полигон частот а), кумулятивная кривая б)

Эмпирическим аналогом графика интегральной функции распределения является кумулятивная кривая (кумулята). Для ее построения на оси ОХ откладывают значения вариант, на оси ОY – накопленные частоты или относительные частоты. Полученная плавная кривая называется кумулятой (Рисунок 4.1. б))..

Эмпирическая функция распределения находится по следующей формуле (отношение накопленных частот к объему выборки):

(4.1)

 

В том случае, когда выборка представлена большим количеством различных значений непрерывной случайной величины, то группировку данных проводят в виде интервального вариационного ряда (ИВР). Для этого диапазон варьирования признака разбивают на несколько (5–10) равных интервалов и указывают количество вариант, попавших в каждый интервал.

Алгоритм построения интервального вариационного ряда.

1. Исходя из объема выборки (n), определить количество интервалов (k), рекомендуемое соотношение указано в табл. 4.2.

Таблица 4.2. Соотношениеобъем выборки-число интервалов

n 25–40 40–60 60–100 100–200 > 200
k 5–6 6–8 7–10 8–12 10–15

 

2. Вычислить размах ряда: R=Xmax – Xmin

3. Определить ширину интервала: h=R/(k–1)

4. Найти начало первого интервала X0 = Xminh/2

5. Составить интервальный вариационный ряд.

Графическим изображением ИВР является гистограмма. Для ее построения на оси ОХ откладывают интервалы шириной h, на каждом интервале строят прямоугольник высотой . Величина называется плотностью частоты ( – количество значений из величин , попавших в i-й интервал (карман)). Гистограмма является эмпирическим аналогом графика плотности функции распределения.

Пример 4.3. Измерена масса тела 100 женщин 30 лет, получены значения от 60 до 90 кг. Построить интервальный вариационный ряд (табл. 4.3) и гистограмму.

Таблица 4.3. Интервальный вариационный ряд

Интервал Середина интервала
60–65 62.5 2.8
65–70 67.5 6.4
70–75 72.5 5.6
75–80 77.5 2.8
80–85 82.5 1.4
85–90 87.5 0.4
       

Рисунок 4.2. Гистограмма

 

СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-08-24; Просмотров: 701; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.016 с.)
Главная | Случайная страница | Обратная связь