Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Основные характеристики вариационных рядов



 

Статистикой называется любая функция Т=Т(х1, … ,х n), зависящая от элементов выборки. Например, - среднее арифметическое элементов выборки, - наибольший элемент выборки.

Выборочными характеристиками называются функции от результатов наблюдений, аналогичные тем, что в теории вероятностей определялись для случайных величин. К ним относятся средние (или структурные) характеристики и меры вариации.

Средние величины характеризуют значения признака, вокруг которого концентрируются наблюдения.

1. Основная характеристика центра распределения - выборочная средняя вариационного ряда или его средняя арифметическая:

                                                (5)

Для не сгруппированного ряда формула (5) принимает вид:

                                          (5.1)

Свойства выборочной средней аналогичны свойствам математического ожидания случайной величины:

· Выборочная средняя постоянной равна этой постоянной.

· Если все варианты умножить на некоторую константу, то выборочная средняя умножится на эту константу.

· Если все варианты увеличить (уменьшить) на одно и то же число, то выборочная средняя увеличится (уменьшится) на то же число.

2. Медиана выборки (Ml) – это значение признака, которое делит вариационный ряд на две равные по объему части. Для дискретного вариационного ряда:

 

                             (6)

То есть, если число наблюдений нечетно, т.е. , то это середина ряда; если же - четно, т.е. , то это среднее арифметическое двух значений признака, составляющих середину ряда.

Например, для вариационного ряда 2, 2, 3, 3, 3, 4, 4, 4, 5 количество элементов нечетно: . Значит, медиана - .

Для вариационного ряда 2, 2, 3, 3, 3, 4, 4, 4, 5, 5 количество элементов четно . Значит, медиана - .

Медиана интервального ряда находится по формуле:

.                         (6.1)

где - нижняя граница медианного интервала (интервала, на котором накопленная частота впервые превышает половину выборки); h - длина интервала; n - объем выборки;  - накопленная частота интервала, предшествующего медианному;  - частота медианного интервала.

3. Мода (М0)– это значение признака, наиболее часто встречающееся в совокупности. Для дискретного вариационного ряда мода определяется как варианта, имеющая наибольшую частоту.

Для интервального вариационного ряда сначала определяем модальный интервал, которому соответствует наибольшая частота, затем точное значение моды вычисляется по формуле:

                      (7)

где - нижняя граница модального интервала; h - длина интервала;  - соответственно частота модального интервала, ему предшествующего и последующего.

Меры вариации

Наибольший интерес представляют меры рассеяния наблюдений вокруг средних величин, в частности вокруг выборочной средней.

4. Выборочная дисперсия:

                                (8)

                     (9)

5. Среднее квадратическое отклонение (СКО):

                                                 (10)

 

Свойства выборочной дисперсии аналогичны свойствам дисперсии случайной величины:

· Дисперсия постоянной равна нулю.

· Если все варианты умножить на некоторую константу с, то дисперсия и среднее квадратическое отклонение умножатся соответственно на с2 и

· Если все варианты увеличить (уменьшить) на одно и то же число с, то дисперсия и среднее квадратическое отклонение не изменятся.

6. Выборочные начальные моменты r –го порядка:

                                 (11)

7. Выборочные центральные моменты r –го порядка:

                           (12)

Заметим, что

Центральные моменты можно выразить через начальные. Справедливы следующие соотношения:

(13)

Если распределение симметрично относительно математического ожидания, то все центральные моменты нечетного порядка равны нулю.

 

8. Асимметрия и эксцесс используются для количественной оценки различия между теоретическим и эмпирическим распределениями, если выполняется гипотеза о нормальном распределении ГС. При положительной асимметрии кривая распределения «вытянута» вправо от моды, при отрицательной – влево. Если эксцесс положительный, то кривая имеет более высокую вершину, чем нормальная кривая, а если эксцесс отрицательный, то кривая имеет более низкую вершину.

                                            (14)

                                       (15)

 

9. Относительной мерой рассеяния является коэффициент вариации – процентное отношение среднего квадратического к выборочной средней, т.е.

                                   (16)

Пример 3. Для дискретного ряда из примера 1 найти его выборочные характеристики: моду, медиану, выборочную среднюю, дисперсию и среднее квадратическое отклонение, коэффициент вариации, асимметрию и эксцесс.

Р е ш е н и е. Дискретный вариационный ряд имеет вид:

 

xi 2 3 4 5 6  
4 5 9 4 2

 

1) Мода дискретного ряда равна 4, так как это значение встречается наиболее часто (соответствующая ему частота - наибольшая - равна 9).

2) Так как число вариант четно (24), то медиана равна полусумме двух срединных вариант, т.е. 12-го и 13-го:

3) Рассчитаем средний уровень квалификации служащих фирмы, а также остальные числовые характеристики. Вычисления удобнее проводить при помощи расчетной таблицы:

 

xi ni xini xi-xср (xi-xср)2ni (xi-xср)3ni (xi-xср)4ni
2 4 8 -1,792 12,840 -23,005 41,218
3 5 15 -0,792 3,134 -2,481 1,964
4 9 36 0,208 0,391 0,081 0,017
5 4 20 1,208 5,840 7,057 8,527
6 2 12 2,208 9,753 21,539 47,565
𝛴 24 91   31,958 3,191 99,291

 

По формуле (5) находим выборочную среднюю:

По формулам (8) и (10) находим выборочные дисперсию и среднее квадратическое отклонение:

Чтобы найти коэффициенты асимметрии и эксцесса по формулам (14) и (15), вычислим сначала центральные моменты третьего и четвертого порядков по формуле (12):

Таким образом:

И, наконец, коэффициент вариации по формуле (15):

Пример 4. Для интервального ряда из примера 2 найти его выборочные характеристики: моду, медиану, среднее арифметическое, дисперсию и СКО, коэффициент вариации, асимметрию и эксцесс.

Р е ш е н и е. Интервальный вариационный ряд имеет вид:

 

Интервалы Cумма
частоты 1 3 6 10 5 3 2 30
накопленные частоты 1 4 10 20 25 28 30  

 

Определим моду для интервального ряда по формуле (7). Модальный интервал (27;30), так как ему соответствует наибольшая частота, равная 10, нижняя граница интервала (начало интервала) равна 27, частота модального интервала – 10, частота предшествующего интервала – 6 и частота последующего интервала – 5:

Тогда

Определяем медианный интервал. Первая из накопленных частот, которая превышает половину объема выборки (т.е. 15), равна 20. Ей соответствует интервал (27;30), который и будет медианным. Нижняя граница этого интервала al равна 27, его частота nl – 10, накопленная частота интервала, предшествующего медианному  – 10 , объем выборки – 30 и длина каждого частичного интервала – 3. Теперь по формуле (6.1) вычислим медиану:

Тогда

Для вычисления остальных характеристик необходимо перейти к дискретному ряду, приняв в качестве варианты  такого ряда серединные значения интервалов разбиения, а соответствующую интервальную частоту  принимаем за частоту этого варианта: .

 

[yk-1;yk] xi ni xini xi-xср (xi-xср)2ni (xi-xср)3ni (xi-xср)4ni
[18;21) 19,5 1 19,5 -9,2 84,64 -778,688 7163,93
[21;24) 22,5 3 67,5 -6,2 115,32 -714,984 4432,901
[24;27) 25,5 6 153 -3,2 61,44 -196,608 629,146
[27;30) 28,5 10 285 -0,2 0,4 -0,08 0,016
[30;33) 31,5 5 157,5 2,8 39,2 109,76 307,328
[33;36) 34,5 3 103,5 5,8 100,92 585,336 3394,949
[36;39] 37,5 2 75 8,8 154,88 1362,944 11993,907
𝛴   30 861   556,8 367,68 27922,18

 

Дальнейшие расчеты как в примере 3. По формуле (5) находим выборочную среднюю:

По формулам (8) и (10) находим выборочные дисперсию и среднее квадратическое отклонение:

Вычислим сначала центральные моменты третьего и четвертого порядков, а затем коэффициенты асимметрии, эксцесса и вариации.

 

Самостоятельная работа №3.

Задача 3.1. Для выборки из задачи 2.1 вычислить все эмпирические характеристики признака.

Задача 3.2. В результате четырех измерений некоторой величины одним прибором (без систематических ошибок) получены следующие результаты: 8, 9, 11, 12. Найти медиану, выборочное среднее результатов измерений, выборочные дисперсию и стандартное отклонение ошибок прибора.

Задача 3.3. В результате пяти измерений некоторой величины одним прибором (без систематических ошибок) получены следующие результаты: 92, 94, 103, 105, 106. Найти медиану, выборочное среднее результатов измерений, выборочные дисперсию и стандартное отклонение ошибок прибора.

Точечные оценки

Точечной оценкой называют некоторую функцию результатов наблюдений , значение которой принимают за наилучшее приближение в данных условиях к значению параметра θ ГС.

Оценка  (в отличие от оцениваемого параметра θ – величины неслучайной) является случайной величиной, зависящей от закона распределения ГС и числа наблюдений n.

Требования к точечным оценкам

Выбор той или иной функции в качестве наилучшей оценки оцениваемого параметра θ производится с учетом удовлетворения следующих требований: несмещенность, состоятельность и эффективность.

1. Оценка  называется несмещённой, если ее математическое ожидание равно истинному значению оцениваемого параметра при любом объеме выборки: . В противном случае оценка называется смещенной.

2. Статистическая оценка  называется состоятельной, если с увеличением объема выборки n она сходится по вероятности к истинному значению параметра θ.

Практический смысл имеют только состоятельные оценки. Если оценка  параметра q является несмещенной, а ее дисперсия стремится к нулю при n®¥, то она является состоятельной.

3. Оценка параметра называется эффективной, если имеет наименьшую дисперсию в определенном классе оценок, вычисленных по выборкам одного и того же объема n.

 

Основные точечные оценки

В качестве оценок  числовых характеристик случайных величин естественно пытаться использовать их статистические аналоги, т. е. выборочные числовые характеристики ГС. Пусть дана выборка  из ГС Х с неизвестными математическим ожиданием  и дисперсией .

Выборочное среднее  является несмещенной и состоятельной оценкой математического ожидания (генеральной средней).

Исправленная выборочная дисперсия S 2  является несмещенной оценкой генеральной дисперсии:

                                       (17)

Для вычисления S2 можно использовать формулу:

                          (18)

Все выборочные начальные моменты являются несмещенными оценками начальных моментов ГС.

В качестве точечной оценки СКО чаще используют исправленное выборочное СКО, хотя свойством несмещенности оно не обладает:

                                               (19)

Все выборочные центральные моменты, выборочные коэффициенты асимметрии и эксцесса также являются смещенными оценками соответствующих параметров ГС.

 

Пример 5. С целью определения средней суммы вкладов в филиале банка произведено выборочное обследование, которое дало следующие результаты:

 

Сумма вклада, тыс. руб. [10;30) [30;50) [50;70) [70;90) [90;110) [110;130] Cумма
число вкладов 1 3 10 30 50 6 100

 

Пользуясь этими данными, найти несмещенные оценки генеральной средней и генеральной дисперсии.

Р е ш е н и е. Для вычисления соответствующих характеристик составим расчетной таблицы:

 

концы интервалов yi середина интервала xi ni xini xi 2 ni
0 10        
1 30 20 1 20 400
2 50 40 3 120 4800
3 70 60 10 600 36000
4 90 80 30 2400 192000
5 110 100 50 5000 500000
6 130 120 6 720 86400
  𝛴   100 8860 819600

 

Несмещенной оценкой генеральной средней является выборочное среднее, которое вычислим по формуле (5):

Для нахождения несмещенной оценки генеральной дисперсии, вычислим сначала выборочную дисперсию по формуле (9):

Исправленные выборочные дисперсию и среднее квадратическое отклонение (СКО) найдем по формулам (17) и (19):

Самостоятельная работа № 4.

Задача 4.1. Генеральная совокупность изучается по случайной выборке объема 100, результаты отражены в таблице:

 

Значения 5 10 15
Частоты 15 30 55

 

Найти несмещенные оценки генеральной средней и генеральной дисперсии.

Задача 4.1. По выборке объема 100 оценивалась генеральная дисперсия. Выборочная дисперсия оказалась равной 1,287. Найти несмещенную оценку генеральной дисперсии.

Задача 4.2. По выборке объема 25 оценивалась генеральная дисперсия. Несмещенная оценка оказалась равной 12,5. Найти выборочную дисперсию.

Задача 4.3. Цены акций в генеральной совокупности подчиняется нормальному распределению. В случайной выборке из четырех акций цены составили 5, 12, 17 и 10 у.д.е. Вычислить несмещенные точечные оценки генеральной средней и генеральной дисперсии, а также точечную оценку среднего квадратического отклонения.

Задача 4.4. В результате четырех измерений некоторой величины одним прибором (без систематической ошибки) получены следующие результаты: 8; 9; 11; 12. Найти смещенную и исправленную выборочные дисперсии ошибок прибора.


Поделиться:



Последнее изменение этой страницы: 2019-04-21; Просмотров: 820; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.07 с.)
Главная | Случайная страница | Обратная связь