Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Графическое изображение статистического закона распределения дискретной и непрерывной случайных величин
В таблице 1.1 представлен статистический закон распределения дискретной с.в. Определение 1.7 Полигоном частот называют ломаную линию, отрезки которой соединяют точки (х1, m1), (х2, m2), (х3, m3), …, (хk, mk). Для построения полигона частот на оси абсцисс откладывают варианты , а на оси ординат – соответствующие им частоты mi и соединяют точки (хi, , mi) отрезками прямых. Определение 1.8 Полигон относительных частот строится аналогично, за исключением того, что на оси ординат откладываются относительные частоты (рисунок 1.1).
Рисунок 1.1 – Графическое изображение статистического закона Статистический закон распределения непрерывной случайной величины (см таблицу 1.2) изображается следующим образом. На горизонтальной оси откладываются границы ci ячеек, затем на каждом полуинтервале [ci; ci+1) строятся прямоугольники высотой , . Такой график называется гистограммой (рисунок 1.2).
Рисунок 1.2 – Графическое изображение статистического закона 1.5 Построение доверительных интервалов для математического ожидания и среднего квадратического отклонения нормально распределенной случайной величины Х До сих пор мы рассматривали точечные оценки, т.е. такие оценки, которые определяются одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. В связи с этим при небольшом объеме выборки пользуются интервальными оценками. Пусть дана случайная выборка {x1, x2, …, xn} (1.10) есть некоторая совокупность значений, полученных в результате наблюдения за n объектами, характеризующимися с.в. Х: {Х1, Х2, …, Хn}. (1.11) И пусть по этой выборке вычислена оценка некоторого параметра θ. Определение 1.9 Статистика называется точечной оценкой параметра . В силу того, что оценка строится по выборке, . Поскольку истинное значение параметра θ нам не известно, то мы на самом деле не знаем, как сильно оценка отличается от θ . Но для практического применения оценки мы должны знать насколько этой оценке можно доверять. В таких случаях строится интервальная оценка параметра θ. Определение 1.10 Доверительным интервалом для параметра θ называется интервал , границы которого вычисляются по выборке (причем ) и который«накрывает» истинное значение θ с наперед заданной достаточно большой вероятностью : . При этом величина называется доверительной вероятностью . На практике доверительные вероятности обычно выбираются из множества . Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение s этого распределения известно. Требуется оценить неизвестное математическое ожидание a по выборочному среднему . Найдем доверительные интервалы, покрывающие параметр a с надежностью . Будем рассматривать выборочное среднее , как случайную величину (т.к. меняется от выборки к выборке), и выборочные значения , как одинаково распределенные независимые случайные величины (эти числа также меняются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно a и среднее квадратическое отклонение – s. Если исследуемая случайная величина Х подчиняется нормальному закону распределения с параметрами m и σ 2, причем для параметров m и σ 2 вычислены их оценки: , , то доверительный интервал для математического ожидания имеет вид , (1.12) где находят по таблице критических точек распределения Стьюдента при уровне значимости α / 2 и числе степеней свободы . Доверительный интервал для дисперсии имеет вид
, (1.13) где и находят по таблице критических точек распределения χ 2 при уровне значимости α / 2, 1-α /2 и числе степеней свободы . Доверительный интервал для среднего квадратического отклонения легко получается из формулы (1.13): . (1.14) 1.6 Построение доверительных интервалов для математического ожидания и среднего квадратического отклонения, если случайная величина Х имеет произвольную функцию распределения Пусть дана случайная выборка и функция распределения исследуемой случайной величины неизвестна. В таком случае строятся непараметрические доверительные интервалы. Предварительно вычислим оценку для математического ожидания по формуле (1.5) и оценку для среднего квадратического отклонения по формуле (1.7). Доверительный интервал для математического ожидания имеет вид: , (1.15) где – критическая точка стандартного нормального распределения при уровне значимости 1 – α / 2). Если a = 0, 05, то . Доверительный интервал для дисперсии строится следующим образом: , (1.16) где, , (1.17) где . Доверительный интервал для среднего квадратического отклонения исследуемой случайной величины имеет вид: , (1.18)
где d – вычисляется по формуле (1.17). Лабораторная работа № 1 ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ Цель работы: ознакомиться с основными понятиями математической статистики и методикой проведения первичного исследования статистических данных. Задание : При проведении экспериментов фиксировались значения случайной величины X, характеризующей цены на мужскую зимнюю обувь (у.е). Произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х. Пример выполнения лабораторной работы №1. 1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке неубывания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.
Таблица 1.3 – Расчетная таблица
2) Найдем размах выборки = = 183-85 = 98 у.е. 3) Вычислим длину интервала = = 14. 4) Границы интервалов: = 85, = 85+14 = 99, = 99+14 = 113, = 113+14 = 127, = 127+14= 141, = 141+14 = 155, = 155+14= 169, =169 +14 =183 . 5) Построим интервальный статистический ряд:
Таблица 1.4 – Интервальный статистический ряд
6) Вычислим числовые характеристики. В качестве оценки математического ожидания используется среднее арифметическое наблюденных значений. Эта статистика называется выборочным средним.
.
По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала. . Для определения выборочного значения медианы используется вариационный ряд. В нашем случае объем выборки = 50 – четное число, т.е. в качестве оценки медианы примем = . В качестве оценки дисперсии используется статистика = . Оценка среднего квадратического отклонения = .
Оценка коэффициента вариации . Оценка коэффициента асимметрии . Оценка коэффициента эксцесса . 7) Построим гистограмму частот. Рисунок 1.3 – Гистограмма частот 8) Построим интервальные оценки для неизвестных истинных значений и . Объем выборки составил n = 50. Требуется с доверительной вероятностью определить интервальные оценки: а) для средней цены на зимнюю обувь; б) для дисперсии цены на зимнюю обувь; в) для среднего квадратического отклонения цены на зимнюю обувь. а) Средняя цена на обувь характеризуется генеральной средней a. Требуется найти интервальную оценку параметра a с доверительной вероятностью . Применяем формулу ,
где , , , , значение определяем по таблицам распределения Стьюдента для и . . Подставим найденные значения в формулу:
у.е.
Таким образом, с вероятностью можно гарантировать, что средняя цена зимней обуви находится в пределах: .
б) определим интервальную оценку для дисперсии цены на зимнюю обувь. Интервальная оценка дисперсии
.
По таблице процентных точек -распределения (см. приложение Г) найдем ;
.
Следовательно, . Значит с доверительной вероятностью можно утверждать, что истинное значение дисперсии будет находиться в интервале в) С доверительной вероятностью можно утверждать, что истинное значение среднего квадратического отклонения s будет находиться в интервале
7) Произведем первичную обработку полученной выборки с помощью ЭВМ: Summary Statistics for Col_1
Рисунок 1.4 – Компьютерный расчет Confidence Intervals for Col_1 95, 0% confidence interval for mean: 127, 16 +/- 5, 96175 [121, 198; 133, 122] 95, 0% confidence interval for standard deviation: [19, 0704; 29, 7078]
The StatAdvisor This pane displays 95, 0% confidence intervals for the mean and standard deviation of Col_1. The classical interpretation of these intervals is that, in repeated sampling, these intervals will contain the true mean or standard deviation of the population from which the data come 95, 0% of the time. In practical terms, we can state with 95, 0% confidence that the true mean Col_1 is somewhere between 121, 198 and 133, 122, while the true standard deviation is somewhere between 17, 5232 and 26, 1408.
Вывод. В результате исследования выборки значений непрерывной случайной величины, характеризующей цены на мужскую зимнюю обувь, получили следующие результаты, у.е: минимальная цена – 85, максимальная – 183, средняя цена на мужскую зимнюю обувь – 127, 16, наиболее вероятная цена – 134, средневероятная цена – 128, среднеквадратическое отклонение цены на мужскую зимнюю обувь от среднего значения составило 20, 978. Оценка коэффициента вариации составила 16, 5%, что указывает на небольшую колеблемость признака относительно среднего значения, оценка коэффициента асимметрии составила 0, 090, оценка коэффициента эксцесса составила -0, 329. С доверительной вероятностью можно гарантировать, что средняя цена зимней обуви находится в пределах: , истинное значение дисперсии будет находиться в интервале , истинное значение среднего квадратического отклонения s будет находиться в интервале
Порядок выполнения работы 1 Изучить теоретические сведения. 2 Получить у преподавателя выборку значений случайной величины. 3 Произвести вручную первичную обработку статистических данных: – построить вариационный ряд; – построить сгруппированный или интервальный статистический ряд и его графическое изображение; – вычислить точечные оценки числовых характеристик изучаемой случайной величины. 4 Произвести первичную обработку полученной выборки с помощью ЭВМ: – записать выборку на диск; – вычислить оценки числовых характеристик; – построить гистограмму частот исследуемой выборки; – построить интервальные оценки для неизвестных истинных значений и . 5 Сравнить результаты, полученные при ручном расчёте и расчёте на ЭВМ. 6 Сделать вывод о свойствах изучаемой случайной величины. Контрольные вопросы 1 Что называется случайной величиной? Какие типы случайных величин вы знаете? 2 Что называется генеральной совокупностью? 3 Что называется выборкой? Какими свойствами должна обладать выборка? 4 Какая выборка называется репрезентативной? 5 Что называется вариационным рядом? 6Укажите последовательность проведения первичной обработки статистических данных. 7 Что называется выборочной статистикой; статистической оценкой параметра? Что представляют собой точечные и интервальные оценки? 8 Какие требования предъявляются к статистическим оценкам? 9 Какие статистики используются в качестве точечных оценок основных числовых характеристик? Какими свойствами они обладают? |
Последнее изменение этой страницы: 2017-05-05; Просмотров: 809; Нарушение авторского права страницы