Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Нормальный закон распределения
Цель работы: исследование свойств случайной величины, распределенной по нормальному закону. Материалы и оборудование: персональный компьютер, таблицы распределений вероятностей.
Задание: дана случайная величина, распределенная по нормальному закону, имеющему вид: . (1.6) Значения a и b смотри в таблице 2.
Исследовать свойства случайной величины, распределенной по заданному нормальному закону.
Ход работы
1 Определить среднее значение и дисперсию распределения СВ. Для этого сравнить значения a и b выражения (1.6) с параметрами нормального распределения из выражения (1.5).
2 Построить график плотности функции распределения f(х). Для построения таблицы значений плотности рекомендуется использовать среду Excel. При этом интервал значений аргумента х подбирается экспериментально таким образом, чтобы график ненулевых значений функции занимал большую часть поля рисунка.
3 Построить функцию распределения случайной величины F(х). Для определения значений F(х) удобно использовать функцию НОРМРАСП мастера функций среды Excel.
4 Определить вероятности попадания значений СВ в интервалы: , , , , , ( , ), ( , ), , , , . Эти вероятности определяются по формуле (1.1). Значения F(xi) находят с помощью функции НОРМРАСП.
5 Полученные для последних шести интервалов вероятности представить в виде гистограммы (рисунок 1).
6 Сделать выводы о свойствах случайной величины, распределенной по заданному нормальному закону.
Таблица 2 – Варианты заданий к лабораторной работе 2
Тема 2 Статистические оценки случайной величины 1 Понятие статистической оценки случайной величины 2 Доверительный интервал и доверительная вероятность 3 Статистическая функция распределения и гистограмма
Основные понятия по теме
При количественном анализе результатов измерений используют выборки случайных величин. При этом важно организовать эксперимент таким образом, чтобы вероятность быть выбранным была бы одинакова для любого элемента выборки — так называемая репрезентативная выборка. При таком подходе точная информация о распределении изучаемых величин отсутствует, поэтому одной из основных задач математической статистики является оценка числовых характеристик (параметров), плотности и функции распределения по отдельным выборкам наблюдений. Оценкой неизвестного параметра θ называют случайную величину , являющуюся функцией наблюденных значений . Часто используется так же термин «статистика». Под статистикой понимают любую функцию от наблюденных данных. Оценка — это построенная по определенному правилу статистика. Представление о точности и надежности оценки связано с понятиями доверительного интервала и доверительной вероятности. Доверительным интервалом ( -ε, +ε ) для параметра называется такой интервал, в пределах которого неизвестное значение параметра θ находится с вероятностью γ, не меньшей заданной. Величина γ называется доверительной вероятностью (уровнем доверия) и обычно полагается равной 0, 9; 0, 95; 0, 99. Величину a=1-g называют уровнем значимости. Среди различных методов нахождения оценок параметров распределений, построенных по выборочным данным, наибольшее применение получил метод моментов. Суть метода моментов состоит в том, что в силу закона больших чисел все выборочные моменты при n→ ∞ сходятся по вероятности к соответствующим моментам исходного распределения. Для вычисления оценок основных числовых характеристик распределения используют следующие формулы: математическое ожидание (среднее) ; (2.1) среднеквадратическое отклонение ; (2.2) асимметрия ; (2.3) эксцесс . (2.4) Характеристики, определяемые по выборкам, являются случайными величинами. Следовательно, необходимо указать их оценки и соответствующие этим оценкам доверительные интервалы. Для математического ожидания доверительный интервал имеет вид: , (2.5) где - g-квантиль центрированного нормированного нормального распределения. Статистическими оценками функции F(х) и плотности f(х) распределения являются соответственно статистическая функция распределения (называемая также выборочной функцией распределения, функцией накопленных частот, кумулятивной кривой) и гистограмма. Под статистической функцией распределения случайной величины понимается частота события, что Х< x, т. е. . Для нахождения этой функции при фиксированном х следует найти число значений СВ, меньших х, а затем полученный результат разделить на общее число значений случайной величины n. Функция Fn(x) представляет дискретную ступенчатую функцию, скачки которой соответствуют значениям X и равны частотам этих значений (рисунок 2). Гистограмма описывает распределение частот pi=mi/n определяемых для каждого значения хi случайной величины Х.. Для построения гистограммы весь диапазон значений Х разбивается на некоторое число градаций (разрядов) и подсчитывается число значений случайной величины mi приходящееся на каждую i-ю градацию, которое затем нормируется по общему числу значений n. По оси абсцисс откладываются градации (разряды), а по оси ординат — соответствующие этим разрядам частоты рi, называемые иногда частостями (рисунок 1). При построении гистограмм не существует строго обоснованных методов определения числа разрядов r. Обычно пользуются одним из трех эмпирических правил: 1) определяют ; 2) г находят по интервалу группирования исходных данных Δ x, равного погрешности (двойной или тройной ее величине) измерения параметра; 3) r определяют по величине Δ x, вычисляемой по формуле Стерджеса . При этом в каждом разряде гистограммы не должно быть менее пяти значений, в противном случае проводится объединение нескольких разрядов. Общее число разрядов также должно быть не менее пяти.
Пример 1 В результате n = 100 измерений плотности горной породы на денситометре с погрешностью δ = ±0, 01 г/см3 получены данные, приведенные в таблице 3.
Таблица 3 – Данные измерений
Определить оценки среднего значения плотности, среднеквадратического отклонения, асимметрии и эксцесса. Построить статистическую функцию распределения и гистограмму. Для среднего значения определить доверительный интервал с уровнем доверия 95 %.
По данным таблицы 3 находим оценки среднего значения и среднеквадратического отклонения (в г/см8):
Оценки асимметрии и эксцесса:
Доверительный интервал определяем из выражения , где tγ - γ -квантиль (0, 1) нормального распределения. По таблице функции Лапласа для γ =0, 95 получаем tγ =1, 65. Тогда доверительный интервал будет: 2, 085±0, 0079. Для построения оценки плотности распределения — гистограммы необходимо провести группирование данных по разрядам. По формуле Стерджеса имеем . Такой, же интервал группирования получаем, исходя из равенства интервала двойной погрешности измерений: Δ x=2δ = 0, 02 г/см3. Проведем группирование данных, учитывая, что в каждом разряде гистограммы не должно быть менее пяти значений. В результате объединения значений плотности по разрядам получим гистограмму, значения которой даны в табл. 4 (столбец 4), а ее график — на рисунке 1.
Таблица 4 – Результаты статистической обработки данных
По накопленным частотам (столбец 5 таблицы 4) строится статистическая функция распределения (рисунок 2).
Вопросы для самоконтроля
1 Что понимается под статистической оценкой случайной величины? 2 Что такое доверительный интервал и доверительная вероятность? 3 Привести формулы расчета статистических оценок основных числовых характеристик случайной величины. 4 Как построить статистическую функцию распределения? 5 Как строится гистограмма?
Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 692; Нарушение авторского права страницы