Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
ДОВЕРИТЕЛЬНАЯ ВЕРОЯТНОСТЬ. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ
: Определение. Интервальной называют оценку, которая определяется двумя числами – концами интервала.
При выборе малого объема точечная оценка значительно отличается от оцениваемого параметра, что приводит к грубым ошибкам. В этом случае применяют интервальную оценку. Пусть оценка неизвестного параметра θ (θ – постоянное число). Оценка тем точнее, чем меньше число δ в неравенстве . Число δ характеризует точность оценки. Статистические методы не позволяют категорически подтверждать, что удовлетворяет неравенству , можно лишь говорить о вероятности, с которой осуществимо это неравенство.
: Определение. Доверительной вероятностью (надёжностью) оценки по называют вероятность γ , с которой осуществляется неравенство . Р( ) = γ . (8) Обычно в качестве доверительной вероятности γ выбирают γ = 0, 9; 0, 95; 0, 99. Преобразуем (8): Р( ) = γ . (9) Равенство (9) означает, что с вероятностью γ неизвестное значение параметра попадет в интервал (10) Ранее рассматривали вероятность попадания случайных величин в заданный интервал. В данном случае величина не случайна ( - число, хотя и неизвестное), зато случаен интервал (10), случайно его положение на оси абсцисс, определяемое центром , случайна длина. Поэтому γ – не вероятность попадания точки q в интервале (10), а вероятность того, что случайный интервал (10) накроет точку q.
q : Определение. Доверительным называют интервал , который накрывает параметр с заданной доверительной вероятностью γ . Доверительный интервал для оценки математического ожидания нормального распределения при известном σ ( σ – среднее квадратное отклонение) Дано: Количественный параметр Х генеральной совокупности распределен нормально. - плотность. Математическое ожидание a – неизвестно. Среднее квадратическое отклонение – известно. Требуется: оценить а по средней выборочной . Данные выборки и среднее выборочное будем рассматривать как случайные величины и , одинаково распределённые с математическим ожиданием a и средним квадратическим отклонением . , ; . Пусть выполняется Р( )= γ , где γ – заданная вероятность. Из курса теории вероятностей известна формула: Р( ) = . Заменим X на , на . Р( ) = = , где . Тогда . Следовательно, Р( )= . Вернемся к обозначению как . Получим Р( . Итак, с достоверной вероятностью γ можно утверждать, что доверительный интервал покрывает неизвестный параметр a. Точность оценки . Число t определяется из равенства , или . При заданной доверительной вероятности по таблице функции Лапласа (табл. 2) находят значение t. Пример 10. Количественный параметр X распределен нормально, . Найти доверительный интервал для оценки неизвестного математического ожидания a по выборочной средней , если объем выборки n = 36 и доверительная вероятность = 0, 95. Решение. ; . – доверительный интервал. Если, например, , то (3, 12; 5, 08). Смысл результата: если произведено достаточно большое число выборок, то 95% из них определяют такие доверительные интервалы, в которых неизвестное математическое ожидание а действительно заключено. Лишь в 5% случаев а может выйти за границы доверительного интервала. Вычисление объема выборки при заданных и Пусть требуется оценить математическое ожидание, если заданы доверительная вероятность и точность оценки . Точность оценки . Тогда . Значит, – минимальный объем выборки, который обеспечит заданную точность . Замечание. Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном . X – количественный признак, распределён нормально. a, – неизвестны. Требуется оценить a. Можно доказать, что - доверительный интервал, покрывающий неизвестное математическое ожидание a с доверительной вероятностью , где – выборочная средняя; – исправленное среднее квадратическое отклонение; – квантиль распределения, который находят по таблице 3 по заданным и . Задачи _______________________________________________________ ´ 1. Найти доверительный интервал для оценки с надежностью 0, 99 неизвестного математического ожидания a нормально распределённого признака Х генеральной совокупности, если известны генеральное среднее квадратичное отклонение σ = 4, выборочная средняя и объём выборки n = 16. 2. На овцеводческой ферме из стада произведена выборка для взвешивания 36 овец. Их средний вес оказался равным 50 кг. Предположив распределение веса нормальным и определив несмещённую оценку выборочной дисперсии S2 = 16, найти доверительный интервал для оценки математического ожидания с надёжностью 0, 95. 3. Выборка из большой партии электроламп содержит 100 ламп. Средняя продолжительность горения лампы выборки оказалась равной 1000 ч. Найти с надежностью 0, 95 доверительный интервал для средней продолжительности a горения лампы всей партии, если известно, что продолжительность горения лампы распределена нормально. 4. Найти минимальный объём выборки, при котором с надежностью 0, 975 точность оценки математического ожидания a генеральной совокупности по выборочной средней равна δ = 0, 3, если известно среднее квадратичное отклонение σ = 1, 2 нормально распределённой генеральной совокупности. 5. Найти минимальный объем выборки, при котором с надежностью 0, 925 точность оценки математического ожидания нормально распределённой генеральной совокупности по выборочной средней равна 0, 2, если известно среднее квадратичное отклонение генеральной совокупности σ = 1, 5. 6. Из генеральной совокупности извлечена выборка:
Оценить с надежностью 0, 95 математическое ожидание a нормально распределённого признака генеральной совокупности по выборочной средней при помощи доверительного интервала. 7. Из генеральной совокупности извлечена выборка:
Оценить с надежностью 0, 95 математическое ожидание a нормально распределённого признака генеральной совокупности по выборочной средней при помощи доверительного интервала. 8. По данным выборки объёма n = 50 из генеральной совокупности нормально распределённого количественного признака найдено исправленное среднее квадратичное отклонение s = 14. Найти доверительный интервал, покрывающий генеральное среднее квадратичное отклонение σ с надежностью 0, 999. 9. Случайная величина Х распределена по нормальному закону. Статистическое распределение выборки представлено в таблице:
Найти с надежностью 0, 97 доверительный интервал для оценки математического ожидания и с надежностью 0, 95 – для оценки среднего квадратичного отклонения. 10. Случайная величина Х распределена по нормальному закону. Статистическое распределение выборки представлено в таблице:
Найти с надежностью 0, 95 доверительный интервал для оценки математического ожидания и с надежностью 0, 99 – для оценки среднего квадратичного отклонения. §9. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ
Предположение о том, что статистические данные о количественном признаке Х соответствуют теоретическому закону распределения (назовём его А), является статистической гипотезой, обозначаемой чаще всего через Н . Ставится задача – проанализировав экспериментально полученные данные, обосновать выбор одного из двух решений: 1) принять гипотезу о распределении статистических данных по закону А; 2) отвергнуть гипотезу о соответствии данных выборки закону распределения А. В силу того, что данные выборки случайны, нет гарантии, что принятое решение будет правильным. Возможны два варианта ошибок: 1) ошибка 1-го рода – отвергнута правильная гипотеза; 2) ошибка 2-го рода – принята неправильная гипотеза. Всю ситуацию можно описать таблицей 4 Таблица 4
Вероятность совершить ошибку 1-го рода называют уровнем значимости гипотезы и обозначают a. Величину a задают такой, чтобы случайное событие с вероятностью a можно было считать практически невозможным. Обычно используют значения a, равные 0, 01; 0, 05; 0, 1. Для проверки статистических гипотез используют специально подобранные случайные величины, оценивающие степень расхождения эмпирического и теоретического законов, называемые критериями. Таким образом, гипотеза Н – есть предположение о характере распределения признака Х, а используемый для проверки критерий называют критерием согласия. Выбор теоретического закона распределения А обычно выполняется по гистограмме интервального статистического ряда на основании соответствия её плотности распределения закону А. Наиболее часто выбирается нормальный закон распределения, и для проверки соответствия ему опытных данных используются критерии согласия Пирсона, Ястремского, Колмогорова, Вилкоксона. Опишем процедуру проверки гипотезы о соответствии экспериментальных данных нормальному закону распределения по критерию согласия Пирсона. 1. Примем определённое значение уровня значимости a. 2. Сгруппируем экспериментальные данные в классы (интервалы) таким образом, чтобы в каждый класс попало не менее пяти наблюдений. Число, полученных классов обозначим k. Для расчёта числа классов без учёта объединения существует несколько формул, например к » 1 + 3, 2 lg n, где n – объем выборки. 3. Найдём статические оценки параметров нормального распределения:
a и S .
4. Найдём для каждого класса (xi, xi+1) выровненные частоты =Рi× n, где n – объём выборки; Ф(х) – функция Лапласа: (11)
5. В качестве критерия согласия рассмотрим случайную величину, обозначаемую c2 и определяемую по формуле: (12)
Случайная величина Пирсона c2 имеет специальное распределение, зависящее от числа степеней свободы r. Для гипотезы о нормальном распределении Х, число степеней свободы:
r = k – 3, где k – число классов. (13)
Очевидно, что чем ближе эмпирические частоты ni к теоретическим (выровненным) частотам , тем более достоверна гипотеза о нормальном распределении, и в то же время тем меньше значение c2. На рисунке 7 изображён график плотности распределения c2 (дифференциальной функции f(c2)) для r = 6. Вся площадь между графиком и осью абсциссравна единице. Незаштрихованная часть площади равна вероятности , заштрихованная площадь равна вероятности .
Рис. 7 Пусть заштрихованная площадь равна уровню значимости:
(16)
где a – вероятность практически невозможного события. Тогда попадание c2 в интервал практически невозможно. Заштрихованную площадь называют критической областью данного уровня значимости. Очевидно, что чем больше a, тем меньшим (при данном числе степеней свободы r) будет значение . Имеются таблицы распределения (Пирсона), в которых приведены значения для различного числа степеней свободы r и уровней значимости a. При одном и том же уровне значимости a значение возрастает при увеличении числа степеней свободы r. 6. Определяем значение для принятого уровня значимости и числа степеней свободы r. 7. По данным статистического ряда вычисляем наблюдаемое (в данной выборке) значение . Обозначим это значение (15)
8. Сравнивая и решаем вопрос о принятии или отклонении гипотезы Н о соответствии данных выборки нормальному закону распределения, исходя из следующего: – если > , то это означает, что наблюдаемое значение попало в критическую область, т.е. произошло событие, которое считали практически невозможным. Следовательно, данные выборки противоречат гипотезе о нормальном распределении, и гипотеза отвергается; – если , то это означает, что данные выборки не противоречат гипотезе о нормальном распределении, гипотезу можно принять. Пример 11 . Проверка по критерию Пирсона гипотезы о нормальном распределении количественного признака Х по результатам 150 его измерений, сведённых в таблицу частот:
Построим гистограмму, где по оси абсцисс отложим отрезки [xi; xi+1], а hi=Wi/Dxi=Wi/3.
По форме гистограммы выдвинем гипотезу Н : изучаемый признак Х имеет нормальный закон распределения. Найдём оценки числовых характеристик закона: - выборочные средняя и дисперсия: - исправленное среднее квадратичное отклонение: Вычисляем значения аргумента и значения функции Лапласа (по таблице значений функции Лапласа) в этих точках. Приведём вычисления для первого и последнего классов.
Для остальных классов выравненные относительные частоты Pi и выравненные частоты определяются аналогично. Выравненные частоты для укрупненных классов приведены в таблице
Примечание. Два первых класса и два последних класса объединены ввиду их малочисленности. Этапы реализации критерия Пирсона: 1. Примем уровень значимости a = 0, 05. 2. Сгруппируем классы так, чтобы частота в каждом классе была не менее пяти. Для этого объединим два первых класса и объединим два последних класса. При этом частоты ni и выравненные частоты ni’ для объединенных классов суммируются. Число классов стало k = 8. В каждом классе подсчитываем величину . 3. Из таблицы критических точек распределения (см. приложение 6) найдем для числа степеней свободы r = 8 – 3 = 5 и принятого уровня значимости a = 0, 05. Получим . 4. По последней таблице подсчитываем наблюдаемое значение критерия 5. Сравним и . Так как , то гипотезу о нормальном распределении можно считать правдоподобной. Задачи _______________________________________________________ ´ 1. Результаты взвешивания 50 случайным образом отобранных пачек чая приведены ниже (в граммах): 2. Масса (в граммах) произвольно выбранных 30 пачек полуфабриката «Геркулес» такова: 503; 509; 495; 493; 489; 485; 507; 511; 487; 495; 506; 504; 507; 511; 499; 491; 494; 518; 506; 515; 487; 509; 507; 488; 495; 490; 498; 497; 492; 495. 3. Результаты исследования числа покупателей в универсаме, в зависимости от времени работы, приведены ниже:
Можно ли утверждать при уровне значимости α = 0, 05, что случайная величина X – число покупателей – подчинена нормальному закону распределения? 4. При обследовании диаметров карданных валов автомобиля, выпускаемых заводом, были зафиксированы отклонения от номинала Δ d (мкм), приведенные в таблице:
Проверить гипотезу о нормальном распределении случайной величины Δ d при уровне доверия g = 0, 9. 5. Интервал движения поездов метро составляет 2 минуты. В таблице приведены значения случайной величины X – времени ожидания пассажирами поезда:
Проверить гипотезу о нормальном распределении случайной величины X при уровне значимости α = 0, 01. 6. По данным выборочного обследования получено распределение семей по среднедушевому доходу (в усл. ед.):
Проверить гипотезу о нормальном распределении случайной величины – среднедушевого дохода семьи – при уровне доверия g = 0, 9. 7. В таблице приведены значения прибыли 50 фирм, принадлежащих одной корпорации, Q (1000 усл. ед.):
Проверить гипотезу о нормальности распределения случайной величины Q при уровне доверия g = 0, 99. 8. Имеются данные о годовой мощности М (тыс. т) предприятия цементной промышленности:
Проверить гипотезу о нормальности распределения случайной величины М при уровне доверия g = 0, 9. 9. Для определения средней заработной платы работников определённой отрасли было обследовано 100 человек. Результаты представлены в следующей таблице (данные условные):
Выяснить, можно ли при уровне значимости α = 0, 05 считать нормальным распределение средней заработной платы. 10. В 1889–1890 годах был измерено рост 1000 взрослых мужчин (рабочих московских фабрик). Результаты измерений представлены в таблице:
Проверить при уровне доверия 0, 95 гипотезу, состоящую в том, что рост взрослого мужчины (случайная величина Х) имеет нормальное распределение. |
Последнее изменение этой страницы: 2017-03-17; Просмотров: 133; Нарушение авторского права страницы