Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Числовые характеристики выборки



Для статистической выборки можно определить ряд числовых параметров, аналогичных тем, что были введены в рассмотрение для случайных величин в теории вероятностей.

Выборочное среднее – это среднее арифметическое наблюдаемых значений выборки:

= где - частость.

Выборочная статистическая дисперсия: D = .

Выборочное среднее квадратичное отклонение:

.

Часто в качестве характеристик вариационного ряда xi используются также понятия моды и медианы.

Модой М0* вариационного ряда называется варианта, имеющая наибольшую частоту.

 

Медиана Ме* - это признак Х, приходящийся на середину вариационного ряда.

В приведенном выше примере:

= 15, 75; D=25, 42; = 5, 04; М0* = 3; Ме* = 15.

 

Статистическая оценка параметров распределения

При изучении случайной величины Х с законом распределения, зависящим от одного или нескольких параметров, требуется по известной выборке

х1, х2, … хп, полученной в результате наблюдений (опытов), оценить некоторый параметр

Статистической оценкой п параметра теоретического распределения выборки называют его приближенное значение, зависящее от этого выбора.

Очевидно, оценка является значением некоторой функции результатов наблюдений над случайной величиной, а сама функция при этом называется статистикой.

К оценке любого статистического параметра предъявляется на практике ряд требований, которым она должна удовлетворять, чтобы быть близкой к своему истинному значению и максимально соответствовать реальности.

 

Свойства статистических оценок.

Качества оценки определяют, проверяя, обладает ли она свойствами несмещенности, состоятельности и эффективности.

Оценка параметра называется несмещенной, если , т.е. математическое ожидание случайной величины должно быть равно значению параметра .

Оценка п называется состоятельной, если сходится по вероятности к оцениваемому параметру: . Это означает, что с увеличением объема выборки мы все ближе к истинному (достоверному) значению .

Несмещенная оценка п называется эффективной, если ее дисперсия минимальна.

Статистическая оценка, используемая в качестве приближенного значения неизвестного параметра генеральной совокупности, называется ее точечной оценкой.

Точечные оценки хороши в качествепервоначальных результатов обработки наблюдений, однако заранее неизвестно с какой точностью они представляют оцениваемый параметр.

В результате возникает задача о приближении параметра не одним числом, а целым интервалом значений (в частности концами интервала), при этом оценка неизвестного параметра будет называться интервальной, а интервал ( 1; 2), накрывающий с вероятностью истинное значение параметра , - доверительным интерваломи вероятность - надежностью оценки или доверительной вероятностью.

6. Статистическая проверка гипотез

Одна из часто встречающихся на практике задач, связанных с применением статистических методов, состоит в решении вопроса о том, должно ли на основании данной выборки быть принято или отвергнуто предположение (гипотеза) относительно некоторого свойства генеральной совокупности (случайной величины).

Например, новое лекарство испытано на определенном числе людей. Можно ли сделать обоснованный вывод о том, что это лекарство более эффективно, чем применявшееся ранее.

Сопоставление высказанного предположения с имеющимися выборочными данными называется проверкой гипотез.

В частности, под статистической гипотезой понимают всякое высказывание (предположение) о генеральной совокупности, проверяемое по выборке.

Правило, по которому принимается решение о принятии или отклонении гипотезы называется статистическим критерием или критерием проверки гипотезы, например известные критерии согласия Пирсона, Колмогорова, Фишмана и др., используемые часто на практике для проверки законов распределения случайных величин.


Решение типовых заданий

Задание 1

Пример 1. В ящике 15 шаров, из которых 5 голубых и 10 красных. Наугад выбирают 6 шаров. Найти вероятность того, что среди вынутых шаров

а) 2 голубых;

б) все красные.

Решение.

а) Общее число элементарных исходов данного опыта равно числу сочетаний из 15 по 6, т.е.

.

Т.к. из 6 выбранных шаров должно быть 2 голубых, остальные 4 должны быть красными. Число благоприятных исходов равно произведению

.

Искомая вероятность определяется формулой

.

Ответ: .

б) Общее число элементарных исходов данного опыта равно числу сочетаний из 15 по 6, т.е.

.

Т.к. из 6 выбранных шаров все должны быть красными, то число благоприятных исходов равно

.

Искомая вероятность определяется формулой

.


Задание 2

Пример 1. В квадрат вписана окружность радиуса R, а в окружность вписан правильный треугольник. Найти вероятность того, что точка, брошенная наудачу в квадрат, попадет в треугольник.

Решение.

Вероятность попадания точки в треугольник равна отношению площади треугольника к площади квадрата:

,

при этом сторона квадрата, описанного около окружности радиуса R, равна 2R, а площадь ; площадь треугольника, вписанного в окружность радиуса R, равна . Тогда

.

Ответ: .

Пример 2. В цилиндр (радиус основания равен R, высота равна R) вписан конус, основание которого совпадает с основанием цилиндра. Найти вероятность того, что точка, выбранная наугад внутри цилиндра, окажется внутри конуса.

Решение.

Вероятность попадания точки в конус равна отношению объема конуса к объему цилиндра:

.

Объем цилиндра, высота которого равна H, а радиус основания R, определяется по формуле , а так как , то .

Объем конуса, высота которого равна H, а радиус основания R, вычисляется по формуле . Т.к. высота конуса равна высоте цилиндра, то для конуса , тогда . Отсюда .

Ответ: .


Задание 3

Пример 1. Вероятность попадания в цель для каждого из трех орудий равна соответственно 0, 5; 0, 8; 0, 6. Найти вероятность того, что при залпе из трех орудий

а) все орудия попадут в цель;

б) не попадет в цель ни одно орудие;

в) попадет в цель только одно орудие;

г) попадет в цель хотя бы одно орудие;

д) попадут в цель только два орудия.

Решение.

Обозначим через событие «i-е орудие при одном выстреле попадает в цель», i = 1, 2, 3. Тогда вероятности этих событий по условию равны:

, , .

а) Событие : «все орудия попадут в цель». Три попадания будут тогда и только тогда, когда попадание наступит при каждом выстреле, т.е. . Тогда по теореме умножения

.

б) Событие : «ни одно орудие не попадет в цель». Три промаха будут тогда и только тогда, когда промах явится результатом каждого выстрела, т.е. события осуществляются все вместе: . Тогда по теореме умножения

.

Учитывая, что

,

,

,

получаем

.

в) Событие : «попадет в цель только одно орудие». При трех выстрелах возможны следующие варианты: первое орудие попадет, второе и третье не попадут; второе попадет, первое и третье не попадут; третье орудие попадет, первое и второе не попадут. Тогда . Поскольку события несовместны, то по теореме сложения

г) Событие : «попадет в цель хотя бы одно орудие». Это означает, что в цель могут попасть одно, или два, или три орудия, что является противоположным событию «ни одно орудие не попадет в цель», которое рассматривалось в п. б) данной задачи и обозначалось . Следовательно, , и

.

д) Событие : «попадут в цель только два орудия». При трех выстрелах возможны следующие варианты: первое и второе орудие попадут, третье не попадет; первое и третье попадут, второе не попадет; второе и третье попадут, первое не попадет. Тогда . Поскольку события несовместны, то по теореме сложения


Задание 4

Пример 1. Больница специализируется на лечении заболеваний А, Б и В. Количества больных, поступающих в эту больницу с заболеваниями А, Б, В, находятся в отношении 5: 3: 2 соответственно. Вероятность полного излечения болезни А равна 0, 7, для болезней Б и В эти вероятности равны соответственно 0, 8 и 0, 9. Найти вероятность того, что поступающий в больницу больной будет выписан здоровым.

Решение.

Обозначим через , , соответственно следующие события: «больной страдает болезнью А», «больной страдает болезнью Б», «больной страдает болезнью В». Пусть С – событие «больной будет выписан здоровым». Поскольку , , составляют полную группу попарно несовместных событий, то для определения вероятности события С применим формулу полной вероятности:

.

По условию , , . Кроме того, поскольку количество больных, А, Б и В, находятся в отношении 5: 3: 2, то , , .

В итоге имеем: .

Ответ: 0, 77.

Пример 2. Решить предыдущую задачу при условии, что требуется найти вероятность того, что выписанный здоровым больной страдал заболеванием В.

Решение.

Сохраним обозначения, использованные при решении предыдущей задачи. В этих обозначениях требуется найти условную вероятность , где событие означает «выздоровевший больной страдал болезнью В». Воспользуемся формулой Байеса: .

Ответ: .


Задание 5

Дано распределение дискретной случайной величины Х. Найти математическое ожидание, дисперсию, среднеквадратическое отклонение.

Х
Р 0, 1 0, 4 0, 5

 

Решение.

Математическое ожидание:

.

Дисперсию можно вычислить по формуле:

.

Определим случайную величину Х2:

 

Х2
Р 0, 1 0, 4 0, 5

 

и ее математическое ожидание:

.

Тогда дисперсия случайной величины Х равна

.

Среднеквадратическое отклонение:

.


Задание 6

Пример 1. Плотность вероятности случайной величины Х равна , . Определить константу с.

Решение.

Согласно свойству плотности непрерывной случайной величины . Но

.

Следовательно, , .

Пример 2. Плотность вероятности случайной величины Х равна

Найти функцию распределения случайной величины Х и вероятность попадания Х в промежуток .

Решение.

Поскольку все значения случайной величины Х сосредоточены на промежутке , то при верно , а при верно , где - функция распределения случайной величины Х. Пусть . Тогда по определению функции распределения непрерывной случайной величины имеем:

И наконец, .

Пример 3. Вычислить математическое ожидание случайной величины Х, плотность вероятности которой равна

Решение.

Используем формулу для вычисления математического ожидания непрерывных случайных величин:

.

Вначале найдем первообразную функции методом интегрирования по частям:

Итак, .


Задание 7

Пример 1. Книга издана тиражом 100000 экземпляров. Вероятность того, что книга сброшюрована неправильно, равна 0, 0001. Найти вероятность того, что тираж содержит

а) не более двух бракованных книг;

б) более двух бракованных книг.

Решение.

Пусть случайная величина Х выражает число бракованных книг в тираже. Тогда случайная величина Х распределена по биномиальному закону с параметрами , .

а) Утверждение «тираж содержит не более двух бракованных книг» означает, что бракованных книг может быть 0 (ни одной), 1 или 2. Тогда искомая вероятность будет равна

.

Эта формула хоть и точная, но трудновычислима. Воспользуемся тем, что поскольку число n велико, а вероятность p мала, случайную величину Х приближенно можно считать распределенной по закону Пуассона с параметром np, т.е. . В нашем случае . Поэтому искомая вероятность будет приближенно равна

.

Ответ: 0, 003.

б) Поскольку , то, используя ранее вычисленное значение, получим

.

Ответ: 0, 997.

Пример 2. Длительность Т телефонного разговора является случайной величиной, распределенной по показательному закону. Известно, что средняя длительность телефонного разговора равна 3 минутам. Найти вероятность того, что разговор будет длиться

а) не более трех минут;

б) более трех минут.

Решение.

По условию задачи параметр показательного распределения длительности Т равен .

а) .

Ответ: 0, 632.

б) .

Ответ: 0, 368.


Задание 8

Пример 1. Случайные ошибки измерения подчинены нормальному закону со средним квадратическим отклонением 20 мм и математическим ожиданием, равным нулю. Систематические ошибки отсутствуют. Найти вероятность того, что из трех независимых измерений ошибка хотя бы одного из них не превзойдет по абсолютной величине 4 мм.

Решение.

Известно, что для случайной величины Х, распределенной по нормальному закону с параметрами и , , где - функция распределения стандартного закона. В нашем случае , , . Поэтому вероятность того, что при одном измерении ошибка не превзойдет 4 мм, будет равна , где значение берется из таблицы, приведенной выше.

Таким образом, вероятность того, что в каждом из трех независимых измерений ошибка превзойдет по абсолютной величине 4 мм, будет равна

.

Отсюда искомая вероятность равна 1 - 0, 5957 = 0, 4043.

Ответ: 0, 4043.

Пример 2. Случайная величина распределена по нормальному закону с параметрами 10 (математическое ожидание) и 2 (среднеквадратическое отклонение). Найти вероятность того, что в результате испытания она примет значение из промежутка (12, 14).

Решение.

Известно, что для случайной величины Х, распределенной по нормальному закону с параметрами и , .

В нашем случае , , , , откуда искомая вероятность будет равна:

Ответ: 0, 1359.

Пример 3. Случайная величина Х распределена по нормальному закону со средним квадратическим отклонением 5 мм. Найти длину интервала, симметричного относительно математического ожидания этой случайной величины, в который она попадет с вероятностью 0, 9973 в результате одного испытания.

Решение.

Обозначим через длину искомого интервала, а через а – математическое ожидание случайной величины Х. Тогда

.

Следовательно, , откуда - квантиль уровня 0, 9987 стандартного закона. Воспользовавшись таблицей, приведенной выше, получим:

, , .


Задание 9

Пример. В страховой компании 10000 клиентов. В случае наступления страхового случая страховое возмещение равно 500 ден. ед. Вероятность наступления страхового случая, по оценкам экспертов, равна 0, 006. Найти вероятность того, что компания окажется в убытке к концу года, если страховой взнос равен 3, 5 ден. ед.

Решение.

Пусть случайная величина Y выражает число наступлений страховых случаев в течение года. Тогда общая сумма страхового возмещения составит 500Y ден. ед. Обозначим через x минимальную стоимость страхового взноса каждого клиента. Тогда 10000x – суммарный страховой взнос. Компания будет в убытке, если величина 500Y превзойдет 10000x.

Согласно условию, должно выполняться неравенство

.

Отсюда имеем: , .

Но по интегральной теореме Муавра-Лапласа

,

где , - функция распределения стандартного закона. Следовательно, .

Отсюда ввиду монотонности функции , где - квантиль уровня 0, 9938 стандартного закона. По таблице определяем, что . Поэтому , или , т.е. минимальный страховой взнос должен составить 4 ден. ед.

Ответ: 4 ден. ед.


Задание 10

Вероятность приема каждого из 100 передаваемых сигналов равна 0, 8. Найти вероятность того, что будет принято: а) 85 сигналов; б) не менее 70 и не более 90 сигналов.

Решение.

а) Воспользуемся локальной теоремой Муавра-Лапласа. Из условия следует, что

Определяем .

По таблице (см. приложение) найдем

Согласно формуле получаем искомую вероятность

б) Воспользуемся интегральной теоремой Муавра-Лапласа. Из условия следует, что

Определяем ;

.

По таблице значений функции Лапласа (см. приложение) находим

Согласно формуле получаем искомую вероятность


Задание 11

Пример 1. На основании анализа производительности труда 20 человек, выбранных из достаточно большой генеральной совокупности, было установлено, что среднее квадратическое отклонение суточной выработки составляет 15 кг в час, а выборочная средняя производительность – 620 кг в час. Предполагая, что производительность имеет нормальное распределение, найти границы, в которых с надежностью 0, 9 заключены соответственно средняя суточная производительность всей генеральной совокупности и ее дисперсия.

Решение.

Поскольку объем генеральной совокупности достаточно большой (это сказано в условии), то выборку из 20 человек можно считать повторной. Известно, что если генеральная совокупность имеет нормальное распределение, то доверительные интервалы с надежностью γ соответственно для ее математического ожидания и дисперсии равны

, .

где n – объем повторной выборки, и - соответственно выборочные средняя и дисперсия, - квантиль уровня t-распределения с степенями свободы, - квантиль уровня -распределения с степенями свободы. В нашем случае , , , , . Поэтому искомые доверительные интервалы для генеральных средней и дисперсии соответственно равны (614, 05; 625, 95), (149, 5; 445, 5).

Пример 2. При обследовании выработки рабочих большого завода по схеме собственно-случайной повторной выборки было отобрано 100 рабочих и по этой выборке получены следующие данные: средняя выработка равна 119, 2 %, среднее квадратическое отклонение равно 9, 353 %. Определить границы, в которых с вероятностью 0, 9 заключена средняя выработка рабочих завода; определить объем выборки, при котором с вероятностью 0, 9 отклонение средней выработки рабочих в выборке от средней выработки рабочих завода не превзойдет 1 %.

Решение.

Известно, что для выборок большого объема доверительный интервал с надежностью для генеральной средней приближенно равен

,

где n – объем выборки, и s – соответственно выборочные средняя и дисперсия, - квантиль уровня нормального закона. В нашем случае , , , . Поэтому искомый доверительный интервал равен (117, 67; 120, 73).


Задание 12

Пример 1. В следующей таблице приводятся данные по расходу сырья на единицу продукции в зависимости от использования новой и старой технологий:

 

Старая технология

 

Новая технология

 

Полагая, что расходы сырья по каждой технологии имеют нормальные распределения с одинаковыми дисперсиями, на уровне значимости 0, 05 выяснить, дает ли новая технология экономию в среднем расходе сырья.

Решение.

Вначале определим выборочные средние:

, .

Теперь определим выборочные дисперсии:

, .

Проверяется нулевая гипотеза Н0 о равенстве генеральных средних. В качестве альтернативной берется гипотеза о преимуществе новой технологии над старой. Для проверки нулевой гипотезы используется статистика

,

которая имеет t-распределение Стьюдента с степенями свободы.

В данном примере , , , , , . Поэтому выборочное значение статистики будет равно

.

Поскольку квантиль уровня 0, 95 t-распределения с 20 степенями свободы равен 1, 7 и 3 > 1, 7, то нулевая гипотеза отвергается и можно считать, что новая технология дает значительное уменьшение среднего расхода сырья по сравнению со старой.

Пример 2. В следующей таблице приводятся выборочные данные опроса студентов государственных и негосударственных вузов г. Минска о вредном влиянии курения на учебу:

 

  Вредит Не вредит
Государственные вузы 60 человек 45 человек
Негосударственные вузы 69 человек 71 человек

 

Подтверждают ли эти данные предположение о том, что отношение к курению студентов государственных и негосударственных вузов различно? Принять уровень значимости равным 0, 1.

Решение.

Проверяется гипотеза о равенстве генеральных долей. В качестве альтернативной гипотезы берется гипотеза о различии генеральных долей. Для проверки нулевой гипотезы используется статистика

,

которая имеет стандартное распределение.

В данном примере , , , .

При этом неизвестная величина p заменяется смешанной выборочной долей . Итак, выборочное значение статистики приближенно равно

.

Поскольку квантиль стандартного распределения равен 1, 645 и 1, 21 < 1, 645, то нулевая гипотеза принимается, т.е. полученные данные не противоречат гипотезе об одинаковом отношении студентов к курению.


Варианты заданий для выполнения самостоятельных и контрольных работ

Вариант 1

Задание 1. Среди 100 лотерейных билетов есть 5 выигрышных. Найти вероятность того, что

а) один наугад выбранный билет окажется выигрышным;

б) два наудачу выбранных билета окажутся выигрышными;

в) из десяти выбранных билетов два окажутся выигрышными.

Задание 2. а) На плоскости начерчены две концентрические окружности, радиусы которых 6 и 12 см соответственно. Какова вероятность того, что точка, брошенная наудачу в большой круг, попадет в кольцо, образованное двумя окружностями?

б) В куб со стороной 2R вписан шар. Найти вероятность того, что точка, выбранная наугад внутри куба, окажется внутри шара.

Задание 3. Для сигнализации об аварии установлены три независимо работающих сигнализатора. Вероятность того, что при аварии сигнализатор сработает, равна 0, 9 для первого сигнализатора, 0, 8 для второго и 0, 6 для третьего. Найти вероятность того, что при аварии:

а) сработают все сигнализаторы;

б) не сработает ни один сигнализатор;

в) сработает только один сигнализатор;

г) сработает хотя бы один сигнализатор;

д) сработает только два сигнализатора.

Задание 4. На монетном дворе имеется три группы станков, на которых печатаются деньги. Производительность станков одинаковая, но качество производства на них разное: станки первой группы дают 3% брака, второй – 5%, третий 4%. Количество станков в группах равны соответственно 5, 6 и 3. Все деньги складываются в хранилище. Какова вероятность того, что

а) наугад взятая в хранилище банкнота окажется бракованной;

б) наугад взятая банкнота, оказавшаяся бракованной, напечатана на станке второй группы.


Задание 5. Дано распределение дискретной случайной величины Х.

1) Найти математическое ожидание, дисперсию, среднее квадратическое отклонение.

2) Построить функцию распределения и ее график.

 

Х -5
Р 0, 4 0, 3 0, 1 0, 2

Задание 6. Дана плотность распределения случайной величины . Требуется найти:

а) неизвестный параметр ;

б) функцию распределения случайной величины ;

в) вероятность того, что случайная величина примет значение из интервала ;

г) математическое ожидание, дисперсию и среднее квадратическое отклонение случайной величины .

Дано:

Задание 7. Устройство состоит из 1000 элементов, работающих независимо один от другого. Вероятность отказа любого элемента в течение времени t равна 0, 002. Найти вероятность того, что за время t откажут

а) три элемента;

б) не более трех элементов;

в) более трех элементов.

Задание 8. Длина детали, изготовленной на станке, представляет собой случайную величину, распределенную по нормальному закону с параметрами = 20 см, = 0, 2 см. Какую точност


Поделиться:



Последнее изменение этой страницы: 2017-03-14; Просмотров: 971; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.165 с.)
Главная | Случайная страница | Обратная связь