![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Генеральная совокупность и выборкаСтр 1 из 5Следующая ⇒
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Математическая статистика - это раздел прикладной математики, в котором рассматриваются методы отыскания законов и характеристик случайных величин по результатам наблюдений и экспериментов.
Основные задачи математической статистики. 1. Создание методов сбора и группировки обрабатываемого статистического материала, полученного в результате наблюдений за случайными процессами. 2. Разработка методов анализа полученных статистических данных. 3. Получение выводов по данным наблюдений.
Анализ статистических данных включает оценку вероятностей события, функции распределения вероятностей или плотности вероятностей, оценку параметров известного распределения, оценку связей между случайными величинами. Математическая статистика опирается на теорию вероятностей и в свою очередь служит основой для разработки методов обработки и анализа статистических результатов в конкретных областях человеческой деятельности. ВЫБОРКА И ЕЕ РАСПРЕДЕЛЕНИЕ
Генеральная совокупность и выборка Основными понятиями математической статистики являются генеральная совокупность и выборка. Определение. Генеральная совокупность – это совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины. Генеральная совокупность может быть конечной или бесконечной в зависимости от того, конечна или бесконечна совокупность составляющих ее объектов. Не следует смешивать понятие генеральной совокупности с реально существующими совокупностями. Например, на склад поступила продукция некоторого цеха за месяц, что является реально существующей совокупностью, которую нельзя назвать генеральной, поскольку выпуск продукции можно мысленно продолжить сколь угодно долго. Определение. Выборкой (выборочной совокупностью)называется совокупность случайно отобранных объектов из генеральной совокупности. Выборка должна быть репрезентативной (представительной), то есть ее объекты должны достаточно хорошо отражать свойства генеральной совокупности. Выборка может быть повторной, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность, и бесповторной, при которой отобранный объект не возвращается в генеральную совокупность. Применяют различные способы получения выборки. 1)Простой отбор – случайное извлечение объектов из генеральной совокупности с возвратом или без возврата. 2) Типический отбор, когда объекты отбираются не из всей генеральной совокупности, а из ее «типической» части. 3) Серийный отбор – объекты отбираются из генеральной совокупности не по одному, а сериями. 4) Механический отбор - генеральная совокупность «механически» делится на столько частей, сколько объектов должно войти в выборку и из каждой части выбирается один объект. Число
Вариационные ряды Полученные различными способами отбора данные образуют выборку, обычно это множество чисел, расположенных в беспорядке. По такой выборке трудно выявить какую-либо закономерность их изменения (варьирования). Для обработки данных используют операцию ранжирования, которая заключается в том, что результаты наблюдений над случайной величиной, то есть наблюдаемые значения случайной величины располагают в порядке возрастания. Пример 1. Дана выборка: ¦ Проведем ранжирование выборки: После проведения операции ранжирования значения случайной величины объединяют в группы, то есть группируют так, что в каждой отдельной группе значения случайной величины одинаковы. Каждое такое значение называется вариантом. Варианты обозначаются строчными буквами латинского алфавита с индексами, соответствующими порядковому номеру группы Изменение значения варианта называется варьированием. Определение. Последовательность вариантов, записанных в возрастающем порядке, называется вариационным рядом. Число, которое показывает, сколько раз встречаются соответствующие значения вариантов в ряде наблюдений, называется частотой или весом варианта и обозначается Отношение частоты данного варианта к общей сумме частот называется относительной частотой или частостью (долей) соответствующего варианта и обозначается Определение. Дискретным статистическим рядом называется ранжированная совокупность вариантов Дискретный статистический ряд удобно записывать в виде табл.1. Таблица 1 (для примера 1)
Характеристики дискретного статистического ряда: 1. Размах варьирования 2. Мода ( в примере 1. 3. Медиана
Пусть Если ( в примере 1.
Если изучаемая случайная величина Сначала определяют число интервалов Таблица 2.
Затем определяют длину частичного интервала
Более точно шаг можно рассчитать с помощью формулы Стерджеса:
Если шаг окажется дробным, то за длину интервала берут ближайшее целое число или ближайшую простую дробь (обычно берут интервалы одинаковые по длине, но могут быть интервалы и разной длины). За начало первого интервала рекомендуется брать величину Просматривая результаты наблюдений, определяют сколько значений случайной величины попало в каждый конкретный интервал. При этом в интервал включают значения, большие или равные нижней границе интервала, и меньшие – верхней границы. В первую строку таблицы статистического распределения вписывают частичные промежутки Во второю строку статистического ряда вписывают количество наблюдений Подсчет частот для каждого интервала удобно проводить методом «конвертиков». Этот метод состоит в том, что попадание значения случайной величины в тот или иной интервал, отмечается точкой, а также и черточкой. В результате каждому десятку будет соответствовать фигура, похожая на конверт.
При вычислении интервальных частостей округление результатов следует производить таким образом, чтобы сумма частостей была равна 1. Иногда интервальный статистический ряд, для простоты исследований, условно заменяют дискретным. В этом случае серединное значение
Пример 2. Построить эмпирическую функцию и ее график по данным табл.1 ¦
Рис. 1 ?
Асимметрия. Эксцесс.
Приведем краткий обзор характеристик, которые наряду с уже рассмотренными применяются для анализа статистических рядов и являются аналогами соответствующих числовых характеристик случайной величины. Среднее выборочное и выборочная дисперсия являются частным случаем более общего понятия – момента статистического ряда.
Определение. Начальным выборочным моментом порядка
Из определения следует, что начальный выборочный момент первого порядка: Определение. Центральным выборочным моментом порядка
Из определения следует, что центральный выборочный момент второго порядка :
Определение . Выборочным коэффициентом асимметрииназывается число Выборочный коэффициент асимметрии служит для характеристики асимметрии полигона вариационного ряда. Если полигон асимметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем другая. Если
Определение. Выборочным коэффициентом эксцесса или коэффициентом крутости называется число Выборочный коэффициент эксцесса служит для сравнения на «крутость» выборочного распределения с нормальным распределением. Коэффициент эксцесса для случайной величины, распределенной по нормальному закону, равен нулю. Поэтому за стандартное значение выборочного коэффициента эксцесса принимают Если СТАТИСТИЧЕСКИЕ ОЦЕНКИ
Одной из центральных задач математической статистики является задача оценивания теоретического распределения случайной величины на основе выборочных данных. При этом часто предполагается, что вид закона распределения генеральной совокупности известен, но неизвестны параметры этого распределения, такие как математическое ожидание, дисперсия. Требуется найти приближенные значения этих параметров, то есть получить статистические оценки указанных параметров.
Определение . Статистической оценкой Рассматривая выборочные значения Если для оценки Если число наблюдений невелико, то замена неизвестного параметра
Точечные оценки Статистические оценки могут быть точечными и интервальными. Точечные оценки представляют собой число или точку на числовой оси. Чтобы оценка Определение. Оценка
Поясним смысл этого равенства. Пусть Свойство состоятельности нужно проверять в первую очередь. Оно обязательно для любого правила оценивания. Несостоятельные оценки не используются.
Определение. Оценка Это свойство оценки желательно, но не обязательно. Часто полученная оценка бывает смещенной, но ее можно поправить так, чтобы она стала несмещенной. Иногда, оценка бывает асимптотически несмещенной , то есть Требования несмещенности особенно важно при малом числе опытов.
Определение. Несмещенная оценка
Можно показать, что: - - - (при больших
- относительная частота
- эмпирическая функция распределения выборки
Для нахождения оценок неизвестных параметров используют различные методы. Наиболее распространенными являются: метод моментов, метод максимального правдоподобия (ММП), метод наименьших квадратов (МНК).
Интервальные оценки При выборке малого объема точечная оценка может существенно отличаться от оцениваемого параметра. В этом случае целесообразно использовать интервальные оценки.
Определение. Интервальнойназывают оценку, которая определяется двумя числами – концами интервала. Пусть найденная по данным выборки величина Поскольку
Определение. Доверительной вероятностью ( надежностью) оценки Обычно задается надежность Неравенство Определение. Доверительным интервалом называется интервал
Сущность метода
Множество всех значений критерия разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза Критической областью называется совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы (областью допустимых значений) называется совокупность значений критерия, при которых нулевую гипотезу принимают. Обозначим критическую область Если вычисленное по выборке значение критерия Критическая область
Правосторонняя критическая область (рис.4 а) состоит из интервала
Левосторонняя критическая область (рис.4 б) состоит из интервала
Двусторонняя критическая область (рис.4 в) состоит из следующих двух интервалов: и называются двусторонними критическими точками.
Рис.4 Проверка гипотезы По критерию Пирсона
Пусть выборка из генеральной совокупности
где
Требуется проверить гипотезу
Правило проверки 1. Вычисляем 2. Находим теоретические частоты Их можно вычислить двумя способами. Первый способ
где
находим по таблице (Приложение 1).
величины
Для вычисления Таблица 9
Второй способ.
где
Полагают
Для вычисления Таблица 10
3. Сравниваем эмпирические (
Для этого: 1) составляем расчетную табл.11, по которой находим
Таблица 11.
Контроль:
2) Находим число степеней свободы
где
Популярное:
|
Последнее изменение этой страницы: 2016-03-22; Просмотров: 4971; Нарушение авторского права страницы