Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Доверительный интервал, определение необходимого размера выборки
Доказательство «нормальности» распределения. 1. По выборке строим гистограмму: 2. По выборке считаем среднее значение и стандартное отклонение 3. Строим теоретическую кривую по формуле:
4.Рассчитываем эмпирическое значение коэффициента Пирсона 5. Принимаем решение! - Если Xэмп болше равно Хтеор – Н1 Если меньше – Н0 Если эмпирическая статистика больше критического, гипотеза о нормальном распределении отбрасывается, если меньше - данные подчиняются нормальному распределению. Если данные не подчиняются НР: Вы объединили разнородные выборки – разделите их Задуматься о законе распределения. Использовать непараметрические критерии.
Биномиальное распределение и его характеристики Это когда количество наступлений событий выражается как процент от общего количество возможностей. Процент от общего количества возможностей. l В каждой из n попыток вероятность наступления события π одна и та же; l Все попытки независимы друг от друга. Примеры: Количество дефектных изделий среди 10 единиц выпущенной продукции; Количество женщин, работающих в отделе со штатом 75 человек Распределение Пуассона и его характеристики Распределение дискретной величины, которое зависит только от ожидаемого среднего количества наступления событий (в отличие от БР нет заданного числа попыток n) Количество наступления событий в фиксированном количестве попыток. События происходят: l Случайно l Независимо l Среднее число наступления события с ростом числа попыток не изменяется Количество дефектов в произведенной продукции; Количество обращений в отдел кадров за справкой Характеристики: l Стандартное отклонение всегда равно корню квадратному из среднего значения; l Вероятность того, что случайная величина X со средним значением μ равна α:
l При больших средних значениях распределение Пуассона близко к нормальному распределению Экспоненциальное распределение и его характеристики Непрерывное распределение с сильной асимметрией. Время ожидания между 2-мя последовательно наступающими событиями СОБЫТИЯ ПРОИСХОДЯТ: l Случайно l Независимо l С постоянной частотой Время ожидания между 2-мя последовательно наступающими событиями Длительность типичного телефонного разговора; Время безотказной работы кинескопа Характеристики: l Стандартное отклонение всегда равно среднему значению; l Вероятность того, что случайная величина X со средним значением μ принимает значения, меньшее α: Гипотезы. Статистическая проверка гипотез. Классы гипотез. Гипотеза – недоказанное предположение, догадка. 1. О различиях между группами/выборками, 2. О различиях между признаками, 3. О зависимостях между признаками, 4. О форме распределения Ho - Нулевая гипотеза – Гипотеза об отсутствии различий H1 - Альтернативная гипотеза – Гипотеза об значимости различий Направленная гипотеза- в формулировке звучит направление (лучше, хуже) Ненаправленная гипотеза- без направлений Алгоритм проверки гипотез:
Критерии согласия. Классификация методов проверки гипотез. Понятие числа степеней свободы. Критерий проверки гипотезы : решающее правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с высокой вероятностью Непараметрические критерии – рассчитываются на основе частот и рангов Параметрические критерии – можно рассчитать на основе параметров нормального распределения: среднее значение и стандартное отклонение Выбор критерия зависит от вида распределения и объема выборки. Ошибка 1 рода и ошибка 2 рода. T-статистика и t-тест. Вся исследуемая совокупность единиц называется генеральной совокупностью. Выборка – подмножество единиц генеральной совокупности. Типы задач выборочных наблюдений: l Определение ошибки выборки l Перенос выборочных характеристик на ГС l Определение необходимого объема выборки (n) l Оценка случайности расхождений показателей выборочных наблюдений T-распределение (Стьюдента): l Используется для точечного оценивания, построения доверительных интервалов и тестирования гипотез, касающихся неизвестного среднего статистической выборки из нормального распределения. l Для проверки гипотез: теория t-распределения для малых выборок не требует априорного знания или точных оценок математического ожидания и дисперсии генеральной совокупности p-уровень значимости t-критерия равен вероятности ошибочно отвергнуть гипотезу о равенстве средних двух выборок, когда в действительности эта гипотеза имеет место.
Двусторонняя проверка: Односторонняя: Нулевая гипотеза утверждает, что неизвестное среднее значение ГС по меньшей мере так же велико, как заданное значение μ 0 Функция плотности t-распределения- Функция СТЬЮДРАСП: Возвращает вероятность для t-распределения Стьюдента Функция ТТЕСТ используется, чтобы определить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее. 7.5. Непараметрические методы проверки гипотез (Критерий Розенбаума, критерий Манна-Уитни, критерий χ 2 Пирсона) Критерий Р. Цель - Оценка различий между 2 выборками в уровне признака. Условия: Количество измерений в каждой выборке n1, n2 ≥ 11; n1 ≈ n2 Qэмп ≥ Qкр: H1 Qэмп< Qкр: Ho
Критерий Манна-Уитни. Оценка различий между двумя выборками по уровню количественно измеренного признака. Размеры выборок: n1, n2 ³ 3 или n1=2, n2 ³ 5 n1, n2 ≤ 60 Uэмп< U кр0, 05®H1 Uэмп ≥ U кр0, 01®H0
Хи-Квадрат. 1. Сопоставление эмпирического распределения с теоретическим – Разница между фактическими и ожидаемыми частотами. 2. Сопоставление 2-х и более эмпирических распределений ü Количество измерений: n ≥ 30 ü Теоретическая частота: f ≥ 5 1. Если признак принимает 2 значения: k=2, 2. Если признак варьируется в широком диапазоне: укрупняйте разряды признаков. Корреляционный анализ. 8.1. Понятие корреляции. Виды корреляционной связи (парная линейная, параболическая, гиперболическая, множественная, корреляция рангов). Это мера зависимости переменных =сила взаимосвязи данных ПАРНАЯ ЛИНЕЙНАЯ КОРРЕЛЯЦИЯ - Линейная связь между 2-мя переменными
Множественная: Коэффициенты корреляции. Пирсона - Отклонение признака-фактора от его среднего на величину стандартного отклонения в среднем приводит к отклонению признака-результата от своего среднего на величину r его стандартного отклонения. -1 ≤ Rxy ≤ 1 Rxy = -1 Строгая отрицательная корреляция Rxy = 1 Строгая положительная корреляция Rxy = 0 Отсутствие корреляции 0, 7 ≤ | Rxy | ≤ 1 Сильная корреляция 0, 5 ≤ | Rxy | ≤ 0, 7 Средняя корреляция 0, 3 ≤ | Rxy | ≤ 0, 5 Слабая корреляция 0 ≤ | Rxy | ≤ 0, 3 Незначимая корреляция Коэффициент Фехнера • C – количество совпадающих знаков отклонений от средних • H – количество несовпадающих знаков отклонений от средних • C + H = n Коэффициент Спирмена: , где di – разность рангов по обоим признакам для каждого объекта. Популярное:
|
Последнее изменение этой страницы: 2016-08-24; Просмотров: 642; Нарушение авторского права страницы