Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Доверительный интервал, определение необходимого размера выборки



Доказательство «нормальности» распределения.

1. По выборке строим гистограмму:

2. По выборке считаем среднее значение и стандартное отклонение

3. Строим теоретическую кривую по формуле:

       
 
   
 

 

 


4.Рассчитываем эмпирическое значение коэффициента Пирсона

5. Принимаем решение! -

Если Xэмп болше равно Хтеор – Н1

Если меньше – Н0

Если эмпирическая статистика больше критического, гипотеза о нормальном распределении отбрасывается, если меньше - данные подчиняются нормальному распределению.

Если данные не подчиняются НР:

Вы объединили разнородные выборки – разделите их

Задуматься о законе распределения.

Использовать непараметрические критерии.

 

Биномиальное распределение и его характеристики

Это когда количество наступлений событий выражается как процент от общего количество возможностей.

Процент от общего количества возможностей.

l В каждой из n попыток вероятность наступления события π одна и та же;

l Все попытки независимы друг от друга.

Примеры: Количество дефектных изделий среди 10 единиц выпущенной продукции; Количество женщин, работающих в отделе со штатом 75 человек

Распределение Пуассона и его характеристики

Распределение дискретной величины, которое зависит только от ожидаемого среднего количества наступления событий (в отличие от БР нет заданного числа попыток n)

Количество наступления событий в фиксированном количестве попыток.

События происходят:

l Случайно

l Независимо

l Среднее число наступления события с ростом числа попыток не изменяется

Количество дефектов в произведенной продукции; Количество обращений в отдел кадров за справкой

Характеристики:

l Стандартное отклонение всегда равно корню квадратному из среднего значения;

l Вероятность того, что случайная величина X со средним значением μ равна α:

 

 

l При больших средних значениях распределение Пуассона близко к нормальному распределению

Экспоненциальное распределение и его характеристики

Непрерывное распределение с сильной асимметрией.

Время ожидания между 2-мя последовательно наступающими событиями

СОБЫТИЯ ПРОИСХОДЯТ:

l Случайно

l Независимо

l С постоянной частотой

Время ожидания между 2-мя последовательно наступающими событиями

Длительность типичного телефонного разговора; Время безотказной работы кинескопа

Характеристики:

l Стандартное отклонение всегда равно среднему значению;

l Вероятность того, что случайная величина X со средним значением μ принимает значения, меньшее α:

Гипотезы.

Статистическая проверка гипотез. Классы гипотез.

Гипотеза – недоказанное предположение, догадка.

1. О различиях между группами/выборками,

2. О различиях между признаками,

3. О зависимостях между признаками,

4. О форме распределения

Ho - Нулевая гипотеза – Гипотеза об отсутствии различий

H1 - Альтернативная гипотеза – Гипотеза об значимости различий

Направленная гипотеза- в формулировке звучит направление (лучше, хуже)

Ненаправленная гипотеза- без направлений

Алгоритм проверки гипотез:

  1. Формулирование допущений.
  2. Формулирование гипотез (H0 и H1).
  3. Задание критической области.
  4. Выбор критерия и вычисление критериального значения.
  5. Принятие решения

Критерии согласия. Классификация методов проверки гипотез. Понятие числа степеней свободы.

Критерий проверки гипотезы : решающее правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с высокой вероятностью

Непараметрические критерии – рассчитываются на основе частот и рангов

Параметрические критерии – можно рассчитать на основе параметров нормального распределения: среднее значение и стандартное отклонение

Выбор критерия зависит от вида распределения и объема выборки.

Ошибка 1 рода и ошибка 2 рода.

T-статистика и t-тест.

Вся исследуемая совокупность единиц называется генеральной совокупностью.

Выборка – подмножество единиц генеральной совокупности.

Типы задач выборочных наблюдений:

l Определение ошибки выборки

l Перенос выборочных характеристик на ГС

l Определение необходимого объема выборки (n)

l Оценка случайности расхождений показателей выборочных наблюдений

T-распределение (Стьюдента):

l Используется для точечного оценивания, построения доверительных интервалов и тестирования гипотез, касающихся неизвестного среднего статистической выборки из нормального распределения.

l Для проверки гипотез:

теория t-распределения для малых выборок не требует априорного знания или точных оценок математического ожидания и дисперсии генеральной совокупности

p-уровень значимости t-критерия равен вероятности ошибочно отвергнуть гипотезу о равенстве средних двух выборок, когда в действительности эта гипотеза имеет место.

       
   
 


Двусторонняя проверка:

Односторонняя:

Нулевая гипотеза утверждает, что неизвестное среднее значение ГС по меньшей мере так же велико, как заданное значение μ 0

Функция плотности t-распределения- Функция СТЬЮДРАСП: Возвращает вероятность для t-распределения Стьюдента

Функция ТТЕСТ используется, чтобы определить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее.

7.5. Непараметрические методы проверки гипотез (Критерий Розенбаума, критерий Манна-Уитни, критерий χ 2 Пирсона)

Критерий Р.

Цель - Оценка различий между 2 выборками в уровне признака.

Условия: Количество измерений в каждой выборке n1, n2 11; n1 n2

Qэмп ≥ Qкр: H1

Qэмп< Qкр: Ho

 

Критерий Манна-Уитни.

Оценка различий между двумя выборками по уровню количественно измеренного признака.

Размеры выборок:

n1, n2 ³ 3 или n1=2, n2 ³ 5

n1, n2 ≤ 60


Uэмп< U кр0, 05®H1

Uэмп ≥ U кр0, 01®H0

 

Хи-Квадрат.

1. Сопоставление эмпирического распределения с теоретическим – Разница между фактическими и ожидаемыми частотами.

2. Сопоставление 2-х и более эмпирических распределений

ü Количество измерений: n 30

ü Теоретическая частота: f 5

 
 


1. Если признак принимает 2 значения: k=2,

2. Если признак варьируется в широком диапазоне: укрупняйте разряды признаков.

Корреляционный анализ.

8.1. Понятие корреляции. Виды корреляционной связи (парная линейная, параболическая, гиперболическая, множественная, корреляция рангов).

Это мера зависимости переменных =сила взаимосвязи данных

ПАРНАЯ ЛИНЕЙНАЯ КОРРЕЛЯЦИЯ - Линейная связь между 2-мя переменными

 
 

 


Множественная:

Коэффициенты корреляции.

Пирсона - Отклонение признака-фактора от его среднего на величину стандартного отклонения в среднем приводит к отклонению признака-результата от своего среднего на величину r его стандартного отклонения.

-1 Rxy 1

Rxy = -1 Строгая отрицательная корреляция

Rxy = 1 Строгая положительная корреляция

Rxy = 0 Отсутствие корреляции

0, 7 ≤ | Rxy | 1 Сильная корреляция

0, 5 ≤ | Rxy | 0, 7 Средняя корреляция

0, 3 ≤ | Rxy | 0, 5 Слабая корреляция

0 ≤ | Rxy | 0, 3 Незначимая корреляция

Коэффициент Фехнера

• C – количество совпадающих знаков отклонений от средних

• H – количество несовпадающих знаков отклонений от средних

C + H = n

Коэффициент Спирмена:

, где di – разность рангов по обоим признакам для каждого объекта.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-08-24; Просмотров: 642; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.045 с.)
Главная | Случайная страница | Обратная связь