Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Процедура проверки статистических гипотез



Для принятия решений о том, какую из гипотез (нулевую или альтернативную) следует принять, используют статистические критерии, которые включают в себя методы расчета определенного показателя, на основании которого принимается решение об отклонении или принятии гипотезы, а также правила (условия) принятия решения. Этот рассчитываемый показатель называется эмпирическим значением критерия. Найденное эмпирическое значение сравнивается с известным (например, заданным таблично) эталонным числом, называемым критическим значением критерия.

Будем придерживаться следующего правила отклонения гипотезы об отсутствии различий (Н0) и принятии гипотезы о статистической достоверности различий (Н1).

Правило отклонения Н0 и принятия Н1

Если эмпирическое значение критерия равняется критическому значению, соответствующему или превышает его, то Н0 отклоняется, но мы еще не можем определенно принять Н1.

Если эмпирическое значение критерия равняется критическому значению, соответствующему или превышает его, то Н0 отклоняется и принимается Н1.

Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения.

Критической областью называют область значений критерия, при которых нулевую гипотезу отвергают, областью принятия гипотезы – область значений критерия, при которых гипотезу принимают.

Различают разные виды критических областей:

- правостороннюю критическую область, определяемую неравенством ;

- левостороннюю критическую область, определяемую неравенством ;

- двустороннюю критическую область, определяемую неравенствами , ( k 2 > k 1).

Мощность критерия. Важнейшей характеристикой любого статистического критерия является его мощность.

Мощность критерия – это его способность выявлять различия, если они есть. Иначе, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.

Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой 2 рода.

Вероятность ошибки второго рода статистического критерия обозначим как β, тогда величина 1–β будет мощностью критерия. Ясно, что мощность может принимать любые значения от 0 до 1. Чем ближе мощность к единице, тем эффективнее критерий.

Если обозначить вероятность ошибки второго рода (принятия неправильной нулевой гипотезы) β, то мощность критерия равна 1 – β. Следовательно, чем больше мощность критерия, тем меньше вероятность совершить ошибку второго рода. Поэтому после выбора уровня значимости следует строить критическую область так, чтобы мощность критерия была максимальной.

Основанием для выбора критерия может быть не только его мощность, но и другие его характеристики, а именно:

а) простота;

б) более широкий диапазон исследования (по отношению к данным, определенным по номинативной шкале, или по отношению к большим n);

в) применимость по отношению к неравным по объему выборкам;

г) большая информативность результатов.

Основные законы распределения

В процессе решения статистических задач часто требуется выполнить сравнение двух величин, одна из которых вычисляется на основе выборочных характеристик (оценок среднего, дисперсии и т.д.), а другая является значением функции распределения одной из статистик (или квантилью этой статистики – значением функции, обратной к функции распределения).

Наиболее распространенные статистики являются моделями типичных задач теории вероятностей, возникающих в практических ситуациях.

Нормальное распределение.

Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине – достаточно часто.

Свойством нормальных распределений является наличие определенного количества случайной величины (случаев, испытуемых), приходящегося на интервалы между значениями σ, обычно это количество измеряют в процентах от общего числа случаев, испытуемых. Считается, что нормальное распределение характеризует такие случайные величины, на которые воздействует большое количество разнообразных факторов, причем сила воздействия одного отдельно взятого фактора значительно меньше суммы воздействий остальных факторов. В результате получается, что чаще наблюдаются некоторые средние значения измеряемого параметра, реже крайние, и чем сильнее отличается какое-то значение от среднего, тем реже оно встречается.

В связи с задачей о совместном влиянии случайных величин возникает важнейшее распределение, называемое нормальным. Именно, если величина X является суммой большого числа независимых случайных величин, то плотность распределения величины X имеет вид

,  

где m и – константы, равные математическому ожиданию и стандартному отклонению случайной величины X. Если m = 0 и = 1, то распределение называют стандартным (или нормированным) нормальным распределением.

График плотности вероятности нормального распределения называется нормальной кривой (или кривой Гаусса). нормальная кривая симметрична относительно прямой .

Медиана и мода нормального распределения совпадают с математическим ожиданием. По мере удаления от точки плотность быстро уменьшается и при асимптотически приближается к нулю. При изменении математического ожидания m нормальная кривая смещается вдоль оси абсцисс, не изменяя своей формы. При уменьшении кривая становится более «островершинной», сжимаясь вдоль оси абсцисс; при увеличении кривая становится более «пологой».

Вероятность попадания нормально распределенной случайной величины на данный интервал

, (0.1)

где – функция Лапласа:

. (0.2)

Иногда функцией Лапласа называют функцию

.

Если (из таблиц) известно значение именно этой функции, то правую часть соотношения (0.1) необходимо разделить на 2.

Параметры распределения – это его числовые характеристики, указывающие, где " в среднем" располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее практически важными параметрами являются математическое ожидание (M ), дисперсия (D), стандартное отклонение (σ ), показатели асимметрии и эксцесса.

О чем же свидетельствует стандартное отклонение? Оно позволяет сказать, что большая часть исследуемой выборки располагается в пределах σ от средней. Что это значит? Статистики показали, что при нормальном распределении «большая часть» результатов, располагающаяся в пределах одного стандартного отклонения по обе стороны от средней, в процентном отношении всегда одна и та же и не зависит от величины стандартного отклонения: она соответствует 68% популяции (т.е. 34% ее элементов располагается слева и 34%-справа от средней):

Точно так же рассчитали, что 94, 45% элементов популяции при нормальном распределении не выходит за пределы двух стандартных отклонений от средней:

В тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрицательной – более высокие. Для симметричных распределений А=0;

Асимметрия распределений а) положительная, левосторонняя, б)

отрицательная, правосторонняя

 

В тех случаях, когда какие-либо причины способствуют преимущественному появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное

Эксцесс а) положительный, б) отрицательный

 

В распределениях с нормальной выпуклостью Е=0.

Параметры распределения оказывается возможным определить только по отношению к данным, представленным, по крайней мере, в интервальной шкале.


Поделиться:



Популярное:

  1. A.27. Процедура ручной регулировки зеркала заднего вида
  2. Аварийные радиобуи EPIRB, SART. Назначение, использование, эксплуатационные проверки.
  3. БИЛЕТ 30. Гипотеза ле Бройля. Опыты Дэвиссона и Джермера. Дифракция микрочастиц. Принцип неопределенности Гейзенберга
  4. Биологические гипотезы происхождения языка
  5. В чем заключается специфика вероятностно-статистических подходов?
  6. Впервые о технике составления статистических графиков упоминается в работе
  7. Гипотезы могут выражаться в общей (абстрактной) или конкретной (казуистической) форме.
  8. Завершающий этап (Процедура защиты выпускной квалификационной работы обучающимся)
  9. ЗАДАЧИ И ВИДЫ СТАТИСТИЧЕСКИХ ГРУППИРОВОК
  10. Заполнить ДТ в процедурах «Временный вывоз» и «Реимпорт».
  11. Какие международные правовые акты устанавливают положения о таможенных процедурах?
  12. Каковы правила построения и проверки криминалистических версий в процессе расследования преступлений?


Последнее изменение этой страницы: 2016-06-05; Просмотров: 796; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.017 с.)
Главная | Случайная страница | Обратная связь