Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Задача оценки различия средних значений признака в независимых выборках ⇐ ПредыдущаяСтр 3 из 3
Задача.Преподаватель сопоставил изложение одной и той же темы в двух различных учебниках. Работая в двух параллельных студенческих группах, он отобрал из них случайным образом две группы по 15 студентов в каждой и поручил им самостоятельно проработать эту тему: одной группе по первому учебнику, другой группе – по второму. В конце эксперимента студентам был предложен тест на усвоение изученного материала. Результаты оценивались количеством правильных ответов. Были получены следующие данные: в первой группе , , ; во второй группе , , . Значимы ли различия между средним количеством правильных ответов студентов в группах? Решение Нулевую гипотезу (о равенстве генеральных средних) проверим на уровне значимости . Альтернативная гипотеза (о различии) задает двустороннюю критическую область. Обе выборки независимы, выборочные дисперсии равны между собой , объемы выборок совпадают ( ). Тогда значение . Вычислим эмпирическое значение критерия: . Найдем по таблице критические точки -распределения Стьюдента для двусторонней критической области при уровне значимости и числе степеней свободы . Получим . Значит, правая критическая точка , левая критическая точка , а область допустимых значений двустороннего -критерия есть симметричный интервал от до . Значение находится внутри области допустимых значений , то есть , поэтому нет оснований для отклонения гипотезы о равенстве генеральных средних значений числа правильных ответов в группах. Расхождение между и незначимо. Оба учебника дают примерно одинаковые результаты по усвоению учебного материалы по критерию числа правильных ответов на тестовые задания.
F-критерий Фишера (для сравнения дисперсий) F-критерий Фишера используется для: 1) установления сходства-различия дисперсий в двух независимых выборках (D1↔ D2); 2) установления отличия от нуля коэффициента детерминации (η 2 ↔ " О" ); 3) установления наличия-отсутствия влияния фактора в дисперсионном анализе. Случай 1 Случай 1 Эмпирическое значение F-критерия для сравнения двух дисперсий в независимых выборках находят по очень простой формуле: где – большая дисперсия, – меньшая дисперсия. [Подстановка в числитель большей дисперсии необходима для использования таблиц критических значений, в которых приводится только правое критическое значение (больше единицы). Статистические программы рассчитывают и левое критическое значение (меньше единицы)]. Количество степеней свободы определяется отдельно для числителя и отдельно для знаменателя: dfчисл= nчисл-1 dfзнам =nзнам -1 Сформулируем задачу. Пусть имеются две нормально распределенные совокупности, дисперсии которых равны и . Необходимо проверить нулевую гипотезу о равенстве дисперсий, т.е. : относительно конкурирующей или . Для проверки гипотезы из этих совокупностей взяты две независимые выборки объемом и . Так как оценки дисперсий и нам неизвестны, воспользуемся несмещенными выборочными оценками дисперсий и . Очевидно, что при равенстве дисперсий величина критерия будет равна единице. В остальных случаях она будет больше (меньше) единицы. При формировании критерия отклонения (принятия) гипотезы следует учесть, что распределение статистики (в отличие от нормального или распределения Стьюдента является несимметричным.) Критерий Фишера – двусторонний критерий, и нулевая гипотеза принимается (отвергается альтернативная гипотеза ) если . Случай 2 В случае определения отличия от нуля коэффициента детерминации эмпирическое значение F-критерия рассчитывается так: где: N – общее число испытуемых, r-число интервалов квантования, исходя из которых рассчитывалось η 2. При определении критического значения число степеней свободы для числителя: dfчисл=r–1, для знаменателя: dfзнам=N–r. (Коэффициент детерминации – η 2, определяет общую меру связи – корреляционное отношение. Он определяется по формуле: Здесь: – сумма квадратов отклонений от внутригруппового (условного) среднего; – сумма квадратов отклонений от общего для всех измерений среднего (безусловного среднего); Следует отметить, что в отличие от линейной корреляции коэффициент детерминации устанавливает два типа связей: зависимость х от у и зависимость у от х (η 2 х/у, η 2у/х). То есть сначала одна переменная рассматривается как зависимая, другая – как независимая, затем наоборот). 3. χ 2-критерий Пирсона Критерий χ 2 применяется в двух целях: 1) для сопоставления эмпирического распределения признака с теоретическим – равномерным, нормальным или каким-то иным; 2) для сопоставления двух трех или более эмпирических распределений одного и того же признака На самом деле области применения критерия χ 2 многообразны, Описание критерия. Критерий χ 2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях. Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В самом простом случае альтернативного распределения " да – нет", " допустил брак – не допустил брака", " решил задачу – не решил задачу". При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами. При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета теоретических частот будут специально даны для каждого варианта сопоставлений. Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше эмпирическое значение χ 2. Гипотезы. Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим. Первый вариант: H0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения. H1: Полученное эмпирическое распределение признака отличается от теоретического распределения. Второй вариант: H0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2. H1: Эмпирическое распределение 1 отличается от эмпирического распределения 2. Третий вариант: H0: Эмпирические распределения 1, 2, 3,... не различаются между собой. Н1: Эмпирические распределения 1, 2, 3, ... различаются между собой. Критерий χ 2 позволяет проверить все три варианта гипотез. Ограничения критерия. 1) Объем выборки должен быть достаточно большим: n>.30. При n< 30 критерий χ 2 дает весьма приближенные значения. Точность критерия повышается при больших п. 2) Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: ƒ ≥ 5. Это означает, что если число разрядов задано заранее и не может быть изменено, то мы не можем применять метод, χ 2 не накопив определенного минимального числа наблюдений. Если, например, мы хотим проверить наши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5*7=35 обращений. Таким образом, если количество разрядов (k) задано заранее, как в данном случае, минимальное число наблюдений (nmin) определяется по формуле: nmin=k*5. 3) Выбранные разряды должны " вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопоставляемых распределениях. 4) Необходимо вносить " поправку на непрерывность" при сопоставлении распределений признаков, которые принимают всего 2 значения. При внесении поправки значение χ 2 уменьшается. 5) Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду. Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений. Популярное:
|
Последнее изменение этой страницы: 2016-06-05; Просмотров: 1151; Нарушение авторского права страницы