Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Биномиальный критерий ш Назначение критерия m
Критерий предназначен для сопоставления частоты встречаемости какого-либо эффекта с теоретической или заданной частотой его встречаемости. Он применяется в тех случаях, когда обследована лишь одна выборка объемом не более 300 наблюдений, в некоторых задачах - не больше 50 наблюдений. Описание критерия Биномиальный критерий m позволяет оценить, насколько эмпирическая частота интересующего нас эффекта превышает теоретическую, среднестатистическую или какую-то заданную частоту, соответствующую вероятности случайного угадывания, среднему проценту успешности в выполнении данного задания, допустимому проценту брака и т.п. Биномиальный критерий незаменим, если налицо 2 условия: а) обследована лишь одна выборка испытуемых, и нет возможности или смысла делить эту выборку на две части с целью дальнейшего применения критерия, φ *, так как для нас по каким-то причинам важно исследовать частоту встречаемости признака в выборке в целом; б) в обследованной выборке менее 30 испытуемых, что не позволяет нам применить критерий χ 2. Если в нашей выборке больше 30 испытуемых, мы все же можем использовать критерий m и тем самым сэкономить время на подсчете χ 2. Эмпирическая частота наблюдений, в которых проявляется интересующий нас эффект, обозначается как т. Это и есть эмпирическое [значение критерия т. Если mэмп равен или превышает mкр, то различия достоверны. Гипотезы H0: Частота встречаемости данного эффекта в обследованной выборке не превышает теоретической (заданной, ожидаемой, предполагаемой). H1: Частота встречаемости данного эффекта в обследованной выборке превышает теоретическую (заданную, ожидаемую, предполагаемую). Графическое представление биномиального критерия Критерий определяет, достаточно ли эмпирическая частота встречаемости признака превышает заданную, " перевешивает" ее. Можно представить себе это как взвешивание эмпирической и теоретической частот на чашечных весах (Рис. 5.4). Весы реагируют только на такие, различия в весе, которые соответствуют по крайней мере минимальному уровню значимости р< 0, 05. Ограничения биномиального критерия 1. В выборке должно быть не менее 5 наблюдений. В принципе возможно применение критерия и при 2≤ n< 5, но лишь в отношении определенного типа задач (см. Табл. XV Приложения 1). 2. Верхний предел численности выборки зависит от ограничений, определяемых пп.3-8 и варьирует в диапазоне от 50 до 300 наблюдений, что определяется имеющимися таблицами критических значений. 3. Биномиальный критерий m позволяет проверить лишь гипотезу о том, что частота встречаемости интересующего нас эффекта в обследованной выборке превышает заданную вероятность Р. Заданная вероятность при этом должна быть: Р ≤ 0, 50. 4. Если мы хотим проверить гипотезу о том, что частота встречаемости интересующего нас эффекта достоверно ниже заданной вероятности, то при Р=0, 50 мы можем сделать это с помощью уже известного критерия знаков G, при Р> 0, 50 мы должны преобразовать гипотезы в противоположные, а при Р< 0, 50 придется использовать критерий χ 2. По Табл. 5.12 легко определить, какой из путей для нас доступен. Таблица 5.12 Выбор критерия для сопоставлений эмпирической частоты с теоретической при разных вероятностях исследуемого эффекта Р и разных гипотезах.
Пояснения к Табл. 5.12 A) Если заданная вероятность Р< 0, 50, а fэмп> fтеор (например, допустимый уровень брака - 15%, а в обследованной выборке получено значение в 25%), то биномиальный критерий применим для объема выборки 2≤ n≤ 50. Б) Если заданная вероятность Р< 0, 50, а fэмп> fтеор (например, допустимый уровень брака - 15%, а в обследованной выборке наблюдается 5% брака), то биномиальный критерий неприменим и следует применять критерий χ 2 (см. Пример 2). B) Если заданная вероятность Р=0, 50, а fэмп> fтеор (например, вероятность выбора каждой из равновероятных альтернатив Р=0, 50, а в обследованной выборке одна из альтернатив выбирается чаще, чем в половине случаев), то биномиальный критерий применим для объема выборки 5≤ n≤ 300. Г) Если заданная вероятность Р=0, 50, a fэмп> fтеор (например, вероятность выбора каждой из равновероятных альтернатив Р=0, 50, а в обследованной выборке одна из альтернатив наблюдается реже, чем в половине случаев), то вместо биномиального критерия применяется критерий знаков G, являющийся " зеркальным отражением" биномиального критерия при Р=0, 50. Допустимый объем выборки: 5≤ n≤ 300. Д) Если заданная вероятность Р> 0, 50, а fэмп> fтеор (например, среднестатистический процент решения задачи - 80%, а в обследованной выборке он составляет 95%), то биномиальный критерий неприменим и следует применять критерий χ 2 (см. Пример 3). Е) Если заданная вероятность Р> 0, 50, а fэмп> fтеор (например, среднестатистический процент решения задачи - 80%, а в обследованной выборке он составляет 60%), то биномиальный критерий применим при условии, что в качестве " эффекта" мы будем рассматривать более редкое событие - неудачу в решении задачи, вероятность которого Q=l—Р=1—0, 80=0, 20 и процент встречаемости в данной выборке: 100%—75%=25%. Эти преобразования фактически сведут данную задачу к задаче, предусмотренной n. А. Допустимый объем выборки: 2≤ n≤ 50 (см. пример 3). Пример 1 В процессе тренинга сенситивности в группе из 14 человек выполнялось упражнение " Психологический прогноз". Все участники должны были пристально вглядеться в одного и того же человека, который сам пожелал быть испытуемым в этом упражнении. Затем каждый из участников задавал испытуемому вопрос, предполагавший два заданных варианта ответа, например: " Что в тебе преобладает: отстраненная наблюдательность или включенная эмпатия? " " Продолжал бы ты работать или нет, если бы у тебя появилась материальная возможность не работать? " " Кто тебя больше утомляет - люди нахальные или занудные? " и т. п. Испытуемый должен был лишь молча выслушать вопрос, ничего не отвечая. Во время этой паузы участники пытались определить, как он ответит на данный вопрос, и записывали свои прогнозы. Затем ведущий предлагал испытуемому дать ответ на заданный вопрос. Теперь каждый участник мог определить, совпал ли его прогноз с ответом испытуемого или нет. После того, как было задано 14 вопросов (13 участников + ведущий), каждый сообщил, сколько у него получилось точных прогнозов. В среднем было по 7-8 совпадений, но у одного из участников их было 12, и группа ему спонтанно зааплодировала. У другого участника, однако, оказалось всего 4 совпадения, и он был очень этим огорчен. Имела ли группа статистические основания для аплодисментов? Имел ли огорченный участник статистические основания для грусти? Начнем с первого вопроса. По-видимому, группа будет иметь статистические основания для аплодисментов, если частота правильных прогнозов у участника А превысит теоретическую частоту случайных угадываний. Если бы участник прогнозировал ответ испытуемого случайным образом, то, в соответствии с теорией вероятностей, шансы случайно угадать или не угадать ответ на данный вопрос у него были бы равны P=Q=0, 5. Определим теоретическую частоту правильных случайных угадываний: fтеор=n·P где n - количество прогнозов; Р - вероятность правильного прогноза при случайном угадывании. fтеор=14-0, 5=7 Итак, нам нужно определить, " перевешивают" ли 12 реально данных правильных прогнозов 7 правильных прогнозов, которые могли бы быть у данного участника, если бы он прогнозировал ответ испытуемого случайным образом. Требования, предусмотренные ограничением 3, соблюдены: Р=0, 50; fэмп> fтеор. Данный случай относится к варианту " В" Табл. 5.12. Мы можем сформулировать гипотезы. H0: Количество точных прогнозов у участника А не превышает частоты, соответствующей вероятности случайного угадывания. H1: Количество точных прогнозов у участника А превышает частоту, соответствующую вероятности случайного угадывания. По Табл. XIV Приложения 1 определяем критические значения критерия m при n=14, Р=0, 50: Мы помним, что за эмпирическое значение критерия m принимается эмпирическая частота: Зона значимости простирается вправо, в область более высоких значений m (более " весомых", если использовать аналогию с весами), а зона незначимости - в область более низких, " невесомых", значений m. Ответ: H0 отвергается. Принимается H1. Количество точных прогнозов у участника А превышает (или по крайней мере равняется) критической частоте вероятности случайного угадывания (р≤ 0, 01). Группа вполне обоснованно ему аплодировала! Теперь попробуем ответить на второй вопрос задачи. По-видимому, основания для грусти могут появиться, если количество правильных прогнозов оказывается достоверно ниже теоретической частоты случайных угадываний. Мы должны определить, 4 точных прогноза участника Б - это достоверно меньше, чем 7 теоретически возможных правильных прогнозов при случайном угадывании или нет? В данном случае Р=0, 50; fэмп> fтеор. В соответствии с ограничением 4, в данном случае мы должны применить критерий знаков, который по существу является зеркальным отражением или " второй стороной" одностороннего биномиального критерия (вариант " Г" Табл. 5.12). Вначале нам нужно определить, что является типичным событием для участника Б. Это неправильные прогнозы, их 10. Теперь мы определяем, достаточно ли мало у него нетипичных правильных прогнозов, чтобы считать перевешивание неправильных прогнозов достоверным. Сформулируем гипотезы. H0: Преобладание неправильных прогнозов у участника Б является случайным. H1: Преобладание неправильных прогнозов у участника Б не является случайным. По Табл. V Приложения 1 определяем критические значения критерия знаков G для n=14: Построим " ось значимости". Мы помним, что в критерии знаков зона значимости находится слева, а зона незначимости - справа, так как чем меньше нетипичных событий, тем типичные события являются более достоверно преобладающими. Эмпирическое значение критерия G определяется как количество нетипичных событий. В данном случае: Эмпирическое значение критерия G попадает в зону незначимости. Ответ: H0 принимается. Преобладание неправильных прогнозов у участника Б является случайным. Участник Б не имел достаточных статистических оснований для огорчения. Дело, однако, в том, что психологическая " весомость" отклонения его оценки значительно перевешивает статистическую. Всякий практикующий психолог согласится, что повод для огорчения у участника Б все же был. Важная особенность биномиального критерия и критерия знаков состоит в том, что они превращают уникальность, единственность и жизненную резкость произошедшего события в нечто неотличимое от безликой и всепоглощающей случайности. Учитывая это, лучше использовать биномиальный критерий для решения более отвлеченных, формализованных задач, например, для уравновешивания выборок по признаку пола, возраста, профессиональной принадлежности и т. п. При оценке же личностно значимых событий оказывается, что статистическая сторона дела не совпадает с психологической больше, чем при использовании любого из других критериев. Пример 2 В тренинге профессиональных наблюдателей допускается, чтобы наблюдатель ошибался в оценке возраста ребенка не более чем на 1 год в ту или иную сторону. Наблюдатель допускается к работе, если он совершает не более 15% ошибок, превышающих отклонение на 1 год. Наблюдатель Н допустил 1 ошибку в 50-ти попытках, а наблюдатель К - 15 ошибок в 50-ти попытках. Достоверно ли отличаются эти результаты от контрольной величины? Определим частоту допустимых ошибок при п = 50: fтеор=n·Р=50·0, 15=7, 5 Для наблюдателя Н fэмп< fтеор. Для наблюдателя К fэмп> fтеор Сформулируем гипотезы для наблюдателя Н. H0: Количество ошибок у наблюдателя Н не меньше, чем это предусмотрено заданной величиной. H1: Количество ошибок у наблюдателя Н меньше, чем это предусмотрено заданной величиной. В данном случае Р=0, 15< 0, 50; fэмп> fтеор. Этот случай попадает под вариант Б Табл. 5. 12. Нам придется применить критерий у}, сопоставляя полученные эмпирические частоты ошибочных и правильных ответов с теоретическими частотами, составляющими, соответственно, 7, 5 для ошибочного ответа и (50-7, 5)=42, 5 для правильного ответа. Подсчитаем χ 2 по формуле, включающей поправку на непрерывность[24]: По Табл. IX Приложения 1 определяем критические значения χ 2 при v=l: Ответ: H0 отвергается. Количество ошибок у наблюдателя Н меньше, чем это предусмотрено заданной величиной (р≤ 0, 05) Сформулируем гипотезы для наблюдателя К. H0: Количество ошибок у наблюдателя К не больше, чем это предусмотрено заданной величиной. H1: Количество ошибок у наблюдателя К больше, чем это предусмотрено заданной величиной. В данном случае Р=0, 15< 0, 5; fэмп> fтеор.Этот случай подпадает под вариант А Табл. 5.12. Мы можем применить биномиальный критерий, поскольку n=50. По Табл. XV Приложения 1 определяем критические значения при п=50, Р=0, 15, Q=0, 85: Ответ: H0 отвергается. Количество ошибок у наблюдателя Н меньше, чем это предусмотрено заданной величиной (р< 0, 05). Пример 3 Впримере 1 параграфа 5.2 мы сравнивали процент справившихся с экспериментальной задачей испытуемых в двух группах. Теперь мы можем сопоставить процент успешности каждой группы со среднестатистическим процентом успешности. Данные представлены в Табл. 5.13. Таблица 5.13 Показатели успешности решения задачи в двух группах испытуемых
Среднестатистический показатель успешности в решении этой задачи - 55%. Определим теоретическую частоту правильных ответов для групп 1 и 2: Для группы 1, следовательно, Р=0, 55> 0, 50; fэмп=12> fтеор. Этот случай соответствует варианту " Д" Табл. 5.12. Мы должны были бы применить критерий χ 2, но у нас всего 20 наблюдений: n< 30. Ни биномиальный критерий, ни критерий χ 2 неприменимы. Остается критерий φ * Фишера, который мы сможем применить, если узнаем, сколько испытуемых было в выборке, по которой определялся среднестатистический процент. Далее, для группы 2: Р=0, 55> 0, 50; fэмп=10> fтеор. Этот случай соответствует варианту " Е" Табл. 5.12. Мы можем применить биномиальный критерий, если будем считать " эффектом" неудачу в решении задачи. Вероятность неудачи Q=l—Р=1—0, 55=0, 45. Новая эмпирическая частота составит: fэмп=25-10=15. Сформулируем гипотезы. H0: Процент неудач в обследованной выборке не превышает заданного процента неудач. H1 Процент неудач в обследованной выборке превышает заданный процент неудач. По Табл. XV Приложения 1 определяем критические значения для n=25, P=0, 45, Q=0.55 (мы помним, что Р и Q поменялись местами): Ответ: H0 принимается. Процент неудач в обследованной выборке не превышает заданного процента неудач. Сформулируем общий алгоритм применения критерия m. АЛГОРИТМ 18 Популярное:
|
Последнее изменение этой страницы: 2016-03-22; Просмотров: 1025; Нарушение авторского права страницы