Биномиальный критерий ш Назначение критерия m

⇐ ПредыдущаяСтр 15 из 17Следующая ⇒

Критерий предназначен для сопоставления частоты встречаемости какого-либо эффекта с теоретической или заданной частотой его встречаемости.

Он применяется в тех случаях, когда обследована лишь одна выборка объемом не более 300 наблюдений, в некоторых задачах - не больше 50 наблюдений.

Описание критерия

Биномиальный критерий m позволяет оценить, насколько эмпирическая частота интересующего нас эффекта превышает теоретическую, среднестатистическую или какую-то заданную частоту, соответствующую вероятности случайного угадывания, среднему проценту успешности в выполнении данного задания, допустимому проценту брака и т.п.

Биномиальный критерий незаменим, если налицо 2 условия:

а) обследована лишь одна выборка испытуемых, и нет возможности или смысла делить эту выборку на две части с целью дальнейшего применения критерия, φ *, так как для нас по каким-то причинам важно исследовать частоту встречаемости признака в выборке в целом;

б) в обследованной выборке менее 30 испытуемых, что не позволяет нам применить критерий χ ².

Если в нашей выборке больше 30 испытуемых, мы все же можем использовать критерий m и тем самым сэкономить время на подсчете χ ².

Эмпирическая частота наблюдений, в которых проявляется интересующий нас эффект, обозначается как т. Это и есть эмпирическое [значение критерия т. Если m_эмп равен или превышает m_кр, то различия достоверны.

Гипотезы

H₀: Частота встречаемости данного эффекта в обследованной выборке не превышает теоретической (заданной, ожидаемой, предполагаемой).

H₁: Частота встречаемости данного эффекта в обследованной выборке превышает теоретическую (заданную, ожидаемую, предполагаемую).

Графическое представление биномиального критерия

Критерий определяет, достаточно ли эмпирическая частота встречаемости признака превышает заданную, " перевешивает" ее. Можно представить себе это как взвешивание эмпирической и теоретической частот на чашечных весах (Рис. 5.4). Весы реагируют только на такие, различия в весе, которые соответствуют по крайней мере минимальному уровню значимости р< 0, 05.

Ограничения биномиального критерия

1. В выборке должно быть не менее 5 наблюдений. В принципе возможно применение критерия и при 2≤ n< 5, но лишь в отношении определенного типа задач (см. Табл. XV Приложения 1).

2. Верхний предел численности выборки зависит от ограничений, определяемых пп.3-8 и варьирует в диапазоне от 50 до 300 наблюдений, что определяется имеющимися таблицами критических значений.

3. Биномиальный критерий m позволяет проверить лишь гипотезу о том, что частота встречаемости интересующего нас эффекта в обследованной выборке превышает заданную вероятность Р. Заданная вероятность при этом должна быть: Р ≤ 0, 50.

4. Если мы хотим проверить гипотезу о том, что частота встречаемости интересующего нас эффекта достоверно ниже заданной вероятности, то при Р=0, 50 мы можем сделать это с помощью уже известного критерия знаков G, при Р> 0, 50 мы должны преобразовать гипотезы в противоположные, а при Р< 0, 50 придется использовать критерий χ ².

По Табл. 5.12 легко определить, какой из путей для нас доступен.

Таблица 5.12

Выбор критерия для сопоставлений эмпирической частоты с теоретической при разных вероятностях исследуемого эффекта Р и разных гипотезах.

Заданные вероятности	H₁: f_эмпдостоверно выше f_теор	H₁: f_эмпдостоверно ниже f_теор
Р< 0, 50	А	m	для 2 ≤ n ≤ 50	Б	χ ²	для n ≥ 30
Р=0, 50	В	m	для 5 ≤ n ≤ 300	Г	G	для 5 ≤ n ≤ 300
Р> 0, 50	Д	χ ²	для n ≤ 30	Е	m	для 2 ≤ n ≤ 50

Пояснения к Табл. 5.12

A) Если заданная вероятность Р< 0, 50, а f_эмп> f_теор (например, допустимый уровень брака - 15%, а в обследованной выборке получено значение в 25%), то биномиальный критерий применим для объема выборки 2≤ n≤ 50.

Б) Если заданная вероятность Р< 0, 50, а f_эмп> f_теор (например, допустимый уровень брака - 15%, а в обследованной выборке наблюдается 5% брака), то биномиальный критерий неприменим и следует применять критерий χ ² (см. Пример 2).

B) Если заданная вероятность Р=0, 50, а f_эмп> f_теор (например, вероятность выбора каждой из равновероятных альтернатив Р=0, 50, а в обследованной выборке одна из альтернатив выбирается чаще, чем в половине случаев), то биномиальный критерий применим для объема выборки 5≤ n≤ 300.

Г) Если заданная вероятность Р=0, 50, a f_эмп> f_теор (например, вероятность выбора каждой из равновероятных альтернатив Р=0, 50, а в обследованной выборке одна из альтернатив наблюдается реже, чем в половине случаев), то вместо биномиального критерия применяется критерий знаков G, являющийся " зеркальным отражением" биномиального критерия при Р=0, 50. Допустимый объем выборки: 5≤ n≤ 300.

Д) Если заданная вероятность Р> 0, 50, а f_эмп> f_теор (например, среднестатистический процент решения задачи - 80%, а в обследованной выборке он составляет 95%), то биномиальный критерий неприменим и следует применять критерий χ ² (см. Пример 3).

Е) Если заданная вероятность Р> 0, 50, а f_эмп> f_теор (например, среднестатистический процент решения задачи - 80%, а в обследованной выборке он составляет 60%), то биномиальный критерий применим при условии, что в качестве " эффекта" мы будем рассматривать более редкое событие - неудачу в решении задачи, вероятность которого Q=l—Р=1—0, 80=0, 20 и процент встречаемости в данной выборке: 100%—75%=25%. Эти преобразования фактически сведут данную задачу к задаче, предусмотренной n. А. Допустимый объем выборки: 2≤ n≤ 50 (см. пример 3).

Пример 1

В процессе тренинга сенситивности в группе из 14 человек выполнялось упражнение " Психологический прогноз". Все участники должны были пристально вглядеться в одного и того же человека, который сам пожелал быть испытуемым в этом упражнении. Затем каждый из участников задавал испытуемому вопрос, предполагавший два заданных варианта ответа, например: " Что в тебе преобладает: отстраненная наблюдательность или включенная эмпатия? " " Продолжал бы ты работать или нет, если бы у тебя появилась материальная возможность не работать? " " Кто тебя больше утомляет - люди нахальные или занудные? " и т. п. Испытуемый должен был лишь молча выслушать вопрос, ничего не отвечая. Во время этой паузы участники пытались определить, как он ответит на данный вопрос, и записывали свои прогнозы. Затем ведущий предлагал испытуемому дать ответ на заданный вопрос. Теперь каждый участник мог определить, совпал ли его прогноз с ответом испытуемого или нет. После того, как было задано 14 вопросов (13 участников + ведущий), каждый сообщил, сколько у него получилось точных прогнозов. В среднем было по 7-8 совпадений, но у одного из участников их было 12, и группа ему спонтанно зааплодировала. У другого участника, однако, оказалось всего 4 совпадения, и он был очень этим огорчен.

Имела ли группа статистические основания для аплодисментов?

Имел ли огорченный участник статистические основания для грусти?

Начнем с первого вопроса.

По-видимому, группа будет иметь статистические основания для аплодисментов, если частота правильных прогнозов у участника А превысит теоретическую частоту случайных угадываний. Если бы участник прогнозировал ответ испытуемого случайным образом, то, в соответствии с теорией вероятностей, шансы случайно угадать или не угадать ответ на данный вопрос у него были бы равны P=Q=0, 5. Определим теоретическую частоту правильных случайных угадываний:

f_теор=n·P

где n - количество прогнозов;

Р - вероятность правильного прогноза при случайном угадывании.

f_теор=14-0, 5=7

Итак, нам нужно определить, " перевешивают" ли 12 реально данных правильных прогнозов 7 правильных прогнозов, которые могли бы быть у данного участника, если бы он прогнозировал ответ испытуемого случайным образом.

Требования, предусмотренные ограничением 3, соблюдены: Р=0, 50; f_эмп> f_теор. Данный случай относится к варианту " В" Табл. 5.12.

Мы можем сформулировать гипотезы.

H₀: Количество точных прогнозов у участника А не превышает частоты, соответствующей вероятности случайного угадывания.

H₁: Количество точных прогнозов у участника А превышает частоту, соответствующую вероятности случайного угадывания.

По Табл. XIV Приложения 1 определяем критические значения критерия m при n=14, Р=0, 50:

Мы помним, что за эмпирическое значение критерия m принимается эмпирическая частота:

Зона значимости простирается вправо, в область более высоких значений m (более " весомых", если использовать аналогию с весами), а зона незначимости - в область более низких, " невесомых", значений m.

Ответ: H₀ отвергается. Принимается H₁. Количество точных прогнозов у участника А превышает (или по крайней мере равняется) критической частоте вероятности случайного угадывания (р≤ 0, 01). Группа вполне обоснованно ему аплодировала!

Теперь попробуем ответить на второй вопрос задачи.

По-видимому, основания для грусти могут появиться, если количество правильных прогнозов оказывается достоверно ниже теоретической частоты случайных угадываний. Мы должны определить, 4 точных прогноза участника Б - это достоверно меньше, чем 7 теоретически возможных правильных прогнозов при случайном угадывании или нет?

В данном случае Р=0, 50; f_эмп> f_теор. В соответствии с ограничением 4, в данном случае мы должны применить критерий знаков, который по существу является зеркальным отражением или " второй стороной" одностороннего биномиального критерия (вариант " Г" Табл. 5.12). Вначале нам нужно определить, что является типичным событием для участника Б. Это неправильные прогнозы, их 10. Теперь мы определяем, достаточно ли мало у него нетипичных правильных прогнозов, чтобы считать перевешивание неправильных прогнозов достоверным.

Сформулируем гипотезы.

H₀: Преобладание неправильных прогнозов у участника Б является случайным.

H₁: Преобладание неправильных прогнозов у участника Б не является случайным.

По Табл. V Приложения 1 определяем критические значения критерия знаков G для n=14:

Построим " ось значимости". Мы помним, что в критерии знаков зона значимости находится слева, а зона незначимости - справа, так как чем меньше нетипичных событий, тем типичные события являются более достоверно преобладающими.

Эмпирическое значение критерия G определяется как количество нетипичных событий. В данном случае:

Эмпирическое значение критерия G попадает в зону незначимости.

Ответ: H₀ принимается. Преобладание неправильных прогнозов у участника Б является случайным.

Участник Б не имел достаточных статистических оснований для огорчения. Дело, однако, в том, что психологическая " весомость" отклонения его оценки значительно перевешивает статистическую. Всякий практикующий психолог согласится, что повод для огорчения у участника Б все же был.

Важная особенность биномиального критерия и критерия знаков состоит в том, что они превращают уникальность, единственность и жизненную резкость произошедшего события в нечто неотличимое от безликой и всепоглощающей случайности. Учитывая это, лучше использовать биномиальный критерий для решения более отвлеченных, формализованных задач, например, для уравновешивания выборок по признаку пола, возраста, профессиональной принадлежности и т. п.

При оценке же личностно значимых событий оказывается, что статистическая сторона дела не совпадает с психологической больше, чем при использовании любого из других критериев.

Пример 2

В тренинге профессиональных наблюдателей допускается, чтобы наблюдатель ошибался в оценке возраста ребенка не более чем на 1 год в ту или иную сторону. Наблюдатель допускается к работе, если он совершает не более 15% ошибок, превышающих отклонение на 1 год. Наблюдатель Н допустил 1 ошибку в 50-ти попытках, а наблюдатель К - 15 ошибок в 50-ти попытках. Достоверно ли отличаются эти результаты от контрольной величины?

Определим частоту допустимых ошибок при п = 50:

f_теор=n·Р=50·0, 15=7, 5

Для наблюдателя Н f_эмп< f_теор. Для наблюдателя К f_эмп> f_теор

Сформулируем гипотезы для наблюдателя Н.

H₀: Количество ошибок у наблюдателя Н не меньше, чем это предусмотрено заданной величиной.

H₁: Количество ошибок у наблюдателя Н меньше, чем это предусмотрено заданной величиной.

В данном случае Р=0, 15< 0, 50; f_эмп> f_теор.

Этот случай попадает под вариант Б Табл. 5. 12. Нам придется применить критерий у}, сопоставляя полученные эмпирические частоты ошибочных и правильных ответов с теоретическими частотами, составляющими, соответственно, 7, 5 для ошибочного ответа и (50-7, 5)=42, 5 для правильного ответа. Подсчитаем χ ² по формуле, включающей поправку на непрерывность[24]:

По Табл. IX Приложения 1 определяем критические значения χ ² при v=l:

Ответ: H₀отвергается. Количество ошибок у наблюдателя Н меньше, чем это предусмотрено заданной величиной (р≤ 0, 05)

Сформулируем гипотезы для наблюдателя К.

H₀: Количество ошибок у наблюдателя К не больше, чем это предусмотрено заданной величиной.

H₁: Количество ошибок у наблюдателя К больше, чем это предусмотрено заданной величиной.

В данном случае Р=0, 15< 0, 5; f_эмп> f_теор.Этот случай подпадает под вариант А Табл. 5.12. Мы можем применить биномиальный критерий, поскольку n=50.

По Табл. XV Приложения 1 определяем критические значения при п=50, Р=0, 15, Q=0, 85:

Ответ: H₀ отвергается. Количество ошибок у наблюдателя Н меньше, чем это предусмотрено заданной величиной (р< 0, 05).

Пример 3

Впримере 1 параграфа 5.2 мы сравнивали процент справившихся с экспериментальной задачей испытуемых в двух группах. Теперь мы можем сопоставить процент успешности каждой группы со среднестатистическим процентом успешности. Данные представлены в Табл. 5.13.

Таблица 5.13

Показатели успешности решения задачи в двух группах испытуемых

	Количество испытуемых, решивших задачу	Количество испытуемых, не решивших задачу	Суммы
1 группа (n₁=20)		(60%)		(40%)
2 группа (п7=25)		(40%)		(60%)
Суммы

Среднестатистический показатель успешности в решении этой задачи - 55%. Определим теоретическую частоту правильных ответов для групп 1 и 2:

Для группы 1, следовательно, Р=0, 55> 0, 50; f_эмп=12> f_теор. Этот случай соответствует варианту " Д" Табл. 5.12. Мы должны были бы применить критерий χ ², но у нас всего 20 наблюдений: n< 30. Ни биномиальный критерий, ни критерий χ ² неприменимы. Остается критерий φ * Фишера, который мы сможем применить, если узнаем, сколько испытуемых было в выборке, по которой определялся среднестатистический процент.

Далее, для группы 2: Р=0, 55> 0, 50; f_эмп=10> f_теор. Этот случай соответствует варианту " Е" Табл. 5.12. Мы можем применить биномиальный критерий, если будем считать " эффектом" неудачу в решении задачи. Вероятность неудачи Q=l—Р=1—0, 55=0, 45. Новая эмпирическая частота составит: f_эмп=25-10=15.

Сформулируем гипотезы.

H₀: Процент неудач в обследованной выборке не превышает заданного процента неудач.

H₁ Процент неудач в обследованной выборке превышает заданный процент неудач.

По Табл. XV Приложения 1 определяем критические значения для n=25, P=0, 45, Q=0.55 (мы помним, что Р и Q поменялись местами):

Ответ: H₀ принимается. Процент неудач в обследованной выборке не превышает заданного процента неудач.

Сформулируем общий алгоритм применения критерия m.

АЛГОРИТМ 18

⇐ Предыдущая 8 9 10 11 12 13 141516 17 Следующая ⇒