Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Особый случай 2: укрупнение разрядов признака, который варьирует в широком диапазоне значений
Если признак варьирует в широком диапазоне значений, например, от 10 до 140 сек или от 0 до 100 мм и т. п., то вряд ли мы сможем принимать каждое значение признака за самостоятельный разряд: 10 сек, И сек, 12 сек и т. д. до 100 сек. Одно из ограничений критерия χ 2 состоит в том, что теоретически на каждый разряд должно приходиться не менее 5 наблюдений: fтеор> 5. Если у признака 90 значений, и каждое из них принимается за самостоятельный разряд, то необходимо иметь не менее 5*90=450 наблюдений! Если же наблюдений меньше 450, то придется укрупнять разряды до тех пор, пока на каждый разряд не будет приходиться по 5 наблюдений. Это не означает, что в ка-ждом разряде реально должно быть 5 наблюдений; это означает, что теоретически на каждый разряд их приходится по 5. Рассмотрим это на примере. Пример с укрупнением разрядов признака Тест Мюнстерберга для измерения избирательности перцептивного внимания в адаптированном варианте М.Д. Дворяшиной (1976) предъявлялся студентам факультета психологии Ленинградского университета (n1=156) и артистам балета Мариинского театра (n2=85). Материал методики состоит из бланка с набором букв русского алфавита, в случайном порядке перемежающихся. Среди этого фона скрыто 24 слова разной степени сложности: " факт", " хоккей", " любовь", " конкурс", " психиатрия" и т.п. Задача испытуемого возможно быстрее отыскать их и подчеркнуть (Дворяшина М.Д., 1976, с. 124). Совпадают ли распределения количества ошибок (пропусков слов) в двух выборках (Табл. 4.13)? Таблица 4.13 Эмпирические частоты пропуска слов в тесте Мюнстерберга в двух выборках испытуемых (по данным М.Д. Дворяшиной, Е.В. Сидоренко, 1973)
Сформулируем гипотезы. Н0: Распределения ошибок (пропусков слов) в выборках студентов и артистов балета не различаются между собой. H1: Распределения ошибок (пропусков слов) в выборках студентов и артистов балета различаются между собой. Прежде чем перейти к расчету теоретических частот, обратим внимание на последние 4 значения признака, от 6 пропусков и ниже. Очевидно, что fтеор для любой из ячеек последних 4 строк таблицы будет меньше 5. Например, для ячейки, отмеченной кружком: fтеор=5*85/241=1, 763 Полученная теоретическая частота меньше 5. Для того, чтобы решить, какие разряды нам следует укрупнить, чтобы fтеор была не меньше 5, выведем формулу расчета минимальной суммы частот по строке по формуле: В данном случае столбцом с наименьшим количеством наблюдений является столбец, относящийся к выборке артистов балета (n=85). Определим минимальную сумму частот для каждой строки: Минимальная сумма по строке =5*241/85=14, 16 Мы видим, что для получения такой суммы нам недостаточно объединения последних 4 строк Табл. 4.13, так как сумма частот по ним меньше 14 (5+3+2+1=11), а нам необходима сумма частот, превышающая 14. Следовательно, придется объединять в один разряд пять нижних строк Табл. 4.13: теперь любое количество пропусков от 5 до 9 будет составлять один разряд. Однако это еще не все. Мы видим, далее, что в строке " 4 пропуска" сумма составляет всего 8. Значит, ее необходимо объединить со следующей строкой. Теперь и 3, и 4 пропуска будут входить в один разряд. Все остальные суммы по строкам больше 14, поэтому мы не нуждаемся в дальнейшем укрупнении разрядов. Эмпирические частоты по укрупненным разрядам представлены в Табл. 4.14. Таблица 4.14 Эмпирические частоты пропуска слов по укрупненным разрядам в двух выборках испытуемых
Исследователю бывает огорчительно терять информацию, заведомо утрачиваемую при укрупнении разрядов. Например, в данном случае нас может интересовать, удалось ли сохранить специфический для второй выборки спад частот на 3 и 4 пропусках и резкий их подъем на 5 пропусках (Рис. 4.7). Сравним графики на Рис. 4.7 и Рис. 4.8. Мы видим, что спад частот во второй выборке на 3-х и 4-х пропусках сохранился, а спад на 2-х пропусках в первой выборке стал еще более заметным. В то же время все возможные различия в частотах в диапазоне от 5-и до 9-и пропусков теперь оцениваются только глобально, по соотношению общих сумм частот в этих диапазонах. По графику на Рис. 4.8 мы уже не можем определить, какое максимальное количество пропусков встречается в первой группе и какое - во второй. Сопоставление распределений на этом конце становится более грубым. Если бы у нас было больше испытуемых в выборке артистов балета, то, возможно, удалось бы сохранить подъем частоты на 5-и пропусках. Сейчас же нам придется довольствоваться сопоставлением по данным укрупненным разрядам. Перейдем к подсчету теоретических частот для каждой ячейки Табл. 4.14 fА теор=115*156/241=74, 44 fБ теор=115*85/241=40, 56 fВ теор=47*156/241=30, 41 fГ теор=47*85/241=16, 59 fД теор=27*156/241=17, 47 fЕ теор=27*85/241=9, 53 fЖ теор=27*156/241=17, 47 fЗ теор=27*85/241=9, 53 fИ теор=25*156/241=16, 18 fК теор=25*85/241=8, 82 Определим количество степеней свободы V по формуле: ν =(k-l)*(c- l) где k - количество строк (разрядов), с - количество столбцов (выборок). Для данного случая: ν =(5-l)*(2-l)=4 Все дальнейшие расчеты произведем в таблице по Алгоритму 13. Поправка на непрерывность не требуется, так как v> l. Таблица 4.15 Расчет критерия χ 2 при сопоставлении двух эмпирических распределений пропусков слов в тесте Мюнстерберга (n1=156, n2=85)
По Табл. IX Приложения 1 определяем критические значения при ν =4: Ответ: Н0 отвергается. Принимается Н1. Распределения про-пусков слов в выборках студентов и артистов балета различаются между собой (р< 0, 01). В распределении ошибок у артистов балета можно заметить два выраженных максимума (0 пропусков и 5 пропусков), что может указывать на два возможных источника ошибок[18].
4.3. λ - критерий Колмогорова-Смирнова Назначение критерия Критерий X предназначен для сопоставления двух распределений: а) эмпирического с теоретическим, например, равномерным или б) одного эмпирического распределения с другими эмпирическим Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения. Описание критерия Если в методе χ 2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты. Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия λ включается эта разность. Чем больше эмпирическое значение λ, тем более существенны различия. Гипотезы Н0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними). H1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними). Популярное:
|
Последнее изменение этой страницы: 2016-03-22; Просмотров: 882; Нарушение авторского права страницы