![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Особый случай 2: укрупнение разрядов признака, который варьирует в широком диапазоне значений
Если признак варьирует в широком диапазоне значений, например, от 10 до 140 сек или от 0 до 100 мм и т. п., то вряд ли мы сможем принимать каждое значение признака за самостоятельный разряд: 10 сек, И сек, 12 сек и т. д. до 100 сек. Одно из ограничений критерия χ 2 состоит в том, что теоретически на каждый разряд должно приходиться не менее 5 наблюдений: fтеор> 5. Если у признака 90 значений, и каждое из них принимается за самостоятельный разряд, то необходимо иметь не менее 5*90=450 наблюдений! Если же наблюдений меньше 450, то придется укрупнять разряды до тех пор, пока на каждый разряд не будет приходиться по 5 наблюдений. Это не означает, что в ка-ждом разряде реально должно быть 5 наблюдений; это означает, что теоретически на каждый разряд их приходится по 5. Рассмотрим это на примере. Пример с укрупнением разрядов признака Тест Мюнстерберга для измерения избирательности перцептивного внимания в адаптированном варианте М.Д. Дворяшиной (1976) предъявлялся студентам факультета психологии Ленинградского университета (n1=156) и артистам балета Мариинского театра (n2=85). Материал методики состоит из бланка с набором букв русского алфавита, в случайном порядке перемежающихся. Среди этого фона скрыто 24 слова разной степени сложности: " факт", " хоккей", " любовь", " конкурс", " психиатрия" и т.п. Задача испытуемого возможно быстрее отыскать их и подчеркнуть (Дворяшина М.Д., 1976, с. 124). Совпадают ли распределения количества ошибок (пропусков слов) в двух выборках (Табл. 4.13)? Таблица 4.13 Эмпирические частоты пропуска слов в тесте Мюнстерберга в двух выборках испытуемых (по данным М.Д. Дворяшиной, Е.В. Сидоренко, 1973)
Сформулируем гипотезы. Н0: Распределения ошибок (пропусков слов) в выборках студентов и артистов балета не различаются между собой. H1: Распределения ошибок (пропусков слов) в выборках студентов и артистов балета различаются между собой. Прежде чем перейти к расчету теоретических частот, обратим внимание на последние 4 значения признака, от 6 пропусков и ниже. Очевидно, что fтеор для любой из ячеек последних 4 строк таблицы будет меньше 5. Например, для ячейки, отмеченной кружком:
Полученная теоретическая частота меньше 5. Для того, чтобы решить, какие разряды нам следует укрупнить, чтобы fтеор была не меньше 5, выведем формулу расчета минимальной суммы частот по строке по формуле: В данном случае столбцом с наименьшим количеством наблюдений является столбец, относящийся к выборке артистов балета (n=85). Определим минимальную сумму частот для каждой строки: Минимальная сумма по строке =5*241/85=14, 16 Мы видим, что для получения такой суммы нам недостаточно объединения последних 4 строк Табл. 4.13, так как сумма частот по ним меньше 14 (5+3+2+1=11), а нам необходима сумма частот, превышающая 14. Следовательно, придется объединять в один разряд пять нижних строк Табл. 4.13: теперь любое количество пропусков от 5 до 9 будет составлять один разряд. Однако это еще не все. Мы видим, далее, что в строке " 4 пропуска" сумма составляет всего 8. Значит, ее необходимо объединить со следующей строкой. Теперь и 3, и 4 пропуска будут входить в один разряд. Все остальные суммы по строкам больше 14, поэтому мы не нуждаемся в дальнейшем укрупнении разрядов. Эмпирические частоты по укрупненным разрядам представлены в Табл. 4.14. Таблица 4.14 Эмпирические частоты пропуска слов по укрупненным разрядам в двух выборках испытуемых
Исследователю бывает огорчительно терять информацию, заведомо утрачиваемую при укрупнении разрядов. Например, в данном случае нас может интересовать, удалось ли сохранить специфический для второй выборки спад частот на 3 и 4 пропусках и резкий их подъем на 5 пропусках (Рис. 4.7). Сравним графики на Рис. 4.7 и Рис. 4.8. Мы видим, что спад частот во второй выборке на 3-х и 4-х пропусках сохранился, а спад на 2-х пропусках в первой выборке стал еще более заметным. В то же время все возможные различия в частотах в диапазоне от 5-и до 9-и пропусков теперь оцениваются только глобально, по соотношению общих сумм частот в этих диапазонах. По графику на Рис. 4.8 мы уже не можем определить, какое максимальное количество пропусков встречается в первой группе и какое - во второй. Сопоставление распределений на этом конце становится более грубым. Если бы у нас было больше испытуемых в выборке артистов балета, то, возможно, удалось бы сохранить подъем частоты на 5-и пропусках. Сейчас же нам придется довольствоваться сопоставлением по данным укрупненным разрядам. Перейдем к подсчету теоретических частот для каждой ячейки Табл. 4.14 fА теор=115*156/241=74, 44 fБ теор=115*85/241=40, 56 fВ теор=47*156/241=30, 41 fГ теор=47*85/241=16, 59 fД теор=27*156/241=17, 47 fЕ теор=27*85/241=9, 53 fЖ теор=27*156/241=17, 47 fЗ теор=27*85/241=9, 53 fИ теор=25*156/241=16, 18 fК теор=25*85/241=8, 82 Определим количество степеней свободы V по формуле: ν =(k-l)*(c- l) где k - количество строк (разрядов), с - количество столбцов (выборок). Для данного случая: ν =(5-l)*(2-l)=4 Все дальнейшие расчеты произведем в таблице по Алгоритму 13. Поправка на непрерывность не требуется, так как v> l. Таблица 4.15 Расчет критерия χ 2 при сопоставлении двух эмпирических распределений пропусков слов в тесте Мюнстерберга (n1=156, n2=85)
По Табл. IX Приложения 1 определяем критические значения при ν =4: Ответ: Н0 отвергается. Принимается Н1. Распределения про-пусков слов в выборках студентов и артистов балета различаются между собой (р< 0, 01). В распределении ошибок у артистов балета можно заметить два выраженных максимума (0 пропусков и 5 пропусков), что может указывать на два возможных источника ошибок[18].
4.3. λ - критерий Колмогорова-Смирнова Назначение критерия Критерий X предназначен для сопоставления двух распределений: а) эмпирического с теоретическим, например, равномерным или б) одного эмпирического распределения с другими эмпирическим Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения. Описание критерия Если в методе χ 2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты. Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия λ включается эта разность. Чем больше эмпирическое значение λ, тем более существенны различия. Гипотезы Н0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними). H1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними). Популярное:
|
Последнее изменение этой страницы: 2016-03-22; Просмотров: 882; Нарушение авторского права страницы