![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Определение надежности теста
Тест обычно считается надежным, если с его помощью получаются одни и те же показатели для каждого обследуемого при повторном тестировании. В психометрике термин надежность имеет два значения. На одном из них — на- дежности по внутренней согласованности — мы не будем останавливаться под- робно, отсылая читателя к соответствующим справочникам и руководствам1, от- метив только, что требование к внутренней согласованности теста не случайно. Вполне естественно считать, что если некоторая переменная измеряется частью теста, то другие его части, не будучи согласованными с первой, измеряют нечто другое. Для того чтобы быть валидным, тест должен быть согласованным. Суще- ствует несколько способов определения надежности. Надежност ь ретестовая — предполагает повторное предъявление того же само- го теста тем же испытуемым и примерно в тех же условиях, что первоначальное, а затем установление корреляции между двумя рядами данных. При использовании этого способа определения надежности нужно отдавать себе отчет в том, что испыту- емые могут запомнить свои ответы и воспроизвести их во второй раз, поэтому по- вторное тестирование должно быть отделено от первого более-менее значительным временным интервалом, обычно не менее месяца. Некоторые психологи настаи- вают на интервале между тестированиями не менее 6 месяцев (Клайн, 1994). Мы не считаем требование П. Клайна об обязательном 6 месячном интервале между тестированиями безусловным. В подтверждение сошлемся на результаты исследования канадских психологов. С помощью личностного опросника были обследованы 302 студента с интервалом в 3 недели. Условия повторного тестиро- вания варьировались. Стандартный коэффициент ретестовой надежности, равный 0, 872, не отличался от коэффициентов надежности, полученных в трех группах испытуемых, получавших одну из трех специфических инструкций: 1) продумы- вать ответы; 2) использовать воспоминания о прошлых ответах; 3) выполнять параллельную форму теста. Было обнаружено, что стандартный коэффициент надежности выше коэффициента, полученного при инструкции воспроизводить прошлые ответы. Наименьшим удовлетворительным значением для ретестовой надежности яв- ляется коэффициент корреляции, равный 0, 7. Правда, для некоторых тестов этот показатель может быть несколько ниже.
по конструированию тестов» (Киев, 1994), пока, к сожалению, единственная на русском языке дос- таточно подробная работа по конструированию тестов, может удовлетворить интерес читателя к этой проблеме. 16 2 Глава 3. Психометрические основы психодиагностики: основные этапы...
Надежност ь параллельных форм предусматривает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами. Основная пробле- ма, препятствующая широкому распространению этого способа определения на- дежности, — необходимость подготовки двух наборов заданий, что чрезвычайно сложно, поскольку требуются убедительные доказательства их эквивалентности. Надежност ь частей теста определяется путем деления опросника на две час- ти (обычно на четные и нечетные задания), после чего и рассчитывается корреля- ция между этими частями. Обычно к этому способу определения надежности ре- комендуется прибегать только в тех случаях, когда необходимо быстро получить результаты. Для определения ретестовой надежности и надежности параллельных форм корреляции подсчитывается на основе коэффициента произведения моментов Пирсона. Эта процедура подсчета рассматривалась нами ранее, в разделе, посвя- щенном анализу заданий. Для определения надежности частей теста ранее рассчи- танный коэффициент произведения моментов Пирсона (между двумя полови- нами теста) используется в формуле Спирмена—Брауна. Формула Спирмена— Брауна имеет вид:
Например, если коэффициент корреляции произведения моментов Пирсона между двумя половинами теста равен 0, 80, то:
Подчеркнем, что наилучшей процедурой определения надежности является проведение повторных исследований через более или менее значительные времен- ные интервалы. Все исследования надежности должны выполняться на достаточно больших (рекомендуется 200 и более испытуемых) и репрезентативных выборках. Надеж- ность — важная характеристика теста, но сама по себе ценности не представляет. Она необходима для достижения валидности.
Факторны й анализ
Во многих случаях перед разработчиком теста встает задача «сжатия» информа- ции или, иначе говоря, компактного описания изучаемых явлений при наличии множества наблюдений или переменных. Факторный анализ как раз и является методом снижения размерности изучаемого многомерного явления. Напомним читателю, что факторный анализ зародился в психологической на- уке и связан в первую очередь с исследованиями Ч. Спирмена (Spearman, 1904). Последующими работами таких выдающихся психологов, как Т. Келли, Л. Тер- 3.7. Факторный анализ 163
стоуна, Дж. Гилфорда и Р. Кэттелла, а также математиков К. Пирсона, К. Холзин- гера, Г. Хармана и др., был достигнут значительный успех в математическом обо- сновании факторного анализа, и этот метод начинает активно применяться в раз- личных науках. Как хорошо известно, одной из типичных форм представления эксперимен- тальных данных является матрица, столбцы которой соответствуют, например, различным тестам (заданиям тестов), а строки — отдельным результатам (значе- ниям), полученным в результате их применения. Визуальный анализ сколь-ни- будь значительной по величине матрицы невозможен, а поэтому требуется исход- ную информацию сжать, извлечь из нее наиболее важное, существенное. Прежде всего исследователю необходимо получить корреляционную матрицу (подсчет ко- эффициентов корреляции). Воспользуемся в качестве примера исследованием Л. Айкена (Aiken, 1996). В этом исследовании 90 студентов колледжа просили оценить преподавателя с по- мощью пятибалльной шкалы (1 — низший балл, 5 — высший) по 11 параметрам: тактичность, вежливость, креативность, доброжелательность, увлеченность сво- им предметом, знание предмета, способность мотивировать студентов, организо- ванность, терпеливость, подготовленность и пунктуальность. Если поделить матрицу корреляций рейтинговых оценок, данных студентами по списку качеств личности преподавателя (табл. 3.4) на два равных треугольни- ка, проведя диагональ из левого верхнего угла в правый нижний угол, то можно увидеть, что это — симметричная матрица, в которой первая верхняя строка со- стоит из тех же оценок, что и первая колонка. Аналогично вторая строка включает те же самые элементы, что и вторая колонка, и т. д. Также нужно обратить внима- ние на то, что все числа на основной диагонали (начиная сверху слева вплоть до чисел внизу справа) равны +1, 00 — это предполагаемая корреляция каждого за- дания шкалы с самим собой. В психологическом тестировании цель факторного анализа заключается в том, чтобы найти несколько фундаментальных факторов, которые объясняли бы боль- шую часть дисперсии в группе оценок по различным тестам или другим психомет- рическим измерениям. В вышерассмотренном примере — 11 переменных, поэто- му для него задача факторного анализа заключается в том, чтобы найти матрицу факторных нагрузок или корреляции между факторами и заданиями шкалы. Су- ществует несколько процедур факторного анализа, но все они предполагают две стадии: 1) факторизацию матрицы корреляций, с тем чтобы получилась первона- чальная факторная матрица; 2) вращение факторной матрицы, с тем чтобы обна- ружить наиболее простую конфигурацию факторных нагрузок (см. табл. 3.4). Стадия факторизации в этом процессе призвана определить количество фак- торов, необходимых для объяснения связей между различными тестами, и обес- печивает получение первичных оценок нагрузки (веса) каждого теста по каждо- му фактору. Вращение факторов необходимо для того, чтобы сделать их более по- нятными (интерпретируемыми) с помощью создания конфигурации факторов, в которой совсем немного тестов имеют высокие нагрузки, тогда как большая часть тестов имеют низкие нагрузки по любому фактору. 164 Глава 3. Психометрические основы психодиагностики: основные этапы...
Таблица 3.4 Образе ц матрицы корреляций между 11 заданиями шкалы для оценки личности преподавателя
1 2 3 4 5 6 7 8 9 10
i
1, 000 0, 727 0, 424 0, 573 0, 343 0, 294 0, 458 0, 200 0, 425 0, 091 00, 78 2
0, 727 1, 000 0, 304 0, 620 0, 287 0, 258 0, 363 0, 075 0, 459 0, 115 0, 127 3
0, 424 0, 304 1, 000 0, 470 0, 510 0, 080 0, 691 0, 206 0, 304 0, 129 0, 112 4
0, 573 0, 620 0, 470 1, 000 0, 336 0, 195 0, 390 0, 061 0, 528 0, 026 0, 022 5
0, 343 0, 287 0, 510 0, 336 1, 000 0, 171 0, 638 0, 374 0, 203 0, 243 0, 244 6
0, 294 0, 258 0, 080 0, 195 0, 171 1, 000 0, 108 0, 227 0, 159 0, 490 0, 430 7
0, 458 0, 363 0, 691 0, 390 0, 638 0, 108 1, 000 0, 218 0, 314 0, 108 0, 065 8
0, 200 0, 075 0, 206 0, 061 0, 374 0, 227 0, 218 1, 000 0, 085 0, 524 0, 421 9
0, 425 0, 459 0, 304 0, 528 0, 203 0, 159 0, 314 00, 85 1, 000 0, 114 0, 187 1 0
0, 091 0, 115 0, 129 0, 026 0, 243 0, 490 0, 108 0, 524 0, 114 1, 000 0, 611 1 1
0, 078 0, 127 0, 112 0, 022 0, 244 0, 430 0, 065 0, 421 0, 187 0, 611 1, 000
Одна из наиболее известных процедур факторизации — метод главных осей (principa l axis), а самая популярная процедура вращения — варимакс вращение 1. Из табл. 3.5 видно, что выделяются три фактора, они представлены в колон- ках, обозначенных А, В, С. Величины, записанные под колонкой каждого факто- ра, — корреляции или нагрузки каждого из 11 заданий по этому фактору. Например, задание 1 имеет нагрузку по фактору A равную 0, 754; - 0, 271 по фак- тору В; и 0, 250 по фактору С. Сумма квадратов нагрузок по каждому из факторов позволяет определить долю дисперсии этого задания. Таким образом, доля дис- персии задания 1 равна: (0.754)2 +(-0, 271)2 +(0, 250)2 =0, 704. Это означает, что 70, 4 % вариаций показателей по заданию 1 объясняется дей- ствием этих трех факторов. Факторно-аналитический подход позволяет также оценить надежность теста. Как известно, полная дисперсия теста равна сумме дисперсий для общих факто- ров, плюс дисперсии специфических факторов, плюс дисперсия погрешности. Следовательно, если мы осуществим факторный анализ теста, возведем в квадрат и суммируем нагрузки его факторов, то мы получим его надежность, поскольку нагрузки факторов представляют корреляцию теста с общими или специфиче- скими факторами. Однако следует помнить, что такой способ установления на- дежности более всего подходит для уже факторизованного теста, нежели для тес- тов, которые могут измерять широкий набор разных факторов, часть которых мо- гут и не входить в батарею изучаемых исследователем.
По вполне понятным причинам здесь опущены этапы ручной факторизации матрицы, поскольку в настоящее время для этой цели используются различные компьютерные программы. Для читателя, желающего ознакомиться подробно с процедурой факторизации матрицы и ее вращением, рекомен- дуем обратиться к книге: Окунь Я. Факторный анализ / Пер. с польск.; Под ред. Г. 3. Давидовича. — М.: Статистика, 1974. 3.7. Факторный анализ 16 5
Таблица3.5 |
Последнее изменение этой страницы: 2019-05-18; Просмотров: 277; Нарушение авторского права страницы