Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ



Предыстория тестов уходит в глубину веков, она связана с испы­таниями различных способностей, знаний, умений и навыков. Сооб­щается, что уже в середине III тысячелетия до н. э. в Древнем Вави­лоне проводились испытания выпускников в школах, где готовились писцы. Профессионально подготовленный писец, благодаря обшир­ным по тем временам знаниям, был центральной фигурой месопотамской цивилизации. Он был обязан знать все четыре арифметичес­ких действия, уметь измерять поля, распределять рационы, делить иму­щество, владеть искусством пения и игры на музыкальных инстру­ментах. Кроме того, проверялось умение разбираться в тканях, металлах, растениях (Дандамаев М. А., 1983).

В Древнем Египте только того обучали искусству жреца, кто был способен выдержать систему определенных испытаний. Вначале кан­дидат в жрецы проходил собеседование, в процессе которого выяс­нялись его биографические данные, уровень образованности; кро­ме того, оценивались внешность, умение вести беседу. Затем следо­вали проверки: умения трудиться, слушать и молчать, испытания огнем, водой, страхом преодоления мрачных подземелий в полном одиночестве и др. (Аванесов В. С., 1982). Все эти довольно жесткие испытания дополнялись угрозой смерти для тех, кто не был уверен в своих способностях к учению и в том, что сумеет выдержать все тяготы длительного периода образования. Поэтому каждому канди­дату предлагалось еще раз подумать и, тщательно взвесив, решить, с какой стороны закрыть за собой дверь в храм - с внутренней или с внешней.

Сообщается, что эту суровую систему испытаний успешно пре­одолел знаменитый ученый древности Пифагор. Вернувшись в Гре­цию, он основал школу, допуск в которую открывал только для тех, кто был способен преодолеть серию различных испытаний, похожих на те, которые он выдержал сам. Как свидетельствуют источники Цит. по: Голицын Н. Н., 1855, q. 118), Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что «не из каждого де­рева можно выточить Меркурия», и потому, вероятно, придавал боль­шое значение диагностике именно этих способностей. Для этого каж­дому давалась сравнительно трудная математическая задача. В слу­чае ее решения вопрос о приеме решался сразу. Однако чаще всего задача не решалась, после чего неудачника вводили в зал, где учени­ки, по правилам испытаний, должны были беспощадно поднимать его на смех, давая ему обидные прозвища. Если поведение новичка в этой критической ситуации характеризовалось умением отвечать на выпа­ды, хорошо и достойно держать себя, его принимали в школу (под­робнее см.: Аванесов В. С., 1982).

Особое значение Пифагор придавал смеху молодых людей, ут­верждая, что манера смеяться является самым хорошим показателем характера человека. Он внимательно относился к рекомендациям ро­дителей и учителей, вел тщательное наблюдение за каждым нович­ком после того, как последнего приглашали свободно высказываться и не стесняться, смелее оспаривать мнения собеседников (там же).

Сообщается (Dubois P., 1970), что за 2200 лет до н. э. в Древнем Китае уже существовала система проверки способностей лиц, желав­ших занять должности правительственных чиновников[8]. Каждые три года чиновники повторно экзаменовались лично у императора по «шести искусствам»: музыке, стрельбе из лука, верховой езде, уме­нию писать, считать, знанию ритуалов и церемоний. Для государства система экзаменов была важным средством отбора достаточно спо­собных, в меру эрудированных и, главное, лояльных по отношению к власти людей для последующего их использования на администра­тивной службе.

Нередко результаты испытания интеллектуальных способностей становились предметом гордости того или иного народа, а иногда служили даже для извлечения доходов. Сообщается, например, что индийский царь Девсарм, желая испытать мудрость персов, прислал им шахматы. Предполагалось, что персы вряд ли сумеют разгадать суть этой игры, и потому они должны были по условию отослать в Индию подать. Сообщается, однако, что визирь Хо-срова Важургмихр понял правила шахматной игры и, в свою очередь, изобрел игру, на­зываемую сейчас нарды. Он послал с новой игрой гонца в Индию, где ее, как выяснилось, разгадать не смогли (Орбели И. А., 1936).

Другим свидетельством использования испытаний тестового ха­рактера являются материалы, излагающие основы религиозного уче­ния чань-буддизма. Учителя чань-буддизма использовали загадки, вопросы-парадоксы с одновременным созданием ситуации психоло­гического стресса. Отвечать на них необходимо было сразу, на разду­мывание не отводилось ни секунды. Как отмечает Н. В. Абаев, в чаньских поединках-диалогах сама парадоксальность постановки вопро­сов (например, была ли борода у бородатого варвара или имеет ли собака природу Будды) создавала драматическое напряжение, кото­рое усиливалось всем образом действий наставника. Хватая своего оппонента и крича на него: «Говори! Говори! Отвечай немедленно! », он создавал ситуацию психического напряжения. Чаньские парадок­сальные загадки использовались, по мнению этого же автора, в каче­стве тестов на определенный, «чаньский» ход мышления. В зависимости от того, как тестируемый отвечал на эти загадки, опытный на­ставник определял, на каком уровне «просветленности» он находил­ся и какие меры нужно принять для углубления его «чаньского опы­та», а также выявлял людей, скрывающих за внешней грубостью и странностью манер свою некомпетентность (Абаев Н. В., 1980).

В созданном чжурчжэнями государстве Цзинь результаты экза­менов применялись для распределения выпускников медицинского училища. Из числа выдержавших экзамены лучшие поступали на государственную службу в качестве практикующих врачей, препо­давателей или исследователей, худшие получали разрешение зани­маться частной практикой. Не выдержавшим экзамен рекомендова­лось либо продолжить подготовку, либо сменить профессию (Воро­бьев М. В., 1983).

Различные конкурсы и экзамены устраивались и в средневековом Вьетнаме. Всего за два года, в период с 1370 по 1372 г., удалось про­вести переаттестацию всех военных и гражданских чиновников, что позволило организовать проверку государственного аппарата по всей стране. В результате этого Вьетнам вновь стал сильным и жизнеспо­собным феодальным государством; особое внимание было уделено созданию боеспособного офицерского корпуса (Берзин Э. О., 1982).

В XV в. конкурсные испытания были упорядочены: они проводи­лись по этапам и турам. Присвоение высших степеней на экзаменах сопровождалось большими почестями. Лауреаты получали подарки от короля, их имена вносились в «золотой список», который вывеши­вался у Восточных ворот столицы, об их победах на конкурсе сооб­щалось в родную общину. Имена наиболее отличившихся высекали на специальных каменных стелах, установленных в Храме Литерату­ры (Берзин Э. О., 1982).

Интересные данные приводятся В. Н. Басиловым в отношении шаманства. У некоторых народов (например, у эскимосов) чуть ли не каждый взрослый мужчина считал себя способным к шаманству, но эти претензии отвергались в процессе испытаний. Проверка и, как результат ее, признание были непременными условиями шаманской деятельности. У разных народов проверка шамана принимала свои формы. В частности, когда у казахов кто-либо объявлял себя шама­ном, то он по требованию народа должен был, ходить по снегу в трес­кучий мороз босиком и с обнаженной головой, лизать языком раскаленные докрасна железные предметы. У народности ханты неудачно­го претендента объявляли сумасшедшим. У ульчей шаман подвергал­ся испытаниям во время поминок. Такой же обычай был у нанайцев (Басилов В. Н., 1984).

Приведенный краткий исторический экскурс позволяет сделать вывод о необходимости рассматривать испытания индивидуальных способностей как важную и неотъемлемую часть общественной жиз­ни многих (если не всех) народов мира со времен древнейших циви­лизаций и до наших дней. Однако можно ли, на основании приведен­ных данных, говорить о глубокой истории и широкой распространен­ности тестов? Если согласиться с наиболее известными сейчас опре­делениями теста, даваемыми как перевод с английского слова «test» - испытание, проверка, проба, то на поставленный вопрос надо ответить утвердительно. Дело, однако, в том, можно ли в наше время так определять тест...

С течением времени обыденное представление о тесте и научное понимание теста все больше удалялись друг от друга. Хотя всякий тест включает в себя элемент испытания, он не сводится только к нему, ибо сейчас это метод исследования, включающий в себя ряд чисто научных требований. На каждом этапе развития науки требования к тестам и они сами менялись. Игнорирование этого диалектического момента нередко приводит к упрощенчеству в оценках тестов.

Настоящая история тестов началась век назад, в канун периода ломки устаревшего общественного строя, революционного измене­ния общественного сознания, совпавшего по времени с научным кри­зисом, сразившим естествознание. Диалектика и материализм потряс­ли идеалистический фундамент психологии и стали основой новой методологии.

К началу XX в. практические потребности изучения преобладаю­щих способностей были сформулированы в виде научной проблемы исследования индивидуальных различий. Эта проблема и дала им­пульс к появлению первых тестов. Известный английский ученый Ф. Гальтон в течение 1884-1885 гг. провел серию испытаний, в кото­рых посетители.лаборатории в возрасте от 5 до 80 лет могли за не­большую плату проверить свои физические качества (силу, быстроту реакции и др.), а также ряд физиологических возможностей организ­ма и психических свойств - всего по семнадцати показателям. В число последних вошли показатели роста, веса, жизненной емкости лег­ких, становой силы, силы кисти и удара кулаком, запоминаемости букв, остроты зрения, различения цвета и другие. По полной програм­ме было обследовано 9337 человек. Ф. Гальтон писал, что практика вдумчивого и методичного тестирования - не фантазия; она требует рассмотрения и эксперимента (Galton F., 1884).

Это был первый существенный отход от тысячелетней практики испытаний и проверок, основанной на интуиции. Применительно к тестам значение деятельности Гальтона можно сравнить с тем, что сделал Галилей для физической науки своими остроумными экспери­ментами. Набиравший силу радикальный эмпиризм рассматривался рядом ученых конца XIX в. как вполне приемлемая альтернатива иде­ализму, а эксперимент - как настоящий фундамент науки. «Только тогда психология сможет стать действительной и точной наукой, -писал, Дж. Кеттелл, — когда она будет иметь своей основой экспери­мент и измерения» (Cattell D., 1890).

Кеттелл, по-видимому, первым увидел в тестах средство измере­ния, казалось бы, неизмеряемых свойств человеческой психики. В работе, опубликованной в 1890 г., он дал список 50 лабораторных те­стов, которые мы бы сейчас назвали не тестами, а контрольными за­даниями. Эти тесты проводились с соблюдением только двух из изве­стных сегодня требований к тестам: имелась инструкция по их при­менению и подчеркивался лабораторный (т. е. научный) характер ис­пытаний. В частности, указывалось, что лабораторию следует хорошо оборудовать, в нее не допускаются зрители во время тестирования; все испытуемые инструктируются одинаково, все они должны хоро­шо усвоить, что и как нужно им делать (Cattell D., 1890).

Надо ли говорить, сколь непривычной казалась идея измерения для психологии XIX века. Измерение с помощью тестов казалось тог­да, а многим кажется и по сей день, делом если не странным, то пре­тенциозным. Обыденное сознание исходило при этом из аналогии с физическими измерениями и рассматривало эти попытки математи­зации как чуждый для гуманитарной психологии уклон. Примерно с такими же трудностями сталкивалась и психофизика.

Тем не менее к концу 20-х годов нашего столетия все больше ста­ла ощущаться потребность в создании специфического направления, связанного с особенностями использования числа и меры. В психологии эту роль выполняла психометрия, в биологии - биометрия, в экономике - эконометрия, в науке в целом - наукометрия. К ним сле­довало бы добавить и социометрию, но последнюю Дж. Морено и Г. Гурвич свели к элементарным методам оценки взаимодействия ин­дивидов в малых группах.

С момента первых публикаций Ф. Гальтона и Дж. Кеттелла идея тестового метода сразу же привлекла к себе внимание ученых разных стран мира. Появились первые сторонники тестов и первые же их противники. В числе сторонников были: в Германии - Г. Мюнстерберг, С. Крепелин, В. Онри, во Франции -А. Бине, в США - Дж. Гил­берт и другие. Это были исследователи нового типа, стремившиеся связать психологию тех лет с запросами практики. Однако стремле­ние к прикладным исследованиям в психологии прошлого расцени­валось как отход от науки. Кетгелл, например, сообщал, что он начал свои первые тестовые лабораторные исследования индивидуальных различий в 1885 году, но публиковаться не мог из-за противодействия В. Вундта (Cattell D., 1896).

Итак, научный статус тестов не был определен, возможность из­мерений в психологии подвергалась сомнению. Психология пережи­вала трудный период: она уже не могла развиваться на старой основе, но и не научилась еще смотреть на мир по-новому. «Причина кризи­са, - писал Л. С. Выготский, - лежит в развитии прикладной психо­логии, приведшей к перестройке всей методологии науки на основе принципа практики. Этот принцип давит на психологию и толкает ее к разрыву на две науки» (цит. по: Ярошевский М. Г., Гургенидзе Г. С., 1977). Общественная практика требовательно выдвигала одну про­блему за другой, и ни одну из них старая психология решить не мог­ла - у нее не было подходящих методов.

Появление в этой ситуации прикладной психологии не было слу­чайностью. Ей было дано название «психотехника». Прикладное на­правление появилось и в педагогике. Хотя педология претендовала на звание науки о комплексном развитии ребенка, в тот период она была в основном прикладной педагогикой. Отвергнутые в традици­онной науке - в психологии и в педагогике, тесты быстро нашли себе применение в прикладных направлениях. В общем, произошло так, как говорили в древности: если какой-либо науке не находится места в храме, она начинает развиваться у его стен.

Активизация роли науки в практическом переустройстве жизни столкнулась с традицией занятий «чистой наукой, созерцанием исти­ны». Для представителей чистой науки прикладность не имела замет­ной ценности. В 30-х годах ученые Кембриджа больше всего горди­лись тем, что их научная деятельность ни при каких мыслимых об­стоятельствах не может иметь практического смысла (Сноу Ч., 1973). Цель, методы и результаты психотехники лежали в сфере практики, в то время как цели, методы и результаты традиционной психологии лежали в области теоретических рассуждений. Различались произво­дительная и познавательная функции этих направлений. То, что име­ло ценность для психотехники, психология того времени ни принять, ни произвести сама не могла, так же как и психотехника мало что могла дать психологии.

Размежевание стало заметным в конце 20-х - начале 30-х годов. Вместо объединения усилий обе стороны приступили к взаимным обвинениям и затяжным дискуссиям. Психология обвинялась в схо­ластике, узком академизме, в неспособности воспринять новое и в отрыве от практики жизни. Психотехника, в свою очередь, осужда­лась за узкий практицизм, противоречащий духу науки, за отрыв от психологии; она обвинялась в голом эмпиризме, прикладности, в чрез­мерном увлечении тестами... Последнее обвинение стало узловым пун­ктом критики.

Разрыв между фундаментальным и прикладным направлениями был до недавнего времени характерен для многих наук, но не везде он протекал столь болезненно, как в психологии. Даже в историчес­кой науке получили распространение взгляды морализирующих ис­ториков, противопоставляющих «чистое и возвышенное познание» различным формам приложения науки, влекущим за собой лишь не­счастья и опасности (Шахназаров Г. X., 1981).

Начало 30-х годов характеризуется широким использованием тес­тов во многих странах. Во Франции они стали применяться для дефек­тологических целей и для профориентации, в США тесты использова­лись при приеме на работу, в колледжи, для оценки знаний школьников и студентов, в социально-психологических исследованиях. В России тесты применялись в основном в двух основных сферах: в народном образовании и в сфере профотбора - профориентации. Затронутые те­стами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений как за, так и против тестов. Большой энтузиазм тех, кто их при­менял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его использования, породили во многих, странах, в том числе и в России, письма в правительственные органы и в газеты с требованием запрета тестов.

В отечественной истории тестов начали 30-х годов характеризу­ется интенсивным и неконтролируемым использованием тестов в системе народного образования и в промышленности. Практика, как это часто бывает, опережала теорию. Массовые тестовые обследо­вания не подкреплялись серьезной проверкой качества инструмен­тария, решения о переводе некоторых учащихся в классы для ум­ственно отсталых детей принимались на основе коротких тестов без учета других факторов, влияющих на результаты проверки. В про­мышленности на основе таких же тестов делались попытки класси­фицировать работников по различным профессиям, без вниматель­ного учета личных склонностей и интересов. Ввиду надвигавшейся тестомании и ряда причин субъективного характера было принято известное постановление «О педологических извращениях в систе­ме наркомпросов» (1936), наложившее запрет на применение бес­смысленных (как там отмечалось) тестов и анкет. Это постановле­ние, по мнению А. Н. Леонтьева, А. Р. Лурия и А. А Смирнова, по­лучило в последующие годы неправомерно расширительное толко­вание и привело к отказу от разработки научно обоснованных методов психологической диагностики личности (Леонтьев А. Н., Лурия А. Р., Смирнов А. А., 1968).

В те годы были, однако, и другие выступления - в пользу тестов. Так, известный психолог М. Я. Басов говорил: «Я думаю все же, что эта долгая, подчас острая критика тестовой методики... в конце кон­цов приведет не к ниспровержению, не к упразднению этой методи­ки, а, напротив, к ее упрочнению и к ее утверждению в определенных границах, в которых она, очевидно, имеет полное право на примене­ние и существование» (Тесты: теория и практика. М., 1928, № 2, С. 54).

Тем не менее, начиная с указанного периода критика тестов при­обрела широкий размах и вышла за рамки чисто научных дискуссий. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, с порога. В США, например, против использования тестов выступали представители основных групп населения США - взрос­лые и дети, белые и негры, рабочие и управленческий персонал, а также представители национальных меньшинств.

В результате проведения серии исследований по социальным по­следствиям тестирования выяснилось, что 37 % опрошенных возра­жали против использования тестов при поступлении на работу, 50 % -при продвижении по службе, 25 % - против использования тестов в школе (Brim S., 1965). Случаи нарушения этики при использовании тестов оказались столь злободневными, что ими вынужден был за­няться Конгресс, устроивший специальные слушания по этому делу. В результате было принято решение, осуждающее неэтичное исполь­зование тестов, практику вторжения в частную жизнь как идущую вразрез с моральными нормами (Armor D., 1974). В августе 1966 г. в Сенате США обсуждалось предложение о полном запрещении тес­тов, но это предложение не было поддержано большинством.

В зарубежной литературе выделяется несколько источников кри­тики тестов. Психолог С. Брим усматривает первый источник в лич­ностном портрете критиков, в числе которых чаще других оказыва­ются те, кто не склонен к самопознанию и интроспекции, авторита­рен в межличностных отношениях, нетерпим к мнению других и возражает против всяких социальных перемен. Как правило, в США эти лица примыкают к правым политическим группам, требующим запрещения тестов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на пе­редовые позиции должны выдвигаться наиболее талантливые люди. В таком обществе каждый должен иметь возможность внести свой вклад в соответствии со своими способностями. Последние долж­ны быть оценены, и потому ориентация на этот принцип создает благоприятное отношение к тестам (Brim S., 1965). Третий источ­ник является, по мнению Р. Кеттелла (Cattell R., 1950), следствием эмоционального и сентиментального отношения людей эстетичес­кого и нарциссического типа, возражающих против всякой попытки представить «уникальную, художественную личность» в виде фор­мул. Четвертый источник критики является научным и касается не­достатков тестового метода.

В 30-е годы случилось так, что психотехника не оправдала возла­гавшихся на нее надежд в смысле заметного повышения производи­тельности труда. Она и не могла это сделать, потому что на том, срав­нительно низком уровне промышленного развития прогресс в значи­тельной мере зависел от уровня индустриализации и автоматизации производства. При достижении необходимого уровня развития средств производства человеческий фактор вновь начинает играть ключевую роль. Вот почему именно в последние годы стал заметно увеличи­ваться поток прикладных психологических исследований, нацелен­ных, в частности, на повышение эффективности человека-оператора в управлении сложными техническими системами. Соответственно возросла роль психофизики, психометрии, прикладной и инженерной психологии, психологии труда и безопасности, экспериментальной психологии, научно обоснованной профориентации и профотбора. Вместе с этим опять возросло и значение тестов.

Хотя в 30-е годы практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в на­шей стране не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний, и, наоборот, различные испытания нередко назывались тестами. Суть вопроса, разумеется, не в названи­ях, а в принципиальных отличиях.

Первое отличие состоит в том, что тест является научно обосно­ванным методом эмпирического исследования в психологии и в ряде других наук. Важная мысль К. Маркса о том, что одна экономическая эпоха отличается от другой не тем, что она производит, а тем, каким способом она это делает относится в полной мере и к психологичес­кой науке. В период зрелости в ней, как и везде, все большее внима­ние направляется на способы познания и на критерии обоснования истинности знания.

Второе принципиальное отличие связано со сравнительно новой ролью теста как инструмента теоретического исследования в таких, например, направлениях психологии, как изучение личности, способ­ностей. Здесь использование тестов позволило преодолеть методоло­гический тупик, в котором оказались авторы многочисленных тео­рий, концепций, интуитивных догадок и иных умозрительных пост­роений, не видевших способа обоснования истинности своих сужде­ний. Непосредственное же обращение к практике как критерию истины нередко дает противоречивые результаты, ибо действительно научная аргументация требует определенного структурирования, опос­редования, абстрагирования и, кроме того, методической вооружен­ности исследователя.

Только в последние годы в психологии стала широко осознавать­ся задача согласования теоретических разработок с эмпирическими результатами, для чего стали необходимыми методы, позволяющие это делать без заметной потери качества такого согласования. Тесты являются сейчас, по-видимому, наиболее развитой в научном отно­шении частью методического арсенала, позволяющего адекватно скреплять теорию с эмпирией, в соответствии с некоторыми извест­ными стандартами качества информации. Именно такое понимание тестов все в большей мере начинает утверждаться в новейшей отече­ственной и зарубежной литературе (Анастази А., 1982; Бурлачук Л. Ф., 1979; Кабанов М. М., Личко А. Е., Смирнов В. М., 1983; Кулагин Б. В., 1984; Марищук В. Л. и др., 1984; Мельников В. М., Ямпольский Л. Т., 1985; Практикум по.психодиагностике. Дифференциальная психомет­рика, 1984; Психологические методы исследования личности в кли­нике, 1978; Шванцара И. и др., 1978),

Обоснование качества результатов психологических исследова­ний требует обращения к внепсихологическим понятиям и критери­ям: философским, логическим, математико-статистическим. В част­ности, философский элемент в теорию психологических измерений вносит известный тезис о неизбежности погрешности измерений. Критики психологических тестов нередко апеллируют к этому тезису как к основанию принципиальной порочности тестов в смысле точ­ности измерений. Неточные измерения, считают они, науке вообще не нужны. При этом как-то забывается, что формой преодоления это­го философского скепсиса является тезис о возможности приближен­ного измерения с достаточно приемлемой точностью. Применение на практике последнего тезиса позволило получить, например в фи­зике, те фундаментальные результаты, которыми эта наука по праву гордится.

Не вдаваясь в детальный анализ концепции надежности, представ­ляющей предмет отдельного рассмотрения в данной книге, отметим здесь лишь ее связь с понятием «тест». Действительный отход от уп­рощенного понимания тестов требует наполнения интересующего нас понятия элементами научного языка, восхождения на более высокую ступень абстракции. Концепция надежности составляет одну из ос­нов переосмысления сущности теста, а также одну из характеристик его качества. С появлением корреляционного анализа (в начале XX в.) были предложены три основных методических подхода к определе­нию надежности теста. Это - повторное тестирование, использова­ние параллельных форм одного и того же теста и, наконец, однократ­ное тестирование с последующим разбиением матрицы исходных результатов (X) на две или большее число частей. За показатель на­дежности принимается значение коэффициента корреляции.

Значительно позже появились попытки теоретического осмысле­ния этой концепции. Исходным пунктом всех построений является уже упоминавшийся тезис о неизбежности погрешности измерений и, как следствие, признание множественности возможных причин ис­кажения истинного результата измерения.

Как результат факторно-аналитического переосмысления концеп­ции надежности и гомогенности теста родилась новая технология расчета коэффициента надежности теста. Ее появление надо рассмат­ривать как реакцию на неприемлемость и искусственность ряда та­ких условий и ограничений, как, например, параллельность форм од­ного и того же теста, равенство дисперсий всех высказываний, оди­наковая их коррелируемость друг с другом. Д. Армор использовал известный факт корреляции тестовых высказываний между собой и стал рассматривать ее как аргумент, статистической функцией кото­рого является надежность теста.

Если все высказывания измеряют один и тот же признак (свой­ство), то для фиксированного их числа чем больше корреляция меж­ду ними, тем более надежен тест. С другой стороны, высокая корре­ляция обеспечивает хорошую факторизуемость корреляционной мат­рицы (К) и, следовательно, является залогом выделения такого одно­го фактора, который может объяснить связь большей части дисперсии в R. Следовательно, надежность тестов должна быть связана с резуль­татом факторного анализа. Предложенная Армором формула оказа­лась сравнительно простой (Armor D., 1974, с. 20):

θ =

где θ - коэффициент надежности теста; k— количество высказыва­ний; λ 1 - наибольшее значение корня, получаемое при решении ха­рактеристических уравнений вида /R - λ • J/ = 0.

Помимо надежности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увлечения точностью измерения неточно выделенных свойств, соотношение между надеж­ностью и валидностью можно образно представить в виде кучной стрельбы, но не в центр мишени, т. е. стрельба ведется из оружия впол­не надежного, но прицел стрелок выбрал не совсем точно.

Современный тест - это не только надежный, но и валидный тест, однако не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надежных и валидных. Эти качества характеризу­ют не только инструмент измерения, но обязательно характер, цель и время его применения. В историческом разрезе концепция валидности, так же как и надежности, начиналась с наивного предположения о том, что метод «работает», т. е. каждый создаваемый тест рассматри­вался как валидный, примерно так, как если бы каждая создаваемая социологами анкета годилась для решения поставленных задач. Пер­вые же проявления действительно научной критики развенчали эту, по сути дела, «веру» в валидность. Они же стимулировали поиск. При­влечение известных ученых к созданию тестов было для научной об­щественности в начале нынешнего века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки ка­чества тестов.

Поскольку в те годы тесты разрабатывались исключительно для решения практических проблем, эмпиризм и соответствующая ему методология стали главными для обоснования качества инструмен­тария. Это особенно проявилось в создании тестов для решения кад­ровых проблем: профотбора, профориентации, профконсультации, а также распределения принятого контингента по специальностям и отделениям внутри производства или учебного заведения.

С точки зрения истории, можно выделить два основных, эмпири­ческих подхода к валидизации тестов. Первый назовем прогности­ческим. Его логика такова. Если те, кто хорошо работает (по крите­рию У), показывают высокие результаты по какому-либо теcту (X), значит, здесь есть связь, быть может, и причинная. Иначе говоря, Y, вероятно, зависит от X. Отдавая предпочтение при приеме на работу тем, у кого выше результаты по X, предполагается, что они покажут и более высокую производительность труда. Ожидания такого рода ча­сто сбываются, но в различной степени. Другой подход к эмпиричес­кой валидизации тестов основан на использовании экспертных оце­нок. Здесь логика еще проще: если эксперты (множество авторите­тов) согласованно считают одних более способными, других - менее, значит, «это так». В случае когда результаты теста указывают на сход­ную тенденцию, т. е. данные по тесту коррелируют с данными экс­пертизы, то принимается, что тест является валидным и его можно далее примерять и в других подобных ситуациях. Так проводилась валидизация первого теста для измерения интеллектуальных способ­ностей (Бине А. и Симон Т.), а в наше время - некоторых тестов для измерения социальных потребностей молодежи (Прогнозирование со­циальных потребностей молодежи. М., 1978).

Развитие тестов в тесных рамках эмпиризма не могло продолжать­ся сколь-нибудь долгое время. Без теоретического мышления, как ука­зывал Ф. Энгельс, невозможно связать между собой хотя бы два фак­та природы или уразуметь существующую между ними связь (Маркс К., Энгельс Ф. Соч., т. 20, с. 382). Обращение к внеэмпирическим критериям истинности было неизбежным. Отсюда последо­вали такие подходы к валидизации, в которых теория сочеталась с эмпирией. В качестве примера можно взять важную для традицион­ной психологии область научных конструктов, ключевых психологи­ческих понятий. Именно понятия и конструкты стали основным пред­метом многих исследований с помощью тестов. Последние призваны уточнить эмпирический состав индикаторов (высказываний), соответ­ствующих таким конструктам-понятиям, как личность, темперамент, интеллект, экстраверт и многим другим. В современной психологии они стали предметом эмпирического исследования, и делается это с целью фундаментального обоснования практической значимости те­оретических суждений.

Теперь пора ответить на последний вопрос - что же такое совре­менный психологический тест? Это теоретически и эмпирически обо­снованная система высказываний (заданий), позволяющая получить измерения соответствующих психологических свойств. Теоретичес­кое обоснование предполагает всесторонний анализ теста и результатов его применения в свете известных достижений современной пси­хологической науки. Эмпирическое же обоснование связано с обра­щением к опыту, измерениям и эксперименту.

Здесь может возникнуть ошибочная ассоциация с неопозитивист­ским принципом верификации. Этому способствует наличие в обоих случаях требования эмпирического согласования теоретических кон­цепций (конструктов). Но, как справедливо отмечал Э. М. Чудинов, наука до и независимо от неопозитивизма руководствовалась требо­ванием принципиальной проверяемости своих теорий. Это всегда отличало науку от религии и натурфилософских построений, обеспе­чивало ей строгость и точность. Неопозитивизм абсолютизировал эту грань научного познания, обратив ее против философии и против са­мой науки. Он трансформировал указанное требование в принцип верификации, который накладывает на науку непомерные ограниче­ния и несовместим с ней (Чудинов Э. М., 1977).

Отмеченными выше критериями надежности и валидности про­блема обоснования научности тестов не закрывается. Из используе­мых сейчас двух критериев первый назовем общенаучным, а второй -специально научным. Их широкое применение - всего лишь дань сло­жившейся в теории тестов традиции. В ряде наук идеи валидности преломляются в виде стремления обосновать истинность, необходимость, системность, рациональность и др. Ключевым критерием яв­ляется истинность, которая связана со всеми остальными. Валидность теста соотносится с истинностью через принцип предметности зна­ния, указывающего на степень его соотнесенности с познаваемым. Но все это - область специального исследования, которое еще пред­стоит провести в процессе дальнейшего развития теории и практики применения психологических тестов.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-04-11; Просмотров: 560; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.034 с.)
Главная | Случайная страница | Обратная связь