Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Раздаточный материал для исследований




ИСТОРИЯ ПСИХОЛОГИИ


ОСНОВНЫЕ МЕТОДЫ ПСИХОЛОГИИ

 

Наблюдение Внешнее (наблюдение со стороны) Внутреннее (самонаблюдение) Свободное Включенное Стороннее
Опрос Устный Письменный Свободный Стандартизованный
Тесты Тест-опросник Тест-задание Проективный
Эксперимент Естественный Лабораторный
  Другие методы

ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ1

Предыстория тестов уходит в глубину веков. Она связана с испытаниями различных способностей, знаний, умений и навы­ков. Сообщается, что уже в середине III тысячелетия до н. э. в Древнем Вавилоне проводились испытания выпускников в школах, где готовились писцы. Профессионально подготов­ленный писец был центральной фигурой месопотамскои циви­лизации благодаря обширным по тем временам знаниям.,, Он был обязан знать все четыре арифметических действия, уметь измерять поля, распределять рационы, делить имущество, владеть искусством пения и игры на музыкальных инструментах. Кроме того, проверялось умение разбираться в тканях, металлах, растениях и др. (Дандамаев М. А., 1983).

В Древнем Египте только тот обучался искусству жреца, кто был способен выдержать систему определенных испытаний. Вначале кандидат в жрецы проходил собеседование, в процессе которого выяснялись его биографические данные, уровень образо­ванности; кроме того, оценивались внешность, умение вести беседу. Затем следовали проверки умения трудиться, слушать и молчать, испытания огнем, водой, страхом преодоления мрач­ных подземелий в полном одиночестве и др. (Аванесов В. С, 1982). Все эти жестокие испытания дополнялись угрозой смерти для тех, кто не был уверен в своих способностях к учению и в том, что сумеет выдержать все тяготы длительного периода образования. Поэтому каждому кандидату предлагалось еще раз подумать и, тщательно взвесив, решить, с какой стороны закрыть за собой дверь в храм — с внутренней или с внешней.

Сообщается, что эту суровую систему испытаний успешно преодолел знаменитый ученый древности Пифагор. Вернув­шись позже в Грецию, он основал школу, допуск в которую открывал только для тех, кто был способен преодолеть серию различных испытаний, похожих на те, которые он выдержал сам. Как свидетельствуют источники (цит. по: Голицын Н. Н., 1855, с. 118), Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что «не из каждого дерева можно

1 Цит. с сокр. по кн.: «Общая психодиагностика» Под ред. А. А. Бодалева, В. В. Столина. Изд-во Моск. ун-та, 1987.


выточить Меркурия», и потому, вероятно, придавал большое значение диагностике именно этих способностей. Для этого каждому давалась сравнительно трудная математическая задача. В случае ее решения вопрос о приеме решался сразу. Однако чаще всего задача не решалась, после чего неудачника вводили в зал, где ученики, по правилам испытаний, должны были беспощадно поднимать его на смех, давая ему обидные прозвища. Если поведение новичка в этой критической ситуации харак­теризовалось умением отвечать на выпады, хорошо и достойно держать себя, его принимали в школу (подробнее см., напр.: АванесовВ. С, 1982).

Особенное значение Пифагор придавал смеху и походке молодых людей, утверждая, что манера смеяться является самым хорошим показателем характера человека. Он внимательно относился к рекомендациям родителей и учителей, тщательно вел наблюдение за каждым новичком после того, как последнего приглашали свободно высказываться и не стесняться, смелее оспаривать мнения собеседников (там же).

Сообщается (Dubois P., 1970), что за 2200 лет до н. э. в Древнем Китае уже существовала система проверки способ­ностей лиц, желавших, занять должности правительственных чиновников.1 Каждые три года чиновники повторно экзаменова­лись лично у императора по шести «искусствам»: музыке, стрельбе из лука, верховой езде, умению писать, считать, знанию ритуалов и церемоний. Для государства система экзаменов была важным средством отбора достаточно способных, в меру эрудированных и, главное, лояльных по отношению к власти людей для последующего их использования на административ­ной службе.

Нередко результаты испытания интеллектуальных способ­ностей становились предметом гордости того или иного народа, а иногда служили даже для извлечения доходов. Сообщается, например, что индийский царь Девсарм, желая испытать муд­рость иранцев, прислал им шахматы. Предполагалось, что иран­цы вряд ли сумеют разгадать суть этой игры и потому они должны были по условию отослать в Индию подать. Сооб-

' Существует мнение, что подобная практика в Китае сложилась значительно позже (Воскресенский Д. М. Человек в системе государственных экзаменов. История и культура Китая. М., 1974).


щается, однако, что визирь Хосрова Важургмихр понял правила игры и в свою очередь изобрел игру, называемую сейчас нарды. Он послал с новой игрой визиря в Индию, где ее, как выяснилось, разгадать не смогли (Орбели И. А., 1936).

Другим свидетельством использования испытаний тестово­го характера являются материалы, излагающие основы религи­озного учения чань-буддизма. Учителя чань-буддизма использо­вали загадки, вопросы-парадоксы с одновременным созданием ситуации психологического стресса. Отвечать на них необходи­мо было сразу, на раздумывание не отводилось ни секунды. Как отмечает Н. В. Абаев, в чаньских поединках-диалогах сама парадоксальность постановки вопросов (например, была ли борода у бородатого варвара или имеет ли собака природу Будды? ) создавала драматическое напряжение, которое усилива­лось всем образом действий наставника. Хватая своего оппо­нента и крича на него: «Говори! Говори! Отвечай немедленно! », он создавал ситуацию психического напряжения. Чаньские парадоксальные загадки использовались, по мнению этого же автора, в качестве тестов на определенный «чаньский» ход мышления. В зависимости от того, как тестируемый неофит отвечал на эти загадки, опытный наставник определял, на каком уровне «просветленности» он находился и какие меры нужно принять для углубления его «чаньского опыта», а также выявлял симулянтов, скрывающих за внешней грубостью и странностью манер свою некомпетентность (Абаев Н. В., 1980).

В созданном чжурчжэнями государстве Цзинь результаты экзаменов применялись для распределения выпускников медицинского училища. Из числа выдержавших экзамены луч­шие поступали на государственную службу в качестве практи­кующих врачей, преподавателей или исследователей, худшие получали разрешение заниматься частной практикой. Не выдер­жавшим экзамен рекомендовалось либо продолжить подготов­ку, либо сменить профессию (Воробьев М. В., 1983).

Различные конкурсы и экзамены устраивались и в средне­вековом Вьетнамском государстве. Всего за два года в период с 1370 по 1372 г. удалось провести переаттестацию всех военных и гражданских чиновников, что позволило организо­вать проверку государственного аппарата по всей стране. В ре­зультате этого Вьетнам вновь стал сильным и жизнеспособным


феодальным государством; особое внимание было уделено созда­нию боеспособного офицерского корпуса (Берзин Э. О., 1982).

В XV в. конкурсные испытания были упорядочены. Они проводились по этапам и турам. Присвоение высших степеней на экзаменах сопровождалось большими почестями. Лауреаты по­лучали подарки от короля, их имена вносились в «золотой список», который вывешивался у Восточных ворот столицы, об их победах на конкурсе сообщалось в родную общину. Имена наиболее отличившихся высекались на специальных каменных стелах, установленных в Храме Литературы (Берзин Э. О., 1982).

Интересные данные приводятся В.Н. Басиловым о шаман­стве. У некоторых народов (например, у эскимосов) чуть ли не каждый взрослый мужчина считал себя способным к шаманст­ву, но эти претензии отвергались в процессе испытаний. Про­верка и, как результат ее, признание были непременными условиями шаманской деятельности. У разных народов провер­ка шамана принимала свои формы. В частности, когда у казахов кто-либо объявлял себя шаманом, то он по требованию народа должен был, как сообщается, ходить по снегу в трескучий мороз босиком и с обнаженной головой, лизать языком раскаленные докрасна железные предметы. У народности ханты неудачного претендента считали сумасшедшим. У ульчей шаман подвергал­ся испытаниям во время поминок. Такой же обычай был у нанайцев (Басилов В. Н., 1984).

Приведенный здесь краткий исторический экскурс позволя­ет сделать вывод о необходимости рассматривать испытания индивидуальных способностей как важную и неотъемлемую часть общественной жизни многих (если не всех) народов мира со времен древнейших цивилизаций и до наших дней. Однако можно ли на основании приведенных данных говорить о глубокой истории и широкой распространенности тестов? Если согласиться с наиболее известными сейчас определениями теста, даваемыми как перевод с английского слова «test» — испытание, проверка, проба, то на поставленный вопрос надо отвечать утвердительно. Дело, однако, в том, можно ли в наше время так определять тест?

В случае с тестами научный анализ дает классический пример видимого совпадения вещей по форме и их действитель­ных различий по существу. Различия начинаются с рассмотре­ния основного понятия. Как отмечал Б. М. Кедров, каждое

in


понятие может быть зафиксировано, во-первых, как сложивше­еся, готовое на данный момент времени, а потом как относитель­но неизменное, постоянное. Во-вторых, научные понятия выра­жают и резюмируют собой на каждом этапе научного развития определенную ступень развития науки. В результате складыва­ются две логические системы: формально-логическая, опериру­ющая относительно неизменными, готовыми понятиями, и диа­лектологическая, оперирующая изменчивыми, развивающимися, текущими понятиями (Кедров Б. М., 1967).

К началу XX в. практические потребности изучения преобла­дающих способностей были сформулированы в виде научной проблемы исследования индивидуальных различий. Эта пробле­ма и дала импульс к появлению первых тестов. Ф. Гальтон, известный английский ученый, в течение 1884—1885 гг. провел серию испытаний, в которых посетители лаборатории в возра­сте от 5 до 80 лет могли за небольшую плату проверить свои физические качества (силу, быстроту реакции и др.), ряд физи­ологических возможностей организма и психических свойств по семнадцати показателям. В число последних вошли показа­тели роста, веса, жизненной емкости легких, становой силы, силы кисти и удара кулаком, запоминаемости букв, остроты зрения, различения цвета и другие. По полной программе было обсле­довано 9337 человек. Ф. Гальтон писал, что практика вдумчиво­го и методичного тестирования — не фантазия; она требует рассмотрения и эксперимента (Galton F., 1884).

Это был первый существенный отход от тысячелетней практики испытаний и проверок, основанной на интуиции. Применительно к тестам значение деятельности Ф. Гальтона можно сравнить с тем, что сделал Г. Галилей для физической науки своими остроумными экспериментами. Набиравший силу радикальный эмпиризм рассматривался рядом ученых конца XIX в. как вполне приемлемая альтернатива идеализму, а экспе­римент — как настоящий фундамент науки. «Только тогда психология сможет стать действительной и точной наукой, — писал, например, Дж. Кэттелл, — когда она будет иметь своей основой эксперимент и измерения» (Cattell D., 1890).

Дж. Кэттелл, по-видимому, первым увидел в тестах средство измерения, казалось бы, неизмеряемых свойств человеческой психики. В работе, опубликованной в 1890 г., он дал список

11


50 лабораторных тестов, которые мы бы сейчас назвали не тестами, а контрольными заданиями. Эти задания обладали толь­ко двумя из известных сейчас требований к тестам — имелась инструкция по их применению и подчеркивался лабораторный (т.е. научный) характер испытаний. В частности, указывалось, что лабораторию следует хорошо оборудовать, в нее не допуска­ются зрители во время тестирования; все испытуемые одинаково инструктируются, они должны хорошо усвоить, что и как нужно им делать (Cattell D., 1890).

Надо ли говорить, сколь непривычной казалась идея измере­ния для психологии XIX века. Измерение с помощью тестов казалось тогда, а многим кажется и по сей день, делом если не странным, то претенциозным. Обыденное сознание исходило при этом из аналогии с физическими измерениями и рассматри­вало эти попытки математизации как чуждый для гуманитарной психологии у^клон. Примерно с такими же трудностями сталки­валась и психофизика.

Тем не менее к концу 20-х годов нашего столетия все больше стала ощущаться потребность в создании специфичес­кого направления, связанного с особенностями использования числа и меры. В психологии эту роль выполняла психометрия, в биологии — биометрия, в экономике — эконометрия, в науке в целом — наукометрия. К ним следовало бы добавить и социометрию, но последнюю Дж. Морено и Г. Гурнич свели к элементарным методам оценки взаимодействий индивидов в малых группах.

С момента первых публикаций Ф. Гальтона и Дж. Кэттелла идея тестового метода сразу же привлекла к себе внимание ученых разных стран мира. Появились первые сторонники тестов и первые же противники. В числе сторонников были: в Германии — Г. Мюнстерберг, С. Крепелин, В. Онри, во Фран­ции — А. Бине, в США — Дж. Гилберт и другие. Это были исследователи нового типа, стремившиеся связать психологию тех лет с запросами практики. Однако стремление к приклад­ным исследованиям в психологии прошлого расценивалось как отход от науки. Дж. Кэттелл, например, сообщал, что он начал свои первые тестовые лабораторные исследования индивидуаль­ных различий в 1885 г., но публиковаться не мог из-за противодействия В. Вундта (Cattell D., 1896).


Итак, научный статус тестов не был определен, возмож­ность измерений в психологии подвергалась сомнению. Психо­логия переживала трудный период: она уже не могла развивать­ся на старой основе, но и не научилась еще смотреть на мир по-новому. «Причина кризиса, — писал Л. С. Выготский, — лежит в развитии прикладной психологии, приведшей к перестройке всей методологии науки на основе принципа практики. Этот принцип давит на психологию и толкает ее к разрыву на две науки» (цит. по: Ярошевский М. Г., Гургенидзе Г. С, 1977). Общественная практика требовательно выдвигала одну пробле­му за другой и ни одну из них старая психология решить не могла — у нее не было подходящих методов.

Появление в этой ситуации прикладной психологии не было случайностью. Ей было дано название психотехника. Прикладное направление появилось и в педагогике. Хотя педология претендовала на звание науки о комплексном разви­тии ребенка, в тот период она была в основном прикладной педагогикой. Будучи непринятыми в традиционной науке — в психологии и в педагогике, тесты быстро нашли себе приме­нение в прикладных направлениях.

В общем, произошло так, как говорили в древности: если какой-либо науке не находится место в храме, она начинает развиваться у его стен.

Активизация роли науки в практическом переустройстве жизни столкнулась с традицией занятий «чистой наукой, созерца­нием истины». Для представителей чистой науки прикладность не имела заметной ценности. За рубежом, например в ЗО-х годах, ученые Кембриджа, как вспоминает Ч. Сноу, больше всего горди­лись тем, что их научная деятельность ни при каких мыслимых обстоятельствах не может иметь практического смысла (Сноу Ч., 1973). Цель, методы и результаты психотехники лежали в сфере практики, в то время как цели, методы и результаты традицион­ной психологии лежали в области теоретических рассуждений. Различались производительная и познавательная функции этих направлений. То, что имело ценность для психотехники, психоло­гия того времени ни принять, ни произвести сама не могла, так же как и психотехника мало что могла дать для психологии.

Размежевание стало заметным в конце 20-х — начале 30-х годов. Вместо объединения усилий обе стороны приступили


к взаимным обвинениям и затяжнымдискуссиям. Психология обвинялась в схоластике, узком академизме, в неспособности воспринять новое и в отрыве от практики жизни. Психотехника в свою очередь осуждалась за узкий практицизм, противореча­щий духу науки, за отрыв от психологии, она обвинялась в голом эмпиризме, прикладности, подражании западным образ­цам, в чрезмерном увлечении тестами. Последние стали узло­вым пунктом критики.

Разрыв между фундаментальным и прикладным направле­ниями был до недавнего времени характерен для многих наук, но не везде он протекал столь болезненно, как в психологии и, особенно, в педагогике. Даже в исторической науке получили распространение взгляды морализирующих историков, проти­вопоставляющих «чистое и возвышенное познание» различным формам приложения науки, влекущим за собой лишь несчастья и опасности (Шахназаров Г. X., 1981).

Начало 30-х годов характеризуется широким использова­нием тестов во многих странах. Во Франции они стали применяться для дефектологических целей и для профориента­ции, в США тесты использовались при приеме на работу, в вузы, для оценки знаний школьников и студентов, в социально-психологических исследованиях. В СССР тесты применялись в основном в двух основных сферах: в народном образовании и в сфере профотбора — профориентации. Затронутые тестами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений в пользу и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в резуль­тате его использования, породили во многих странах, в том числе и в бывшем СССР, письма в правительственные органы и в газеты с требованием запрета тестов.

В отечественной истории тестов начало 30-х годов характеризуется интенсивным и неконтролируемым использо­ванием тестов в системе народного образования и в промыш­ленности. Практика, как это часто бывает, опережала теорию. Массовые тестовые обследования не подкреплялись серьезной проверкой качества инструментария. Решения о переводе не­которых учащихся в классы для умственно отсталых детей


принимались на основе коротких тестов без учета других факторов, влияющих на результаты проверки. В промышленно­сти на основе таких же тестов делались попытки классифика­ции работников по различным профессиям без внимательного учета личных склонностей и интересов. Ввиду надвигавшейся тестомании и ряда причин субъективного характера было принято известное постановление «О педологических извра­щениях в системе наркомпросов» (1936), наложившее запрет на применение бессмысленных (как там отмечалось) тестов и анкет. Это постановление, по мнению А. Н. Леонтьева, А. Р. Лурия и А. А. Смирнова, получило в последующие годы неправомерно расширительное толкование и привело к отказу от разработки научно обоснованных методов психологической диагностики лич­ности (Леонтьев А. Н., Лурия А. Р., Смирнов А. А., 1968).

В те годы были, однако, и другие выступления — в пользу тестов. Так, известный советский психолог М. Я. Басов гово­рил: «Я думаю все же, что эта долгая, подчас острая критика тестовой методики... в конце концов, приведет не к ниспровер­жению, не к упразднению этой методики, а напротив, к ее упрочнению и к ее утверждению в определенных границах, в которых она, очевидно, имеет полное право на применение и существование» (Тесты: теория и практика. М., № 2, 1928, с. 54).

Тем не менее, начиная с указанного периода, критика тестов приобрела широкий размах и вышла за рамки чисто научных дискуссий. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, «с порога». В США, например, против использования тестов выступали представители основ­ных групп населения США — взрослые и дети, белые и негры, рабочие и управленческий персонал, а также представители национальных меньшинств.

В серии проведенных исследований по социальным последствиям тестирования выяснилось, что 37 % опрошенных возражали против использования тестов при поступлении на работу, 50 % — при продвижении по службе, 25 % — против использования тестов в школе (Brim S., 1965). Случаи наруше­ния этики в использовании тестов оказались столь злободнев­ными, что ими вынужден был заняться конгресс, устроивший специальные слушания по этому делу. В результате было принято решение, осуждающее неэтичное использование тестов,


практику вторжения в частную жизнь, как идущую вразрез с моральными нормами (Armor D., 1974). В августе 1966 г. в сенате США обсуждалось предложение о полном запреще­нии тестов, но оно не было поддержано большинством.

В зарубежной литературе выделяется несколько источни­ков критики тестов. Первый источник психолог С. Брим усматривает в личностном портрете критиков, в числе которых чаще других оказываются те, кто не склонен к самопознанию и интроспекции, авторитарен в межличностных отношениях, нетерпим к мнению других и возражает против всяких соци­альных перемен. Как правило, в США эти лица примыкают к правым политическим группам, требующим запрещения тес­тов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на передовые позиции должны выдвигаться наиболее талантливые люди. В таком обществе каждый должен иметь возможность внести свой вклад в соответствии со своими способностями. Последние должны быть оценены, и поэтому ориентация на этот принцип создает благоприятное отношение к тестам (Brim S., 1965). Третий источник является, по мнению Р. Кэттелла (Cattell R., 1950), следствием эмоционального и сен­тиментального отношения людей эстетического и нарцистичес-кого типа против всякой попытки представить «уникальную, художественную личность» в виде формул и т. п. Четвертый источник критики является научным и касается недостатков тестового метода.

В 30-е годы случилось так, что психотехника не оправдала возлагавшихся на нее надежд в плане заметного повышения производительности труда. Она и не могла это сделать, потому что на том сравнительно низком уровне промышленного раз­вития прогресс в значительной мере зависел от уровня индус­триализации и автоматизации производства. При достижении необходимого1 уровня развития средств производства челове­ческий фактор вновь начинает играть ключевую роль. Вот почему именно в последние годы стал заметно увеличиваться поток прикладных психологических исследований, нацеленных, в частности, на повышение эффективности человека-оператора


в управлении сложными техническими системами. Соответ­ственно возросла роль психофизики, психометрии, прикладной и инженерной психологии, психологии труда и безопасности, экспериментальной психологии, научно обоснованной проф­ориентации и профотбора. Вместе с этим опять возросло и значение тестов.

Хотя в 30-е годы практическая работа по тестам затормози­лась, научное изучение действительных возможностей этого метода в СССР не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний и, наоборот, различ­ные испытания нередко назывались тестами. Суть вопроса, разумеется, не в названиях, а в принципиальных отличиях.

Первое отличие состоит в том, что тест является научно обоснованным методом эмпирического исследования в психо­логии и в ряде других наук.

Второе принципиальное отличие связано со сравнительно новой ролью теста как инструмента теоретического исследова­ния в таких, например, направлениях психологии, как изучение личности, способностей. Здесь использование тестов позволило преодолеть методологический тупик, в котором оказались авторы многочисленных теорий, концепций, интуитивных дога­док и иных умозрительных построений, не видевших способа обоснования истинности своих суждений. Непосредственное же обращение к практике как к критерию истины дает нередко противоречивые результаты, ибо действительная научная аргу­ментация практикой требует определенного структурирования, опосредования, абстрагирования последней и, кроме того, мето­дической вооруженности исследователя.


Кабанов М. М., Личко А. Е., Смирнов В. М., 1983; Кулагин Б. В., 1984; -Марищук В. Л. и др., 1984; Мельников В. М., Ямпольский А. Т., 1985; Практикум по психодиагностике. Дифференциальная психометрика., 1984; Психологические методы исследования личности в клинике, 1978, Шванцара Й. и др., 1978 и др.).

Обоснование качества результатов психологических исследований требует нередко обращения к внепсихологичес-ким понятиям и критериям: философским, логическим, мате-матико-статистическим. В частности, философский элемент в теорию психологических измерений вносит известный тезис о неизбежности погрешности измерений. Критики психологи­ческих тестов нередко апеллируют к этому тезису как к осно­ванию принципиальной порочности тестов в смысле точности измерений. Неточные измерения, считают они, науке вообще не нужны. При этом как-то забывается, что формой преодоления этого философского скепсиса является тезис о возможности приближенного измерения с достаточно приемлемой точнос­тью. Применение на практике последнего тезиса позволило получить, например, в физике те фундаментальные результаты, которыми эта наука по праву гордится.

Не вдаваясь в детальный анализ концепции надежности, представляющей предмет отдельного рассмотрения, отметим здесь лишь ее связь с понятием «тест». Действительный отход от упрощенного понимания тестов требует наполнения интере­сующего нас понятия элементами научного языка, восхождения на более высокую ступень абстракции. Концепция надежности составляет одну из основ переосмысления сущности теста, а также одну из характеристик его качества. Без упоминания о надежности определение теста не имеет смысла.

С появлением корреляционного анализа (в начале XX в.) были предложены три основных методических подхода к опре­делению надежности теста. Это — повторное тестирование, использование параллельных форм одного и того же теста и, наконец, однократное тестирование с последующим разбие­нием матрицы исходных результатов на две или большее число частей. За показатель надежности принимается значение коэф­фициента корреляции.

Значительно позже появились попытки теоретического осмысления этой концепции. Исходным пунктом всех постро-


ений является уже упоминавшийся тезис о неизбежности погрешности измерений и, как следствие, признание множествен­ности возможных причин искажения истинного результата измерения.

Как результат факторно-аналитического переосмысления концепции надежности и гомогенности теста родилась новая технология расчета коэффициента надежности теста. Ее появ­ление надо рассматривать как реакцию на неприемлемость и искусственность ряда таких условий и ограничений, как, например, параллельность форм одного и того же теста, равенство дисперсий всех высказываний, одинаковая их кор-релируемость друг с другом и др. Д. Армор (Armor D., 1974) использовал известный факт корреляции тестовых высказы­ваний между собой и стал рассматривать ее как аргумент, статистической функцией которого является надежность теста.

Помимо надежности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увлече­ния точностью измерения неточно выделенных свойств, соотно­шение между надежностью и валидностью можно образно представить в виде кучной стрельбы, но несколько в стороне от центра мишени, т. е. стрельба из оружия вполне надежного, но прицел стрелок выбрал не совсем точно.

Современный тест — это не только надежный, но и валид­ный тест, однако не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надежных и валидных. Эти качества характеризуют не только инструмент измерения, но обязательно характер, цель и время его применения. В исто­рическом разрезе концепция валидности, так же как и надежно­сти, начиналась с наивного предположения о том, что метод «работает», т. е. каждый создаваемый тест рассматривался как валидный, примерно так, как если бы каждая создаваемая социологами анкета будто бы годилась для решения поставлен­ных задач. Первые же проявления действительно научной критики развенчали эту, по сути, «веру» в валидность. Они же стимулировали поиск. Привлечение к созданию тестов извест­ных ученых было для научной общественности в начале века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки качества тестов.


Поскольку в те годы тесты разрабатывались исключитель­но для решения практических проблем, эмпиризм и соответству­ющая-ему методология стали главными для обоснования каче­ства инструментария. Это особенно проявилось в создании тестов для решения кадровых проблем: профотбора, профори­ентации, профконсультации, а также распределения принятого контингента по специальностям и отделениям внутри производ­ства или учебного заведения.

С точки зрения истории можно выделить два основных эмпирических подхода к валидизации тестов. Первый назовем прогностическим. Его логика такова. Если те, кто хорошо работают (по критерию Y), показывают высокие результаты по какому-либо тесту (X), значит, здесь есть связь, быть может и причинная. Иначе говоря. Y, вероятно, зависит от X. Отдавая предпочтение при приеме на работу тем, у кого выше результа­ты по X, предполагается, что они покажут и более высокую производительность труда. Ожидания такого рода часто сбыва­ются, но в различной степени. Другой подход к эмпирической валидизации тестов основан на использовании экспертных оценок. Здесь логика еще проще — если эксперты (множество авторитетов) согласованно считают одних более способными, других — менее, значит «это так^. В случае, когда результаты теста указывают на сходную тенденцию, т. е. данные по тесту коррелируют с данными экспертизы, то принимается, что тест валидный и его можно далее применять и в других подобных ситуациях Так проводилась валидизация первого теста для измерения интеллектуальных способностей (Бине А. и Си­мон Т.), а в наше время — некоторых тестов для измерения социальных потребностей молодежи (Прогнозирование соци­альных потребностей молодежи, М., 1978).

Развитие тестов в тесных рамках эмпиризма не могло продолжаться сколь-нибудь долгое время. Обращение к внеэм-пирическим критериям истинности было неизбежным. Отсюда последовали такие подходы к валидизации, в которых теория сочеталась с эмпирией. В качестве примера можно взять важную для традиционной психологии область научных кон­структов, ключевых психологических понятий. Именно понятия и конструкты стали основным предметом многих исследований с помощью тестов. Последние призваны уточнить эмпири-

20


ческий состав индикаторов (высказываний), соответствующих таким конструктам-понятиям, как личность, темперамент, интел­лект, экстраверт и многих других. В современной психологии они стали предметом эмпирического исследования, и делается это с целью фундаментального обоснования практической зна­чимости теоретических суждений.

Теперь пора ответить на последний вопрос — что же такое современный, психологический тест? Это теоретически и эмпи­рически обоснованная система высказываний (заданий), позво­ляющая получить измерения соответствующих психологических свойств. Теоретическое обоснование предполагает всесторон­ний анализ теста и результатов его применения в свете известных достижений современной психологической науки. Эмпирическое же обоснование связано с обращением к опыту, измерениям и эксперименту.

Здесь может возникнуть ошибочная ассоциация с неопозити­вистским принципом верификации. Этому способствует нали­чие в обоих случаях требования эмпирического согласования теоретических концепций (конструктов). Но, как справедливо отмечал Э.М. Чудинов, наука до и независимо от неопозитивиз­ма руководствовалась требованием принципиальной проверяе­мости своих теорий. Это всегда отличало науку от религии и натурфилософских построений, обеспечивало ей строгость и точность. Неопозитивизм абсолютизировал эту грань, чер­точку научного познания, обратив ее против философии и про­тив самой науки. Он трансформировал указанное требование в принцип верификации, который накладывает на науку непо­мерные ограничения и несовместим с ней (Чудинов Э. М., 1977).

Отмеченными выше критериями надежности и валидности проблема обоснования научности тестов не закрывается. Из используемых сейчас двух критериев первый назовем общенаучным, а второй — специально научным. Их широкое применение всего лишь дань сложившейся в теории тестов традиции. В ряде наук идеи валидности преломляются в виде стремления обосновать истинность, обоснованность, необходи­мость, системность, рациональность и др. Ключевым критери­ем — принципом является истинность, которая связана со всеми остальными. Валидность теста соотносится с истинностью через принцип предметности знания, указывающего на степень его


соотнесенности к познаваемому. Но все это — область специ­ального исследования, которое еще предстоит провести в про­цессе дальнейшего развития теории и практики применения психологических тестов.


Поделиться:



Последнее изменение этой страницы: 2019-05-18; Просмотров: 250; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.041 с.)
Главная | Случайная страница | Обратная связь