Классификация психологических тестов

Тестология

Классификация психологических тестов

В психологической практике в ходе изучения различных психодиагностических проблем важное место занимает проблема целостного подхода. Изучение целостности предполагает ее препарирование и анализ составляющих объекта исследования. В процессе всестороннего анализа могут применяться различные методы психологической оценки. Выбор адекватных методов является сложной задачей практического психолога. В данной ситуации значительную помощь может оказать классификация психодиагностических методов, которая, с одной стороны, систематизирует совокупность психологических методик, тем самым облегчая их поиск для последующего применения, а с другой — дает возможность исследователю произвести оценку объекта в различных " диагностических плоскостях".

Классификация может быть построена по различным основаниям. Нам представляется, что технологический подход, основанный на выявлении уровня объективности получения и интерпретации психологических данных, наиболее продуктивен. Поэтому ниже он приводится более подробно. Безусловно, в классификацию включены не все существующие техники и тесты (это невозможно сделать), но основные методики, применяемые на практике, в ней представлены.

Класс: Объективные методики. Измерение результативности

И способа (особенностей) выполнения деятельности

Подкласс: Тесты личности (особенности интеллекта)

Тесты действия (целевые личностные тесты):

1. Тест структуры интеллекта Р. Амтхауэра (1953) (Модификация — Методика исследования особенностей мышления (ЦВМУ)).

2. Прогрессивные матрицы Равена (оценка особенностей и уровня интеллекта) (Дж. К. Равен, 1936).

3. Визуально-моторный гештальт-тест (зрительная-моторная координация) (Л. Бендер, 1938).

4. Тест визуальной ретенции (зрительная память) (А.Бентон, 1952).

5. Тест Выготского — Сахарова (формирование понятий у детей, взрослых) (Л. Выготский; Л. Сахаров, 1927).

6. Шкала памяти Векслера (WMS) (1946).

7. Корректурная проба (концентрация, устойчивость внимания) (Б. Бурдон, 1895).

8. Тест памяти Мейли (зрительная, слуховая память).

9. Шкала оценки Озерецкого (оценка двигательных умений и отдельных компонентов моторики) (Н.И. Озерецкий, 1923).

10. Тест " Спираль" (оценка двигательных функций).

11. Тест Линеограммы (переключение внимания, психические моторные функции, пластичность мыслительных функций).

12. Сложная реакция с выбором (СРВ) (внимание, кратковременная память, комбинаторные способности).

13. Комбинаторные способности.

14. Количественные отношения (логико-математические способности).

15. Установление закономерностей (внимание, память, логическое мышление).

16. " Узоры" (воображение).

17. " Фигуры" (образная память).

18. Красно-черные таблицы (модификация) (переключение внимания).

19. Перепутанные линии (устойчивость внимания).

20. Тест " Сенсорно-моторная координация".

21. " Информационный поиск" (кратковременная память, внимание).

22. Тест " Слухо-речевая память".

23. Тест " Словарь" (исследование индивидуального тезауруса, кругозора).

24. Тест " Умозаключения" (оценка логического мышления).

25. Тест " Компасы" (пространственное воображение).

Тесты ситуационные (принятие решения в ситуации):

1. Метод последовательной динамической оценки (МПДО) (Шведин Б.Я., 1989).

2. Автоматизированная ситуационная игра диагностическая " ТЕСТ", " РИТМ" (7 субтестов: состояние, интеллект, игра) (Носс И.Н., Суслов Е.В., 1990-1992).

3. Методика " Дилемма выбора" (описание 12 житейских ситуаций: выбор стратегии поведения — прогноз стиля принятия решения) (Н. Коган, М. Уоллэлч).

Подкласс: Тесты интеллекта

(уровень развития интеллекта)

Тесты способностей:

1. Шкала измерения интеллекта Векслера (WAIS) (Д. Векслер, 1946).

2. Тест возрастающей трудности (Поляков К., Глушко А., 1986) Оценка уровня интеллекта — модификация Теста Равена.

3. Тест культурно-свободного интеллекта (CFIT) (Р. Кэттелл, 1958).

4. Психологические профили Россолимо (Г.И. Россолимо, 1909).

5. Шкала умственного развития Станфорд-Бине (Л.М. Термен, 1916).

6. Батарея тестов общих способностей (GATB) (оценка интеллекта при ориентации на профессиональный критерий).

7. Школьный тест умственного развития — ШТУР (уровень развития интеллекта у школьников 6-8 кл.) (НИИ Общей и педагогической психологии).

Тесты достижений:

1. Тест «Арифметический счет» (арифметические способности).

2. Тест «Шкалы приборов» (ориентирование в показаниях приборов).

3. Тест «Координаты» (профессиональные способности).

Критериально-ориентировочные тесты:

1. Тесты изучения интеллектуальных способностей (четыре субтеста: " Анализ рельефа местности"; " Анализ эмоционального состояния по мимике лица"; " Анализ газетных политических тестов"; " Овладение порядком и правилами отдачи приказаний" ) (Жильников И.Д., 1990).

2. Тест " Определение способности к обучению" — ОСО) (Носс И.Н., 1990).

3. Технология психосемантического анализа — " Семантический анализ деятельности" (ТПА-САД) (Носс И.Н., 1990).

4. Тест адекватных характеристик объекта — ТАХ (Носс И.Н., 1992).

Класс: Субъективные методики. Измерение на основе информации, данной испытуемым о себе

Подкласс: Анкеты

Анкета кандидата на работу (учебу) и др.

Подкласс: Актуальные и ретроспективные интервью

1. Беседа по фактам биографии.

2. Беседа по уточнению данных тестирования и др.

Подкласс: Биографические методики

Биографическая анкета офицера Конюхова (1986) и др.

Подкласс: Описание собственного поведения

В определенных ситуациях

1. Метод последовательной динамической оценки — МПДО (Шведин Б.Я., 1989).

2. Сочинение на тему «Воспоминание» и др.

Подкласс: Герменевтические методики

1. Физиогномическое наблюдение. Тест. (1995 ).

2. Оценка структуры репрезентативной системы человека (формализация — Носс И.Н., 1995), фрагмент нейро-лингвистического программирования (Р. Бэндлер, Дж. Гриндер).

3. Физиогномическая оценка личности — ФОЛ (формализация И.Н. Носса, 1996).

4. Клиническая беседа.

5. Целенаправленное наблюдение.

Класс: Проективные методики.

Измерение при помощи слабоструктурированного стимульного материала, который дополняет испытуемый,

Тем самым проектируя свою личность

Подкласс: Конститутивные проективные методики

(структурирование, оформление стимулов, придание смысла).

1. Словесный тест ассоциации (стимул-слово: ассоциация-слово) (Ф. Гальтон, 1879).

2. Тест Роршаха (проект личности через " видение" образов в нечетких чернильных пятнах) (Г. Роршах, 1921).

3. Тест аранжировки картины (расположить картинки в определенной последовательности и составить рассказ) (С. Томкинсон, 1957).

4. Тест " Словарь" (исследование индивидуального тезауруса, кругозора).

Подкласс: Конструктивные проективные методики

(создание из оформленных деталей осмысленного целого)

1. Тест Мира (232 моделей предметов, распределенных по 15 категориям: дома, деревья, животные, и т. д. Необходимо выбрать предметы, создать " свой мир" ) (М. Ловенфельд, 1939).

2. Q-классификация (исследование представлений о своем " Я" и об окружающих людях; сортировка карточек с чертами по близости к чертам оцениваемого лица) (В. Стефенсон, 1953).

Подкласс: Катартические проективные методики

(осуществление игровой деятельности в организованных условиях)

Психодрама (создается искусственная жизненная ситуация с участием испытуемого и других актеров: оценка поведения) (Дж. Морено, 1946).

Подкласс: Импрессивные проективные методики

(предпочтение одних стимулов другим)

1. Тест Сонди (выбор предпочтительных и отвергнутых фотографий психически больных людей) (Л. Сонди, 30-е гг. ХХ в.).

2. Тест выбора цвета Люшера (М. Люшер, 1948).

Требования к разработчикам и пользователям тестов

Важнейшим условием успешности психодиагностики является не только готовность испытуемого принять участие в процедуре тестирования, но и то, какую позицию займет в этой системе взаимоотношений исследователь. Конфиденциальная психологическая информация, полученная в результате обследования, не должна быть использована во вред испытуемому, быть объективной, достоверной и исходить из принципов социальной нравственности, закрепленных нормами Международных профессионально-этических стандартов, принятыми в работе психологов, которые включают в себя:

· принцип ответственности (исследователь отвечает за достоверность и конфиденциальность полученной информации);

· принцип компетентности (знание основных практических процедур психодиагностики и правильное их использование);

· принцип этической и юридической правомочности (использование полученной информации в рамках действующего законодательства);

· принцип квалифицированной пропаганды психологии (организация работы с целью создания у испытуемого в результате исследований благоприятного впечатления о психологической диагностике);

· принцип конфиденциальности (неразглашение сведений об испытуемом, составляющих содержание интимных, личностных сторон его жизнедеятельности);

· принцип благополучия испытуемого (в результате тестирования не должно ухудшиться психологическое и соматическое состояние испытуемого, а также его материальное положение; ему не должен быть нанесен вред);

· принцип профессиональной кооперации (возможность обмена психологической информацией в целях повышения качества методической и организационной практики, а также в целях повышения качества психодиагностической оценки испытуемых);

· принцип информирования клиента о целях обследования (испытуемый должен представлять общие задачи психодиагностики. Это не касается ситуаций, когда принцип скрытности заложен в саму методику оценки);

· принцип морально-позитивного эффекта обследования (необходимо добиваться того, чтобы у испытуемого в результате обследования и консультации повышалось настроение и снижалась вероятность проявления негативных особенностей поведения);

· принцип гражданственности и патриотизма (умелое сочетание принципа благополучия испытуемого с обеспечением эффективности функционирования профессиональной или социальной общности, где данный человек живет и работает).

Требования к психодиагностическим методикам

1. Измерительные методики (тесты).

а) однозначная формулировка цели, предмета и области применения методики;

б) процедура проведения должна быть задана в виде однозначного алгоритма, пригодного для передачи пользователю (или компьютеру);

в) процедура обработки должна включать статистически обоснованные методы подсчета и стандартизации тестового балла (по статистическим или критериальным тестовым нормам). Выводы (диагностические суждения) на основе тестового балла должны сопровождаться указанием на вероятностный уровень статистической достоверности этих выводов;

г) тестовые шкалы должны быть проверены на репрезентативность, надежность, валидность в заданной области применения (с возможностью воспроизведения данного стандартизированного исследования);

д) процедуры, основанные на самоотчете, должны быть снабжены средствами контроля достоверности результатов, позволяющих автоматически отсеивать недостоверные протоколы;

е) создание базы тестовых данных с целью периодической коррекции всех стандартов методик.

2. Экспертные методы.

а) однозначная формулировка цели, предмета и области применения методики. Получение надежных данных обеспечивает достаточное число экспертов, обладающих необходимым уровнем квалификации;

б) инструкции должны пройти испытания на однозначность их выполнения экспертами по отношению к некоторому стандартному набору данных (эталону);

в) обработка результатов должна быть стандартизированной, позволяющей однозначно интерпретировать промежуточные данные любому эксперту;

г) создание базы тестовых данных с целью периодической коррекции всех стандартов методик, подготовка и переподготовка пользователей.

Методический инструментарий должен пройти аттестацию в межведомственной комиссии при Обществе психологов РФ.

Требования к пользователям:

а) знание и практическое применение общих теоретико-методологических принципов; владение основами дифференциальной психометрии; анализ психодиагностической литературы; создание банка информационных данных и банка тестовых средств;

б) ответственность за решения, принимаемые на основе тестовых данных, за обеспечение соответствия репрезентативности и прогностической валидности методики;

в) обеспечение необходимого уровня надежности диагноза с применением параллельного тестирования или экспертной оценки;

г) разработка тестовой батареи на основе наибольшей эффективности диагностики — максимум надежности при минимуме затрат;

д) проведение научно-исследовательской работы по совершенствованию методик в заданной области;

е) соблюдение требований стандартизации методов, подсчета баллов, интерпретации данных, прогноза профпригодности;

ж) корректное использование и распространение методических средств психодиагностики;

з) обеспечение конфиденциальности психодиагностической информации, полученной от испытуемого на основе личного доверия;

и) выполнение требований по охране авторских прав разработчиков психодиагностических методик.

Перечисленные требования носят рекомендательный характер и, к великому сожалению, по сей день в России не приобрели еще статуса нормативных правовых актов, которые в настоящее времязаконодательно регулируют психодиагностическую деятельность исследователей, например, в США. Они полностью основываются на нравственно-этических качествах психологов. И поэтому моральная ответственность каждого исследователя, психолога-практика за чистоту психологического эксперимента над живыми людьми очень велика. Многие психологи в организациях и учреждениях влияют на решение кадровых вопросов, к их советам прислушиваются в процессе консультаций или психотерапии. Во всех случаях основной принцип «не навреди» в сознании каждого психолога должен быть возведен в ранг закона практической деятельности, а профессиональные решения длжны пропускаться через его совесть.

Проблемы объективности

Валидность тестов

Валидностью как элементом достоверности психодиагностического измерения свойств субъекта называется мера соответствия тестовых оценок представлениям о сущности свойств или их роли в той или иной деятельности человека. В теории психометрии определяют два основных типа и по крайней мере одиннадцать видов валидности методик (см. рис.).

Рис. Структура валидности

Различают два типа валидности — внешнюю и внутреннюю. Внешняя валидность есть мера возможности распространения результатов тестирования на генеральную совокупность. Внешняя валидизация осуществляется путем расчета репрезентативности экспериментальной выборки при отработке теста и перекрестной валидизации, то есть определения валидности теста на выборке, отличающейся от той, на которой отрабатывался стимульный материал и задания к тесту.

Репрезентативность выборки — это представительность экспериментальной выборки, которая отражает основные свойства генеральной совокупности. Репрезентативность определяется путем сопоставления качественных и количественных характеристик экспериментальной выборки с характеристиками исследуемой популяции с целью определения их однородности.

К качественным характеристикам могут быть отнесены социально-демографические, видовые, интеллектуальные (образовательные), профессиональные и другие характеристики популяции (группы), которые являются предметом исследования или существенно влияют на него.

Количественная характеристика экспериментальной группы — это минимальная ее численность, сохраняющая свойства генеральной совокупности. Формирование репрезентативной выборки по количественному признаку осуществляется при помощи теоремы П.А. Чебышева о вероятности ошибки репрезентативности, которая гласит: " С вероятностью сколь угодно близкой к единице можно утверждать, что при достаточно большом числе независимых наблюдений выборочная средняя будет сколь угодно мало отличаться от генеральной средней" и далее (следствие 1 из теоремы П.Л. Чебышева) «...что с вероятностью, как угодно близкой к единице («практически достоверно»), выборочная доля будет как угодно мало отличаться от генеральной доли, если объем выборки достаточно велик».

В психологической литературе существует несколько теоретических подходов к расчету объема минимально репрезентативной выборки. Часто приводятся таблицы опытно полученных данных. Так, С. Москвин отмечает, что при объемах генеральной совокупности 400, 500, 1000, 2000, 5000, 10000 и более 10 тыс. человек минимальная выборка составляет соответственно 200, 222, 286, 333, 370, 398 и 400 испытуемых (указ. публ., с. 28). Г. Лоза указывает на следующее соотношение генеральной совокупности и объема экспериментальной выборки при проведении социологических исследований 100/16-17 чел., 300/50 чел., 1000/100 чел. и 5000/200 испытуемых. В лекции А. Гончарова минимальная репрезентативная выборка относительно генеральной совокупности соответственно составляет: 500/222, 1000/286, 2000/333, 3000/350, 4000/360, 5000/370, 10 000/385, 100 000/398 и более 100 000 — 400 респондентов.

В ходе анализа психологических данных для расчета объема минимальной репрезентативной выборки используются следующие формулы:

1) формула расчета объема минимальной репрезентативной выборки при нахождении доли элементов генеральной совокупности, обладающих некоторым признаком (номинальная измерительная шкала):

n = [Nt²pq] / [ND² + t² pq];

2) формула расчета объема минимальной репрезентативной выборки при нахождении средней признака (интервальная измерительная шкала):

n = [Nt²d²] / [ND² + t²d²];

3) формула расчета объема минимальной репрезентативной выборки:

n = [(td/D)²] / [1 + 1 / N (td/D)²],

где n — объем минимальной репрезентативной выборки испытуемых;

t — коэффициент кратности ошибки, связанный с вероятностью гарантии ошибки выборочного наблюдения (величина t-критерия Стъюдента);

d — величина стандартного отклонения;

D — размер ошибки доверительного интервала измерения признаков;

N — объем генеральной совокупности;

р — частота проявления данного признака;

q = 1 — р.

Практическое задание. Рассчитать объем минимально-репрезентативной выборки испытуемых, если объем генеральной совокупности 5000 чел., а вероятность проявления исследуемого признака (" угадывания" при помощи теста) — 0.8.

Дано: t — коэффициент кратности ошибки, связанный с вероятностью (Рt), с которой требуется гарантировать результаты выборочного наблюдения; D — размер ошибки доверительного интервала измерения признаков = 0, 05; N — объем генеральной совокупности = 5000; р — частота проявления данного признака = 0.8; q = 1 — р = 0.2.

Определить: n — минимально необходимую численность экспериментальной выборки.

1.98²0.8(1 — 0.8)5 000

n = = 235;

0.05²5 000 + 1.98² 0.8(1 — 0.8)

Ответ: n = 235.

Вывод: При повышении достоверности измерений происходит заметное уменьшение объема минимально репрезентативной выборки. Аналогичное влияние отказывает точность измерений (D).

Перекрестная валидизация производится путем апробации теста на выборке, отличной от экспериментальной. Перекрестная валидизация осуществляется для того, чтобы определить границы применения методики по критерию " характеристика популяции" (для определения уровня развития свойства у детей, подростков, мужчин-женщин, определенной группы специалистов и т. д.). В ходе перекрестной валидизации рассчитываются коэффициенты корреляции между одними и теми же показателями, полученных в результате тестирования разных групп испытуемых. Вывод о возможности применения теста на данной популяции делается при помощи параметрических критериев (t-критерий Стъюдента, n — критерий Уэлша).

Практическое задание. Рассчитать объем экспериментальной выборки по критерию обучаемости испытуемых (применялся тест ОСО).

Дано:

Группа 1 (школьники 9-го класса — 15 лет):

Количество испытуемых n=471

Среднее значение показателя Мх = 3.75

Среднеквадратическое отклонение d = 1.4

Группа 2 (школьники 10-го класса — 16 лет):

Количество испытуемых n=178

Среднее значение показателя Мх = 3.66

Среднеквадратическое отклонение d = 0.8

Группа 3 (курсанты училища связи — 18 лет):

Количество испытуемых n=104

Среднее значение показателя Мх = 3.20

Среднеквадратическое отклонение d = 1.1

Решение: Для расчетов используется формула t-критерия:

М_х1 — М_х2

t_Р=;

Ö [(n₁— 1)d_х1² + (n₂— 1) d_х2² / (n₁+ n₂— 2)] (1/ n₁+1/n₂)

1) t_1-2 = 0.82 н/р < t_т

2) t_2-3 = 5.75 р > t_т

3) t_1-3 = 7.86 р > t_т

4) t_т = 1.98

Ответ: n = 649.

Вывод: в результате расчетов выявлено значимое различие показателей обучаемости между первой и третьей и между второй и третьей исследованными группами, которые не могут считаться однородными и составлять единую совокупность. Только между первой и второй выборками по данному критерию не существует значимых различий (р< 0.05). В целях проверки валидности первую и вторую группы можно объединить в одну экспериментальную выборку и считать единой популяцией в количестве 649 человек.

Уяснив содержание внешней валидности методик, перейдем к рассмотрению аспектов внутренней валидности.

Внутренняя валидность — это мера соответствия тестовых оценок уровню развития измеряемого свойства. Она состоит по крайней мере из пяти элементов:

а) концептуальная (теоретическая) валидность — теоретическое обоснование возможности измерения исследуемого свойства данным психодиагностическим средством;

б) содержательная валидность — степень репрезентативности содержания заданий теста измеряемой области психических свойств;

в) конструктная валидность — степень репрезентативности исследуемого психологического конструкта в результатах теста (" насколько результаты теста рассматриваются в качестве меры исследуемого психологического конструкта — фактора, свойства" );

г) операционная валидность — степень репрезентативности в конкретных экспериментальных операциях реальных операциональных условий психической деятельности;

д) эмпирическая валидность — совокупность характеристик валидности теста, полученная сравнительным статистическим способом оценивания. К этим характеристикам относятся так называемые очевидная и критериальная виды валидности.

Очевидная валидность — это представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого и другого лица, не располагающего специальными сведениями о характере использования и целях методики.

Критериальная валидность — комплекс характеристик, включающий текущую и прогностическую валидности методики и отражающий соответствие диагноза и прогноза определенному кругу критериев развития измеряемого свойства. Критериальная валидность оценивается величиной связи, корреляции показателя теста с " внешним критерием".

Эмпирическая валидность измеряется при помощи коэффициентов валидности.

Текущая [диагностическая (конкурентная)] валидность — мера способности теста дифференцировать испытуемых по изучаемому признаку. Текущая валидность теста определяется исходя из его " трудности" и мер изменчивости измеряемого признака.

Трудностью теста называется отношение количества решенных заданий методик к нерешенным заданиям. Уровень трудности характеризуется коэффициентом трудности (Тт), который вычисляется по формулам А и Б.

А) Тт = [Np / Nн] 100%,

где Np— количество решенных заданий теста; Nн — количество нерешенных заданий теста.

Оптимальная «трудность теста», рассчитанная с помощью формулы А, должна колебаться в пределах 50%, однако, как признают многие психологи, достичь такого положения крайне затруднительно. На практике критериальная «трудность» рассчитывается для всей тестовой батареи и уже ее значение должно колебаться в пределах 50%, а «трудность» входящих в нее тестов — находиться в пределах " умеренного разброса". Видимо, этот " умеренный разброс" находится в пределах d, то есть ± 16%. (Следует также учитывать 5%-ю ошибку вычислений.)

Б) Тт = 13 + 4 d,

где d — стандартное отклонение, которое вычисляется по формуле:

d = Ö (S xi²) / N.

Трудность теста, рассчитанного по формуле (Б), находится в пределах от 1 до 25 (цифры 13 и 4 выбраны экспериментально в целях исключения отрицательных и дробных показателей и удобства расчетов). Средняя трудность теста имеет значение 13.

Практическое задание. Рассчитать трудность тестовой батареи, состоящей из двух субтестов.

Решение:

ТЕСТ 1	ТЕСТ 2
Np = 4 Nн = 5	Np = 2 Nн = 7
Тт = 80%	Тт = 29%
Тбт = (80+29)/2 = 54.5%

К мерам изменчивости измеряемых признаков, как правило, относят характеристики распределения эмпирических данных (нормальность распределения) и характеристики вариации признаков.

Нормальность распределения данных определяет численную характеристику дифференциации испытуемых. Она вычисляется при помощи критерия Хи-квадрат Пирсона, а также с использованием коэффициентов асимметрии и эксцесса распределения переменных.

Ширина полосы разброса данных по шкале измерений от min до max; это характеристика вариации признаков. Простейшими измерителями вариации признаков являются размах вариации R (это разность между наибольшим и наименьшим значениями признаков, то есть R = x_max— x_min) и дискриминативность заданий — субтестов (способность отдельных пунктов (заданий) теста дифференцировать обследуемых относительно " максимального" или " минимального" результата теста). Мера соответствия успешности выполнения одного субтеста всей методике является показателем дискриминативности заданий теста и называется коэффициентом дискриминации (индексом дискриминативности). Индекс дискриминативности теста рассчитывается в процессе разработки тестов и тестовой батареи. Он вычисляется при помощи а) точечно-биссериального коэффициента корреляции (Rpb) (cм. выше) и б) метода контрастных групп в виде разности между долей лиц, правильно решивших задание из " высокопродуктивной" и " низкопродуктивной" групп (D).

D = (N_{n max}/ N_max) — (N_{n min}/ N_min).

Наибольший интерес представляет характер группировки значений признака вокруг их средней. Мерой ее определения являются дисперсия (среднеквадратическое отклонение) и коэффициент вариации (V), который определяется как отношение дисперсии (d_х) к среднему (М_х), выраженное в процентах:

V = (d_х / М_х) 100%.

Между характеристиками распределения и вариативностью переменных имеется связь, которая предопределяет оптимальное сочетание формы распределения с вариативностью. Большая вариативность признаков говорит о том, что распределение ненормально, асимметрично и сильно скошено. Малая вариативность показывает, что тест не дифференцирует испытуемых по измеряемому признаку (испытуемые отвечают или решают задание одинаково). При анализе трудности, нормальности распределения и вариативности показателей тестов необходимо соблюдать МЕРУ, которая вырабатывается в процессе накопления опыта диагностической работы и статистической обработки данных.

Прогностическая валидность является элементом содержания достоверности тестов и определяется как степень точности и обоснованности суждения о диагностируемом психическом свойстве по его результату спустя определенное время после измерения.

Показателем прогностичности теста является степень регрессии тестовых данных к объективным критериям. Регрессия представляет собой функцию f (x₁, x₂ х₃, ... x_n), описывающую зависимость среднего показателя теста, измеряющего данное свойство от заданных фиксированных значений реального проявления этого свойства (внешнего критерия — y). Эта функция может носить линейный и нелинейный характер (линейная регрессия: y = b + ax; параболическая зависимость: y = b + ax + cx²; гиперболическая зависимость: y = b + a/x; показательная функция: y = b + a^x).

В практической психодиагностике для прогноза развития или проявления измеренного свойства чаще применяют линейную или множественную линейную регрессию (y = b + a₁ x₁+a₂ x_2...+a_n x_n). Физический смысл ее заключается в приравнивании зависимой и независимой переменных. Изменение зависимой переменной прямо определяет изменение независимой переменной. Коэффициент а показывает угол наклона оси регрессии, а свободный член b — отстояние начала оси регрессии от начала координат. Коэффициент корреляции показывает уровень прогностичности функции, а R² — уровень объясняемой дисперсии y за счет изменения х. При использовании тестовой батареи прогноз измеряемого свойства осуществляется посредством связанных между собой нескольких зависимых переменных (x₁, x₂ х₃, ... x_n), которые и формируют множественную линейную регрессию. При использовании множественной линейной функции при прогнозе развития измеряемого свойства повышается уровень прогностичности тестирования и его достоверность за счет перекрытия разными методиками различных сторон измеряемого свойства.

Надежность тестов

Надежность — это характеристика психодиагностической методики, отражающая точность психодиагностических измерений, а также устойчивость (стабильность) результатов теста к действию посторонних случайных факторов. Надежность и валидность являются важнейшими характеристиками методики как инструмента психологического исследования.

Наибольшая стабильность результатов наблюдается при применении графических и графологических тестов, показатели которых меняются крайне медленно. Медленно изменяется почерк, практически неизменными остаются качество линий рисунков и их композиция.

Наибольшая динамичность показателей наблюдается у интеллектуальных тестов, которые напрямую зависят от способности человека накапливать и перерабатывать информацию.

На устойчивость (стабильность) показателей теста влияют следующие факторы:

· состояние и настроение обследуемых;

· мотивация испытуемых к тестированию;

· эргономические факторы (освещенность, температура в помещении, вибрация, шумы и пр.);

· характеристика деятельности (монотонность-динамичность, помехи и др.);

· степень обучаемости (или натренированности) испытуемых и др.

Надежность результатов тестирования зависит также от а) изменчивости инструмента психологического измерения и б) факторов стабильности самой процедуры измерения. Таким образом, надежность есть степень согласованности результатов тестирования, получаемых при первом и последующих измерениях.

На практике наиболее широко применяются шесть типов надежности: надежность ретестовая (тест-ретест надежность); надежность параллельных форм; надежность частей теста (надежность как гомогенность тестов); надежность по Кудеру — Ричардсону; надежность интерпретатора («оценщика») и стандартная ошибка измерений.

Определение коэффициента надежности в первых двух случаях вычисляется по формулам расчетов коэффициентов корреляции (в зависимости от шкалы, в которой измерены данные) между первым и последующим измерениями или между параллельными формами теста.

Расчет коэффициента надежности при исследовании гомогенности теста осуществляется путем разбиения теста на равные субтесты и расчета корреляции между этими частями. Для определения общей надежности теста полученные коэффициенты корреляции вводятся в формулу Спирмена — Брауна:

R_xx= 2R / 1 + R,

где R — корреляция «половин» теста.

Если части теста являются отдельными дихотомическими заданиями, например вопросами, на которые может быть два ответа (да или нет), или заданиями с оценкой результата как правильного, так и неправильного, используется формула:

R_xx= (K / K — 1) (1 — å (p_i q_i)/d_x²),

где p_i — доля 1-го варианта ответа на i-й вопрос; q_i — доля 2-го варианта на i-й вопрос.

Надежность частей теста может также рассчитываться по формуле Кудера — Ричардсона:

R_xx= (K / K — 1)(1 — å (d_{x i}²)/d_x²);

где К — количество равных частей теста; d_{x i}²— дисперсия i-й части теста; d_x²— дисперсия целого теста.

При работе с клиническими опросниками, тестами креативности и проективными технологиями надежность методик определяется путем сравнения интерпретаций результатов двумя или более экспертами-психологами. Высокие коэффициенты корреляции между ними показывают надежность тестовой оценки.

Коэффициенты надежности психологических измерений представляют собой величину дисперсии показателей, которая вычисляется путем возведения коэффициента корреляции в квадрат. Интерпретируется он следующим образом. Например, коэффициент корреляции между параллельными формами теста равен 0.75. Коэффициент надежности расчитывается так: 0.75²= 0.56. Это означает, что 56% дисперсии исследуемых тестовых данных зависят от истинной дисперсии признаков (данных параллельного теста), а 44% — от ошибок или случайных переменных.

Разберем гипотетический пример определения надежности двух форм теста в ходе исследования креативности 100 школьников. В результате коэффициент надежности взаимозаменяемых форм с интервалом ретестирования две недели составил 0.7. Была вычислена надежность-гомогенность тестов при помощи формулы Спирмена — Брауна, которая составила 0.8. Надежность интерпретации («оценщика») с привлечением второго специалиста-психолога была равна 0.92. Анализ источников дисперсии ошибок показан в таблице.

12 3 4 5 6 7 8 9 10 Следующая ⇒

Последнее изменение этой страницы: 2017-03-15; Просмотров: 763; Нарушение авторского права страницы