Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Классическая эмпирико-статистическая теория теста



Классическая теория теста лежит в основе современной диффе­ренциальной психометрики.

Описание оснований этой теории содержится во многих учебни­ках, пособиях, практических руководствах, научных монографиях. Количество изданных учебников, излагающих эмпирико-статисти-ческую теорию теста, особенно выросло за последние 5—Улет. Вместе с тем в учебнике, посвященном методам психологического исследо­вания, нельзя хотя бы вкратце не упомянуть основные положения теории психологического тестирования.

Конструирование тестов для измерения психологических свойств и состояний основано на шкале интервалов. Измеряемое психичес­кое свойство считается линейным и одномерным. Предполагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нормального распределения.

В основе тестирования лежит классическая теория погрешности измерений; она полностью заимствована из физики. Считается, что тест такой же измерительный прибор, как вольтметр, термометр или барометр, и результаты, которые он показывает, зависят от величи­ны свойства у испытуемого, а также от самой процедуры измерения («качества» прибора, действий экспериментатора, внешних помех и т.д.). Любое свойство личности имеет «истинный» показатель, а по­казания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» по­грешность, но она сводится к прибавлению (вычитанию) константы к «истинной» величине параметра, что для интервальной шкалы значения не имеет.


Если тест проводить много раз, то среднее будет характеристи­кой «истинной» величины параметра^ Отсюда вводится понятие ре-тестовой надежности: чем теснее коррелируют результаты началь­ного и повторного проведения теста, тем он надежнее. Стандартная погрешность измерения:


где

о^ — стандартное отклонение,

г„ — коэффициент корреляции тест—ретест.

Предполагается, что существует множество заданий, которые мо­гут репрезентировать измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокупности. В идеале можно создать сколько угодно эквивалентных форм теста. Отсюда — определение надежности теста методами параллельных форм и расщепление его на эквивалентные равные части.

Задания теста должны измерять «истинное» значение свойства. Все задания одинаково скоррелированы друг с другом. Корреляция задания с истинным показателем:

а2 — дисперсия для гсего теста.

Для определения надежности методом расщепления использует­ся формула Спирмена— Брауна.

В принципе классическая теория теста касается лишь проблемы надежности. Вся она базируется натом, чю результаты выполнения разных заданий можно суммировать с учетом весовых коэффициен­тов. Так получался «сырой» балл.

У=Хд\ +с,

где

х_ — результат выполнения i-ro задания,

а — весовой коэффициент огвета,

с — произвольная константа.

По поводу того, откуда возникают «ответы», в классической тео­рии не говорится ни слова.

Несмотря на то что проблеме валидности в классической теории теста уделяется много внимания, теоретически она никак не реша­ется. Приоритет отдан надежности, что и выражено в правиле: ва-лидность теста не может быть больше его надежности.

Валидность означает пригодность теста измерять то свойство, для измерения которого он предназначен. Следовательно, чем больше па результат выполнения теста или отдельного задания влияет изме­ряемое свойство и чем меньше — другие переменные (в том числе внешние), тем тест валидной и, добавим, надежнее, поскольку вли­яние помех на деятельность испытуемого, измеряемую валидным тестом, минимально.

Но это противоречит классической теории теста, которая осно­вана не на деятельностном подходе к измерению психических свойств, а на бихевиористской парадигме: стимул — ответ. Если же рассматривать тестирование как активное порождение испытуемым о гвегов на задания, то надежное! ь теста будет функцией, производ­ной от валидности.

Тест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство.

· Тест невалиден (\\ ненадежен), если результаты тестирования определяются влиянием нерелевантных переменных.

Каким же образом определяется валидность? Все многочислен­ные способы доказательства валидности теста называются разными ее видам и.

1. Очевидная валидность. Тест считается валидным, если у испы­туемых складывается впечатление, что он измеряет то, что должен

где

r, — корреляция i-ro задания с истинным показателем t, r — средняя корреляция i-ro задания с другими. Поскольку в реальном монометрическом тесте число заданий ог­раничено (не более 100), то оценка надежности теста всегда прибли­зительна.

Так, определяемая надежность теста связана с однородностью, которая выражается в корреляциях между заданиями. Надежность возрастает с увеличением одномерности теста и числа его заданий, причем довольно быстро. Стандартная надежность 0, 02 соответст­вует тесту дли ной в 10 заданий, а при 30 заданиях она равна 0, 007. Оценка стандартной надежности:

где

or— стандартная погрешность оценивания r,

о — стандартное отклонение корреляций заданий в тесте,

к — число заданий в тесте.

Для оценок надежности используется ряд показателей.

Наиболее известна формула Кронбаха:

где

к — число заданий в тесте,

£ o2 — сумма дисперсий заданий,


измерять.

2. Конкретная валидность, или конвергентная—дивергентная. Тест должен хорошо коррелировать с тестами, измеряющими конкрет­ное свойство либо близкое ему по содержанию, и иметь низкие кор­реляции с тестами, измеряющими заведомо иные свойства.

3. Прогностическая валидность. Тест должен коррелировать с от­даленными по времени внешними критериями: измерение интел­лекта в детстве должно предсказывать будущие профессиональные успехи.

4. Содержательная валидность. Применяется для тестов дости­жений: тест должен охватывать всю область изучаемого поведения.

5. Конструктная валидность. Предполагает:

а) полное описание измеряемой переменной;

б) выдвижение системы гипотез о связях ее с другими перемен­ными;

в) эмпирическое подтверждение (не опровержение) этих гипо­тез.

С теоретической точки зрения единственным способом установ­ления «внутренней» валидности теста и отдельных заданий являет­ся метод факторного анализа (и аналогичные), позволяющий:

а) выявлять латентные свойства и вычислять значение «фактор­ных нагрузок» — коэффициенты детерминации свойством тех или иных поведенческих признаков;

б) определять меру влияния каждого латентного свойства на ре­зультаты тестирования.

К сожалению, в классической теории теста не выявлены причин­ные связи факторных нагрузок и надежности теста.

Дискриминативность задания является еще одним параметром, внутренне присущим тесту. Тест должен хорошо «различать» испы­туемых с разными уровнями выраженности свойства. Считается, что больше 9—10 градаций использовать не стоит.

Тестовые нормы, полученные входе стандартизации, представ­ляют собой систему шкал с характеристиками распределения тесто­вого балла для различных выборок. Они не являются «внутренним» свойством теста, а лишь облегчают его практическое применение.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-05-28; Просмотров: 534; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.019 с.)
Главная | Случайная страница | Обратная связь