Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Тестирование как косвенное измерение



Необходимость тестирования возникает всякий раз, когда объект недоступен для прямого измерения или изучаемое явление не вполне конкретно. Такая ситуация характерна для измерений в области физического воспитания и спорта. Например, практически невозможно точно определить силу, развиваемую отдельной мышечной группой при выполнении упражнения. Поэтому измеряют опорные реакции, межзвенные углы и другие биомеханические показатели и косвенно судят о развиваемой силе. Или требуется оценить уровень развития ловкости – физического качества, для которого не существует какой-либо единицы измерения, представляющего собой, по сути, скрытую способность человека и судить о котором можно только косвенно по его внешнему проявлению (времени удержания равновесия, количеству попаданий в кольцо и т. п.). Этим внешним проявлением и является результат теста. Таким образом, тестирование может быть отнесено к косвенным измерениям.

Говорить о точности результата тестирования как косвенного измерения можно лишь в той мере, в какой соблюдаются метрологические требования к тестам. Виды тестов и требования к ним представлены на рис. 1.

В спортивной практике применяются главным образом двигательные (моторные) тесты, в основе которых лежат двигательные задания. Кроме двигательных тестов, для оценки состояния спортсмена используются функциональные показатели, измеряемые, как правило, в покое (рост, вес, частота сердечных сокращений (ЧСС) и т. п.).

 

 

Рис. 1. Классификация и метрологические требования к тестам

 

Виды двигательных тестов

Двигательные тесты подразделяются в зависимости от содержания, формы и условий выполнения задания (контрольные упражнения, стандартные и максимальные функциональные пробы) и от направленности на измерение одних и тех же или разных свойств моторики человека (гомогенные и гетерогенные тесты).

Контрольные упражнения представляют собой специализированные и стандартизированные двигательные задания, при которых необходимо показать максимальный результат. Чаще всего, это – обычные физические упражнения, применяемые для оценки подготовленности спортсмена: бег на 100, 500, 1000, 3000 м, подтягивание на перекладине, сгибание рук в упоре лежа и т. д. Фиксируется показанный результат.

Стандартные пробы проводятся в виде одинакового для всех задания с дозированной по величине стандартной нагрузкой (работа на велоэргометре с определенной мощностью, бег на тредбане с заданной скоростью и углом подъема, глубокие приседания с определенной частотой и т. п.). Регистрируются физиологические и биомеханические показатели (ЧСС, частота дыхания, концентрация молочной кислоты в крови и т. п.). В связи с тем, что нагрузка в стандартных пробах не максимальна, они могут использоваться для оценки состояния здоровья недостаточно подготовленных или имеющих определенные заболевания людей. Например, проба Руфье–Диксона для оценки приспособляемости к физической нагрузке заключается в выполнении 30 глубоких приседаний за 50 с с регистрацией ЧСС до приседаний, сразу после их выполнения и через минуту отдыха.

Максимальные пробы так же, как контрольные упражнения, направлены на достижение максимального результата, но в них регистрируется не сам результат (время бега, пройденное расстояние и т. п.), а физиологические или биохимические показатели (максимальное потребление кислорода (МПК), порог анаэробного обмена и т. п.).

Гомогенными называются тесты, измеряющее какое-то одно физическое качество или двигательное умение человека. Например, прыжки с места в длину, вверх, тройной прыжок.

Гетерогенными называются тесты, измеряющие разные физические качества и двигательные умения. Например, подтягивание на перекладине, бег на 3000 м, метание набивного мяча, удержание равновесия в определенной позе.

В спортивной практике при педагогическом контроле чаще используется не один, а несколько тестов, имеющих общую конечную цель. Такую группу тестов, в которую могут входить как гомогенные, так и гетерогенные тесты, называют комплексом или батареей тестов.

3. Метрологические требования к тестам

Метрологические требования к тестам определяют их качество. В число этих требований входят стандартность методики тестирования, надежность и информативность тестов.

Стандартность методики тестирования подразумевает одинаковую процедуру и условия тестирования во всех случаях применения теста (одна и та же последовательность действий, инвентарь, измерительные приборы и т. д.).

Надежность (воспроизводимость) теста – это степень совпадения результатов при повторном тестировании одних и тех же людей в одинаковых условиях. Однако полное совпадение результатов практически невозможно из-за случайных изменений состояния испытуемых в процессе тестирования (врабатывания, утомления и т. д.), неконтролируемых изменений внешних условий (температуры, влажности и т. д.), нестабильности характеристик технических средств измерений, изменения состояния экспериментатора и, наконец, несовершенства самого теста.

Составляющими надежности тестов являются их стабильность, согласованность и эквивалентность.

Стабильность теста характеризуется воспроизводимостью результатов тестирования при его повторении через определенное время в одинаковых условиях. Стабильность зависит от вида теста, контингента испытуемых, временнóго интервала. Например, стабильность измерения функциональных показателей (веса, объема легких и т. п.) при небольших временны΄х интервалах выше, чем у тестов на точность движений (бросков в цель). У взрослых тесты более стабильны, чем у детей; у спортсменов – более стабильны, чем у не занимающихся спортом. С увеличением временнóго интервала стабильность снижается.

Согласованность теста означает независимость результатов тестирования от личных качеств лица, проводящего тест (экспериментатора, судьи, эксперта). Лицо, проводящее тест, может только оценивать его результаты, не влияя (например, в гимнастике, боксе, при ручном хронометраже в легкой атлетике) или влияя на них (в случае высокой требовательности экспериментатора, лучшей мотивации). Совпадение результатов свидетельствует о более высокой степени согласованности теста. Особое значение согласованность имеет при измерении качественных показателей (в квалиметрии).

Эквивалентность тестов – это возможность измерения одного и того же физического качества или стороны подготовленности спортсмена с помощью нескольких тестов. Например, силовую выносливость можно оценить по числу подтягиваний на перекладине, отжиманий в упоре лежа, количеству подъемов штанги в положении лежа на спине и т. д. Если результаты оценок совпадают, то это свидетельствует об эквивалентности тестов. Комплекс, составленный из эквивалентных тестов, является гомогенным, а из неэквивалентных – гетерогенным. Однако следует учитывать, что не существует универсальных гомогенных или гетерогенных комплексов. Так, для недостаточно подготовленных людей комплекс, в который входят бег на 100 и 800 м, прыжок в длину с места, подтягивание на перекладине будет гомогенным, а для спортсменов высокой квалификации – гетерогенным.

Степень надежности теста можно установить с помощью дисперсионного анализа и расчета внутриклассового коэффициента корреляции (коэффициента надежности r) между показателями, собранными на аналогичных группах или несколькими экспериментаторами. В большинстве случаев в спорте имеет место представленная в таблице 1 градация надежности тестов.

 

Таблица 1.

Надежность тестов

 

Надежность r
Отличная 0,95 и более
Хорошая 0,90 – 0,94
Средняя 0,80 – 0,89
Приемлемая 0,70 – 0,79
Низкая 0,60 – 0,69

 

Надежность тестов может быть до определенной степени повышена следующими способами:

· более строгой стандартизацией тестирования;

· увеличением числа попыток;

· увеличением числа экспертов;

· увеличением числа эквивалентных тестов;

· лучшей мотивацией испытуемых;

· выбором технических средств, обеспечивающих заданную точность измерений в процессе тестирования.

При определении надежности тестов необходимо учитывать возможность такого явления, как тренд. Тренд – это систематическое повышение или понижение результатов тестирования от попытки к попытке. Причинами тренда являются, с одной стороны, адаптация (привыкание), а, с другой – утомление.

Информативность, или валидность, теста (англ. validity – обоснованность) – это степень точности, с которой он измеряет свойство, для оценки которого используется. Например, такой тест, как кистевая динамометрия, будет явно информативен для оценки специальной силовой подготовленности борцов и неинформативен для оценки этого же качества у бегунов-спринтеров.

Информативность подразделяют на диагностическую и прогностическую, содержательную и эмпирическую.

Диагностическая информативность характеризует тест, который используется для определения состояния спортсмена в момент наблюдения.

Прогностическая информативность характеризует тест, который используется для определения возможных будущих показателей спортсмена. Тест может быть диагностически информативен, а прогностически нет, и наоборот.

Содержательная (логическая) информативность основана на качественном содержательном анализе ситуации. Она определяется посредством логического сопоставления физиологических, биомеханических, психологических и других характеристик теста и факторов, от которых, прежде всего, зависит эффективность основного двигательного действия. Например, необходимо подобрать тест для оценки подготовленности квалифицированных бегунов на 400 м. Известно, что фактором, от которого приблизительно на 70% зависит эффективность бега на 400 м, то есть спортивный результат, является совершенство анаэробного механизма энергообеспечения. Следовательно, наиболее эффективными будут тесты, позволяющие выявить уровень анаэробных возможностей спортсмена: бег на отрезках 200 – 300 м с максимальной скоростью, прыжки с ноги на ногу в максимальном темпе на отрезках 100 – 200 м и т. п.

Логический метод определения информативности тестов является зачастую единственным для тех видов спорта, результаты в которых не могут быть выражены напрямую в метрических единицах (гимнастика, спортивные игры и т. д.).

Эмпирическая информативность (греч. эмпейриа – опыт) основана на количественном сравнении результата теста с эффективностью основного двигательного действия. В качестве критерия эффективности двигательного действия обычно используются:

· результат в соревновательном упражнении;

· какая-либо количественная характеристика наиболее значимых элементов соревновательного упражнения (длительность фазы опоры в беге, силы отталкивания в прыжках, процент точных передач в футболе т. п.);

· результаты тестов, информативность которых для спортсменов данной квалификации была установлена ранее;

· квалификация спортсменов (принадлежность к группе мастеров спорта служит критерием для спортсменов низших разрядов).

Если для сравнения выбран единичный критерий эффективности двигательного действия (например, для лыжников-гонщиков – длина шага при подъеме крутизной 7 град, так как именно она более других связана с результатами на соревнованиях), то для определения информативности теста рассчитывается коэффициент корреляции (коэффициент информативности) между критерием и результатом теста. Наибольшие коэффициенты корреляции будут указывать на высокую информативность тестов.

Если единичный критерий для сравнения результатов теста отсутствует (например, силовую подготовленность студентов можно оценить с помощью таких тестов, как отжимание в упоре на брусьях, подтягивание на перекладине, приседание со штангой, тяга штанги и т. п., но не ясно, какой критерий выбрать для определения их эффективности), то используется так называемый факторный анализ – один из методов математической статистики. Он позволяет, во-первых, сгруппировать тесты, имеющие общую качественную основу, то есть в которых результаты обусловлены одними и теми же факторами (например, силой мышц верхних конечностей), и, во-вторых, определить их удельный вес в этой группе. Тесты с наибольшим факторным весом считаются самыми информативными.

Определяя эмпирическую информативность, следует иметь в виду, что она неодинакова в разных по составу группах и сильно зависит от надежности теста. Тест с низкой надежностью всегда мало информативен. Информативность батареи тестов выше информативности одного теста.

Содержательный и эмпирический анализы информативности взаимосвязаны. Содержательный анализ всегда должен предшествовать эмпирическому. Заведомо неинформативные тесты нет смысла подвергать эмпирическому анализу.

Вопросы для контроля

Что называется тестом, и какие известны виды двигательных тестов?

1. Каковы метрологические требования к тестам?

2. Что называется надежностью теста, и каковы ее составляющие?

3. Как установить степень надежности теста, и каковы пути ее повышения?

4. Что понимается под информативностью теста, и на какие виды она подразделяется?

5. Как определяется содержательная информативность теста?

6. Как определяется эмпирическая информативность теста?

Контрольная работа

Цель: осуществить контроль знаний, умений учащихся по теме Основы теории тестов.

Выбрать правильный ответ.

Образец ответа 1.2,2.4 и т.д. (первая цифра- номер вопроса, вторая- номер ответа)

Ключ 1.5,2.1, 3.6, 4.9, 5.7, 6.8, 7.2, 8.3, 9.4,

 

Вопрос Ответ
1. измерение или испытание в спортивной практике, проводимое с целью определения состояния или способностей человека 1. балл 
2. количествен­ный показатель выраженности измеряемого свойства у данно­го испытуемого, полученный при помощи данного теста 2. информативность
3. Тесты, результаты которых зависят от двух и более факто­ров, называются 3. надежность
4. Тесты, результаты которых зависят от одного фактора называются 4. аутентичными
5. группу тестов принято называть 5. тест
6. соблюдение комплекса мер, правил и требований к тесту - 6. гетерогенными
7. свойство теста отражать то качество системы (например, спортсмена), для которого он используется это - 7. батарея тестов
8. степень совпадения результатов при повторном тестировании одних и тех же людей в одинаковых условиях это 8. стандартизованность  
9. Тесты, удовлетворяющие требованиям надежности и информативности, называют 9. гомогенными

 


 

 

Практическое занятие №10

Тема: ОЦЕНКА СПОРТИВНЫХ РЕЗУЛЬТАТОВ И ТЕСТОВ

Цель: научиться правильно выбирать шкалы оценок для оценивания результатов спортсменов.

Вопросы для рассмотрения:

1. Процедура оценивания.

2. Виды и шкалы оценок.

 

Оценка – это унифицированная мера успеха в каком-либо задании, в частности – в тесте.

Оцениванием называется процесс определения (расчета) оценок.

Необходимость оценивания вызвана, во-первых, тем, что показанные в ходе соревнований или при тестировании результаты выражаются в разных единицах измерения (время – в с; сила – в кГ или Н; ЧСС – в уд/мин; МПК – в мл/кг∙мин и т. д.); во вторых, сами по себе результаты не указывают, какова подготовленность или состояние спортсмена (для одних результат в прыжке вверх с места 50 см может рассматриваться как очень хороший, для других – плохой). Чтобы обеспечить единый подход к определению успеха в разных испытаниях, результаты представляются в виде оценок.


Процедура оценивания

В общем виде процедура оценивания спортивных результатов и тестов протекает в несколько этапов. Последовательность действий при оценивании представлена на рис. 1. Собственно к оцениванию относятся последние два этапа. В некоторых случаях отдельные этапы сливаются.

 

 

Рис. 1. Последовательность действий при оценивании спортивных результатов и тестов

 

При оценке спортивных результатов первый этап (измерение) может осуществляться тремя способами:

1. Измерением физических величин (времени бега, дальности прыжка и других величин, то есть по метрологической связи с внешней средой). Такие измерения производятся с помощью технических средств и являются в принципе объективными.

2. По свершившемуся факту (забитому голу, засчитанному удару в боксе, уколу в фехтовании и т. д.). Имеющий место объективный факт фиксируется судьей субъективно. Например, в тяжелой атлетике поднятый вес засчитывается судьями только при полном разгибании рук и соблюдении других условий.

3. Посредством экспертной оценки с использованием методов квалиметрии (в технико-эстетических видах спорта). Баллы за выступление выставляются судьями субъективно.

В процессе оценивания имеют место различные виды оценок, специальные шкалы и нормы, соответствующие требованиям пригодности (рис. 2).

 

Рис. 2. Основные элементы системы оценки спортивных результатов и тестов

Оценки спортивных результатов и тестов относятся к квалификационным оценкам. Кроме них существуют учебные оценки, выставляемые ученикам в ходе учебного процесса.

Виды и шкалы оценок

Виды оценок подразделяются в зависимости от способа их выражения. Это могут быть качественные характеристики («отлично – хорошо – удовлетворительно – плохо» или «зачет – незачет»), отметки (от «единицы» до «пятерки»), очки (в легкоатлетическом десятиборье, современном пятиборье, при неофициальном подсчете очков на Олимпийских играх), баллы (при тестировании физической подготовленности, по результатам выступления в акробатике, спортивных танцах и т. д.), спортивные разряды и звания (присваиваются на основе Единой всероссийской спортивной классификации).

Шкалой оценок называется закон преобразования спортивных результатов и результатов тестов в очки или баллы. Не следует путать шкалы оценок со шкалами измерений (лекция 2). Шкала оценок может быть задана в виде формулы, таблицы или графика. В спорте и физическом воспитании используется четыре типа шкал: пропорциональная, прогрессирующая, регрессирующая, сигмовидная (S-образная) (рис. 3).

 

 

Рис. 3. Типы шкал оценок

Пропорциональная шкала характеризуется тем, что равные приросты результатов поощряются равными приростами в баллах. Эта шкала используется при подсчете очков в современном пятиборье, конькобежном спорте, биатлоне и других видах спорта. Пропорциональная шкала лежит в основе так называемой стандартной шкалы, масштабом в которой служит стандартное (среднеквадратическое) отклонение.

Прогрессирующая шкала отличается тем, что чем выше спортивный результат, тем большей прибавкой очков оценивается его улучшение. Разрядные нормативы во многих видах спорта (беговых и прыжковых дисциплинах легкой атлетики, плавании, тяжелой атлетике и др.) разработаны на основе прогрессирующей шкалы.

Регрессирующая шкала предполагает, что чем выше абсолютный прирост результата, тем меньше прибавка в оценке. Шкала такого типа предназначена, в основном, для стимулирования отстающих видов в отдельных многоборьях.

Сигмовидная шкала характеризуется тем, что выше всего оцениваются приросты результатов в средней зоне, а улучшение очень низких или очень высоких результатов поощряется незначительно. В спорте такая шкала не используется, но находит применение при оценке физической подготовленности (например, так выглядит шкала стандартов физической подготовленности населения США).

В практике оценивания спортивных достижений существуют и другие шкалы. В частности, это – перцентильная шкала, относящаяся к сигмовидным шкалам, и шкала выбранных точек.

Перцентильная шкала построена таким образом, что каждый спортсмен из группы получает за свой результат столько очков, сколько процентов участников он опередил. Интервал этой шкалы (1% всех оцениваемых) называется перцентилем. Перцентильная шкала наиболее пригодна для оценки результатов больших групп спортсменов.

Шкала выбранных точек называется так, потому что в качестве одной точки в ней берется какой-нибудь высокий результат (например, мировой рекорд), приравненный, скажем, к 1000 очкам. В качестве другой точки берется среднее достижение группы слабо подготовленных лиц, приравненное, скажем, к 100 очкам. Эти две точки однозначно определяют прямую линию.

При выборе для оценки спортивных результатов и тестов тех или иных шкал и их масштаба следует руководствоваться следующими соображениями:

1. Результаты, соответствующие одинаковым разрядам в разных видах спорта, должны достигаться примерно за равное время.

2. Одинаковые квалификационные нормы в разных видах спорта должны выполняться при равных объемах нагрузок.

3. Соотношение между количеством спортсменов, выполнивших разрядные нормы в разных видах спорта, должно быть равным.

Если спортсмены проходят испытания по комплексу (батарее) тестов, то итоговая оценка по всему комплексу выводится двумя способами:

1. Суммируются очки, полученные по отдельным тестам, входящим в комплекс.

2. Очки по отдельным тестам сначала умножаются на коэффициенты («веса»), различные для каждого теста, а уже потом складываются. Такая оценка называется взвешенной. Для более значимых тестов «веса» делаются высокими.

Часто результаты комплексного тестирования представляют в графической форме – в виде «профиля» физической подготовленности или физического развития спортсмена. Линии на графиках наглядно отражают сильные и слабые стороны подготовленности спортсмена.

Вопросы для контроля

 

1. Какие этапы включает в себя процедура оценивания спортивных результатов и тестов?

2. Какие существуют виды оценок?

3. Какие существуют шкалы оценок, и в каких случаях они используются?

4. Как производится итоговая оценка при комплексном тестировании?


 

Практическое занятие №11

Тема: НОРМЫ ОЦЕНОК

Цель: рассмотреть понятие нормы как основы квалификации.

Вопросы для рассмотрения:

1. Нормы — основы сравнения результатов.

2. Пригодность норм.


Поделиться:



Последнее изменение этой страницы: 2019-03-21; Просмотров: 248; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.069 с.)
Главная | Случайная страница | Обратная связь