Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Число пропусков занятий в первом и втором семестрах
В данном случае одним из тестов, который можно использовать для поиска ответа на поставленный вопрос, является тест знаков. Из всех непараметрических методов он один из наиболее простых. Основное условие его применения — наличие двух связанных выборок, образованных по принципу «до и после» и содержащих результаты, выраженные в шкале не ниже порядковой. Отличительная особенность теста знаков в том, что для его применения достаточно знать всего лишь то, в какую сторону (увеличения или уменьшения изменились (сдвинулись) результаты второго измерения по сравнению с первым. В том случае, если второй результат больше первого, обозначим его «+» (положительный сдвиг). Если второй результат меньше первого, обозначим его «—» (отрицательный сдвиг). Если результат не изменился, обозначим его «О» (нулевой сдвиг). Затем подсчитывается количество положительных, отрицательных и нулевых сдвигов. В дальнейшем нулевые сдвиги игнорируются, поскольку они является признаком отсутствия изменений. Сравнение количества положительных и отрицательных сдвигов позволяет выделить типичное направление сдвига, сдвигов со знаком « + » больше, чем со знаком «—», типичное направление сдвига положительное (в выборке «после» результаты сдвинулись в сторону увеличения по сравнению с выборкой «до»). Соответственно, если сдвигов со знаком «—» больше, чем со знаком « + », типичное направление сдвига отрицательное (в выборке «после» результаты сдвинулись в сторону уменьшения по сравнению с выборкой «до»). Сдвиги в сторону, противоположную типичному направлению сдвига, называются нетипичными. Чем меньше число нетипичных и нулевых сдвигов, тем более существенны различия «до и после» между выборками. Существуют специальные статистические таблицы для теста знаков, которые для выбранного уровня значимости α показывают, при каком числе нетипичных сдвигов различия между первой и второй выборками можно считать неслучайными. Итак, выбираем уровень значимости α =0, 05 и сформулируем нулевую и альтернативную гипотезы. Н0: Различия между выборками носят случайный характер: ситуация с опозданиями во втором семестре не отличается от ситуации с опозданиями в первом семестре. Альтернативная гипотеза формулируется либо в общем виде, либо в зависимости от типичного направления сдвига: Н1 a: Различия между выборками носят неслучайный характер: ситуация с опозданиями во втором семестре отличается от ситуации с опозданиями в первом семестре (двусторонняя критическая область). Н1 b: Различия между выборками носят неслучайный характер: опозданий во втором семестре стало больше, чем в первом (односторонняя критическая область, типичное направление сдвига положительное). Н1с: Различия между выборками носят неслучайный характер: опозданий во втором семестре стало меньше, чем в первом (односторонняя критическая область, типичное направление сдвига отрицательное). На основе таблицы 4.3 создадим таблицу 4.4, дополнив ее двумя новыми столбцами. 1. Для каждой пары значений «до и после» определим и запишем в таблицу направление сдвига результатов второго измерения («после») по сравнению с первым («до»): · число пропусков во втором семестре («после») стало меньше числа пропусков в первом семестре («до»): А > В; · число пропусков во втором семестре («после») стало больше числа пропусков в первом семестре («до»): А < В; · число пропусков во втором семестре («после») равно числу пропусков в первом семестре («до»): А =В. 2. Определим и запишем в таблицу знак сдвига (знак определяется вычитанием из результата «после» результата «до»). Таблица 4.4 Расчетная таблица для теста знаков
Подсчитаем количество отрицательных, положительных и нулевых сдвигов: · число отрицательных сдвигов: 12; · число положительных сдвигов: 4; · число нулевых сдвигов: 4.
Исключаем из дальнейшего рассмотрения нулевые сдвиги (выборка уменьшится с 20 до 16 значений). Сравниваем число отрицательных и положительных сдвигов и определяем типичное направление сдвига. Поскольку отрицательных сдвигов 12, а положительных 4, типичное направление сдвига отрицательное (количество пропусков занятий во втором семестре сдвинулось в сторону уменьшения). Очевидно, что число типичных сдвигов равно 12, число нетипичных сдвигов равно 4. В качестве альтернативной используем гипотезу Н1с: Различия между выборками носят неслучайный характер: опозданий во втором семестре меньше, чем в первом (односторонняя критическая область, типичное направление сдвига отрицательное). Если вернуться к нулевой гипотезе, то в ней фактически говорится о том, что с одинаковой вероятностью результаты «после» могут как возрасти, так и уменьшиться по сравнению с результатами «до». Для проверки этого утверждения необходимо сравнить эмпирическое распределение результатов «после» (сколько из них возросло, а сколько уменьшилось) с теоретическим распределением. В данном случае мы вновь вынуждены использовать биномиальный тест и формулу Бернулли (параграф 3.1). Если считать, что результаты «после» распределены случайным образом, то существует вполне определенная вероятность того, что интересующее нас событие наступит не более 4 раз из 16 (число нетипичных сдвигов из общего числа сдвигов). Эта вероятность рассчитывается по формуле Бернулли или находится по таблице 3 (Приложение 2). Находим в таблице для N = 16 (размер выборки без нулевых сдвигов) и х=4 (число нетипичных сдвигов) значение вероятности р =0, 038. Поскольку это значение меньше выбранного нами уровня значимости α =0, 05, нулевая гипотеза отвергается и принимается альтернативная. Опозданий во втором семестре стало меньше, чем было в первом. К сожалению, таблица 3 ограничена значением N=25. В случае больших выборок приходится прибегать к вычислению z (см. ниже) и использовать таблицу для z-распределения.
ВКЛЮЧАЕМ КОМПЬЮТЕР... В программе SPSS на основе числа позитивных (np) и негативных (nn) сдвигов, а также в зависимости от величины (np + nn) используются следующие алгоритмы вычислений [SPSS Statistical Algorithms, 1986]: 1. Если (np + nn) ≤ 25, то по формуле Бернулли рассчитывается вероятность того, что в (np + nn) случаях, в каждом из которых вероятность появления события равна р=0, 5, событие наступит не более r раз, где r= min (np, nn): 2. Если (np + nn) > 25, вычисляется значение z: В рассмотренном выше примере np =4, nn =12, (np + nn)= 16, r= min (np, nn)=4. Поскольку (np + nn) ≤ 25, используем формулу Бернулли: Данное значение вероятности, разумеется, совпадает с результатом, полученным в рассмотренном выше примере за счет использования таблицы 3 для биномиального распределения. Создадим переменные «Первый семестр» (term1) и «Второй семестр» (term2), которые будут содержать сведения о числе пропусков занятий в первом и втором семестре. Дальнейшая последовательность действий, включая получаемый результат показана на рис. 4.4—4.6.
Рис. 4.4. Выбор требуемой статистической процедуры
Рис. 4.5. Тест знаков: необходимые действия и настройки Рис. 4.6. Тест знаков: результат
|
Последнее изменение этой страницы: 2019-05-18; Просмотров: 72; Нарушение авторского права страницы