Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
IV.1.2.3. Оценка достоверности коэффициентов взаимосвязи
Полученные в результате вычисления те или иные коэффициенты корреляции являются выборочными оценками соответствующих показателей генеральной совокупности. Так как показатели формы и тесноты связи в генеральной совокупности бывают неизвестны, необходимо по отношению к ним применить статистическую проверку (т.е. определить: отличается ли данный коэффициент статистически существенно от нуля? ). Так, в примере 5 выборочный коэффициент равен 0, 9 (число испытуемых равно семи). Можно ли с убежденностью говорить о существовании взаимосвязи, или же в действительности корреляция отсутствует, а полученное значение коэффициента обусловлено случайностями выборки? Чему мог бы равняться r, если бы было проведено исследование не на семи, а на 50 школьниках? Для ответа на эти вопросы необходимо произвести проверку с помощью специальных формул, но наиболее удобно для этой цели использование таблицы, представленной в приложении 12. По таблице, в которой приведены критические значения r для различных чисел парных наблюдений (n) и двух уровней значимости (р=0, 05 и р=0, 01), находим критическое значение для n=7. Если критическое значение меньше, чем рассчитанный коэффициент корреляции, то последний считается достоверным. Сравнивая полученные в нашем примере 5 выборочное значение коэффициента корреляции (0, 9) с табличным (критическим) (0, 75) для n=7 и уровня значимости р=0, 05, видим, что r статистически существенно отличается от нуля. При более точном (высоком) уровне значимости (р=0, 01) такой уверенности нет. Если бы в исследовании принимало участие 50 испытуемых, то критическое значение было бы значительно меньше (0, 28 для р=0, 05 и 0, 36 для р=0, 01), и даже полученный гораздо меньший выборочный коэффициент, чем 0, 9, мог свидетельствовать о проявлении статистической связи между двумя показателями. Это говорит о том, что чем больше испытуемых Вы обследуете, тем точнее и достовернее, при прочих равных условиях, будут Ваши результаты. Так как критические значения коэффициентов корреляции рангов (Спирмена) и линейной корреляции (Пирсона) несколько отличаются друг от друга, то в приложении 12 они представлены в разных колонках.
IV.1.2.4. Вычисление частного и множественного Данные коэффициенты корреляции используются очень редко не только в студенческих, но и в диссертационных работах. Причем совершенно зря, поскольку их расчет несложен, а информации к размышлению и пищи для исследовательского ума они дают предостаточно. Кроме того, не следует сбрасывать со счетов и эффект новизны, привносимый в обработку материалов исследований, который всегда должным образом оценивается на общем фоне других работ. Очень часто взаимосвязь между двумя признаками искажается вследствие того, что оба признака подвержены влиянию других различных факторов. Поэтому на практике часто для получения более точных взаимосвязей между двумя переменными исключают (элиминируют) влияние на них третьей переменной. Это можно сделать с помощью частного коэффициента корреляции, вычисление которого проводится по формуле: , (13) Частные коэффициенты корреляции имеют тот же смысл и обладают теми же свойствами, что и обыкновенный парный коэффициент корреляции. Пример 7. У группы спортсменов измерили результат в прыжках в длину (Х), массу тела (Y) и силу мышц нижних конечностей (Z). Коэффициенты линейной корреляции оказались равны rxy=0, 78; rxz=0, 89; ryz=0, 95. Представим, что исследователя интересует «чистая» корреляция между результатом в прыжках в длину и массой тела, исключая влияние на эту взаимосвязь силы мышц нижних конечностей испытуемых. Иными словами, он хочет знать, какова была бы зависимость между спортивным результатом и массой тела, если бы сила мышц нижних конечностей всех прыгунов была бы одинакова? Подставляем рассчитанные коэффициенты в формулу (13) и вычисляем частный коэффициент корреляции: . Полученный отрицательный частный коэффициент корреляции свидетельствует о том, что при прочих равных условиях (одинаковой силе мышц нижних конечностей), спортсмены с большим массой тела прыгали бы меньше. Этот пример показывает, что во многих случаях недостаточно использовать только простую корреляцию между двумя переменными. Вычисление частного коэффициента корреляции может помочь избежать ошибочных выводов, а также «украсит» работу. Для исследования тесноты взаимосвязи между одним показателем и некоторым набором других показателей используется множественный коэффициент корреляции, который обозначается буквой R, может принимать значения между нулем и единицей и всегда имеет положительный знак. При отсутствии связи между признаками R=0. При оценке взаимовлияния показателей Y и Z на показатель Х значение множественного коэффициента корреляции вычисляют по формуле: , (14)
где rxy, rxz, ryz – парные коэффициенты между признаками. Используя коэффициенты корреляции из примера 7 и подставляя их в формулу (14), вычислим множественный коэффициент корреляции:
Полученный коэффициент показывает, что совместное влияние массы тела и силы мышц нижних конечностей (yz) на результат в прыжках в длину (х) довольно значимо. Таким образом, рассчитав линейные коэффициенты корреляции, следует пойти чуть дальше и на их основе вычислить частный и множественный коэффициенты корреляции. Это может дополнить результаты Ваших исследований не только ценными выводами, но и покажет Ваше умение оперировать нетрадиционными методами математической статистики. IV.1.3. Степень достоверности статистических показателей В практике исследовательской работы решение той или иной задачи не обходится без сравнения. Сравнивать приходится данные контрольной и экспериментальной групп, показатели спортсменов до и после серии тренировок, различные меняющиеся с возрастом характеристики физической подготовленности и развития у школьников за несколько лет и т.д. Во всех этих и подобных случаях наличие существенного различия между параметрами совокупностей укажет на принципиальное отличие в группах по рассматриваемому признаку. Чтобы решать вопрос об истинной значимости различий, наблюдаемых между выборочными средними, исходят из статистических гипотез – предположений или допущений о неизвестных генеральных параметрах, которые могут быть проверены на основании выборочных показателей. Поскольку в науке результаты исследований и вытекающие из них выводы никогда не принимаются со 100 % уверенностью, т.е. всегда имеется некоторый риск в интерпретации результатов, который связан с существованием каких-то случайных причин. Экспериментатор может выбрать уровень значимости (обозначается р или a) – значение вероятности, при котором различия, наблюдаемые между выборочными показателями, можно считать несущественными, случайными. Самым распространенными уровнями значимости в спортивных исследованиях являются 0, 05 и 0, 01, каждому из которых соответствует определенное значение надежности или доверительной вероятности (Р), а именно 0, 95 (95 %) и 0, 99 (99 %). Уровень значимости 0, 05 указывает на то, что возможна в силу случайности ошибка в 5 % случаев, т.е. не чаще, чем 5 раз в 100 наблюдениях. Если нужна большая доказательность (достоверность) результатов, то уровень значимости должен быть повышен до 0, 01. Чем цифра меньше, тем уровень значимости, а следовательно, и достоверность результатов (степень доверия) выше. При уровне значимости 0, 01 вывод не обоснован только в одном случае из 100. Оценку статистической достоверности производят при помощи специальных методов – критериев значимости. Следует знать, что критерии бывают параметрические (Стьюдента, Фишера) и непараметрические (Уайта, Вилкоксона, Ван дер Вардена и др.). Первые применимы («работают») лишь в тех случаях, когда генеральная совокупность, из которой взята выборка, распределяется нормально, а параметры сравниваемых групп равны между собой (s1=s2). В действительности же эти условия выполняются не всегда, и в таких случаях корректнее применять непараметрические критерии, где оценка на достоверность связана с ранжированием исходных данных. В студенческих работах (да и не только в них! ) на это часто закрывают глаза и используют во всех случаях только t-критерий Стьюдента. Кроме этого следует учитывать, что часто пытаются одной и той же формулой найти достоверность различий как между двумя независимыми группами (контрольной и экспериментальной), так и при определении изменений, наступающих с течением времени, когда сравнивают данные, зарегистрированные на той же группе «до» и «после», не учитывая, что выборки в этом случае коррелированы. Чтобы не делать глупых ошибок и обесцененных выводов, попробуем, не спеша, разобраться в тонкостях проверки статистических гипотез. IV.1.3.1. Оценка достоверности различий средних В большинстве спортивных исследований могут решаться задачи на выявление эффективности той или иной методики обучения и тренировки с применением определенных средств, приемов и способов организации занятий. Решение подобных задач осуществляется путем проведения сравнительного эксперимента с выделением различных групп, результаты которых в теории статистики принято называть независимыми (несвязанными). В практике спорта в таких случаях наиболее «востребованным» является t-критерий Стьюдента (псевдоним английского математика В.Госсета), определяемый по формуле: , (15) где - разность между средними арифметическими сравниваемых групп, рассматриваемая без учета знака (т.е. всегда со знаком плюс); , - ошибки средних (репрезентативности) сравниваемых групп. Определенный по формуле (15) критерий подлежит сравнению с некоторым критическим (стандартным) значением (tкр), который находится по специальной таблице Стьюдента для заданного уровня значимости p и числа степеней свободы (k). Если в результате сравнения t, найденного по формуле (15), и tкр окажется, что t³ tкр (больше или равно tкр), то разность между сравниваемыми выборочными показателями называется достоверной. Если t£ tкр, то разность между выборочными показателями называется недостоверной, наблюдаемые различия можно рассматривать как случайные. В этом случае можно предположить не только несущественность различия между совокупностями, но и неправильный подбор выборки, в частности, недостаточную ее численность. Пример 8. Измерялись результаты в прыжках в высоту с места у бегунов на короткие дистанции (n1=22) и бегунов на средние дистанции (n2=20). Средний результат и ошибка средней равны: =63, 3 (см) =0, 8 (см) =60, 4 (см) =0, 9 (см) Необходимо определить достоверность оценки разности средних значений результатов прыжков в высоту бегунов на короткие и средние дистанции. Решение: 1. Определим числитель формулы (15): =63, 3-60, 4=2, 9. 2. Вычислим сумму квадратов ошибок средних двух групп: =0, 82+0, 92=1, 45. 3. Используя формулу (15), рассчитаем t = . 4. Обратившись к приложению 13 и рассчитав число степеней свободы Таким образом, поскольку t³ tкр, то различия по результатам прыжков в высоту с места между этими группами бегунов статистически достоверны и не случайны. Подобный вывод можно записать более наукообразно: «Так как t³ tкр, то нулевая гипотеза (предположение о том, что между генеральными параметрами сравниваемых групп разница равна нулю и различия, наблюдаемые между выборочными показателями, носят случайный характер) опровергается на 5 % уровне значимости (р< 0, 05)». Если мы хотим взять более высокий уровень значимости, то по таблице приложения 13 найдем, что в нашем примере при р=0, 01 tкр =2, 7 и в этом случае нулевая гипотеза сохраняется, отвергнуть ее на 1 % уровне значимости нет оснований (р> 0, 01). IV.1.3.2. Оценка достоверности различий средних В исследованиях часто на одних и тех же спортсменах проводятся измерения через некоторое время (до и после тренировки, этапа подготовки, определенного воздействия экспериментальной методики и т.п.), а также в различных условиях (на уровне моря или в условиях высокогорья и т.д.). При этом стараются определить, произошли ли изменения в состоянии спортсменов. В данной ситуации нельзя применять методы, описанные в разделе IV.1.3.1., и в этом случае смысл проверки достоверности заключается в следующем. 1. Наблюдаемое значение критерия (t) рассчитывают по формуле: , (16) где - есть среднее значение разности (d) сравниваемых пар 2. Критическое значение (tкр) находится по таблице (см. приложение 13) для определенного уровня значимости и числа степеней свободы (k = n -1). В данном случае число степеней свободы на единицу времени меньше числа сравниваемых пар. Пример 9. Измерялся результат прыжка в высоту с места до нагрузки (пробегание марафонской дистанции) (Х1, см) и после нагрузки (Х2, см) у пяти спортсменов. Определить достоверность влияния нагрузки на результат в прыжке.
Таблица 6 Расчет достоверности различий средних связанных выборок
1. Определяем разность соответствующих пар (колонка 3) и их сумму: Sd=15+5+10+10+15=55 2. Определяем среднее значение разности пар ( ) и отклонение разности от средней (колонка 4).
3. Вычисляем квадраты отклонений и их сумму (колонка 5):
4. Вычисляем стандартное отклонение s по формуле (3): 5. Находим ошибку средней md, вычисляемой по формуле (6): 6. Определяем t по формуле (16): 7. Находим tкр по приложению 13 и сравниваем его с t. tкр= 4, 60 (при p=0, 01и k=5-1=4) t> tкр (5, 26> 4, 60). Это означает, что нагрузка влияет на результат в прыжках в высоту с места, т.е. с вероятностью 99 % можно утверждать, что разница между средними величинами статистически существенна и не случайна. Что касается технологии применения непараметрических критериев, то желающие воспользоваться последними, и тем самым «сразить» государственную комиссию, могут обратиться к специальной литературе. А для изучения явлений, не имеющих количественного выражения, довольно объективным и удобным в расчетах является метод экспертных оценок.
Популярное:
|
Последнее изменение этой страницы: 2016-03-15; Просмотров: 4432; Нарушение авторского права страницы