Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Оценивание значимости качественных признаков при исследовании пространственных выборок
2.1.1. Задание* Исследовать зависимость между результатами письменного вступительного экзамена и экзамена в первую сессию по таблице 24, где Y – число задач, решенных на экзамене в сессию (из 7 задач задания), Х – число задач, решенных на вступительном экзамене (из 10 задач). Ответить на вопросы: влияют ли результаты вступительных экзаменов на успеваемость в сессию? Влияет ли пол студента на успеваемость в сессию? Одинакова ли зависимость Y(Х) для лиц мужского и женского пола? Таблица 24. Число задач, решенных на экзаменах
Выполнение Найдем уравнение парной линейной регрессии Y=mX+b по всем наблюдениям таблицы 24 (т. е. не учитывая качественный признак «Пол студента»). Результаты функции ЛИНЕЙН, необходимые для дальнейших расчетов, приведены в таблице 25. Значение статистики Фишера F=11, 29 больше порога f(0, 05, 1, 10)=4, 96. Таким образом, неравенство (35) справедливо, и уравнение Y=0, 815X-1, 44 значимо. Следовательно, успеваемость в сессию Y существенно зависит от результатов вступительных экзаменов X. Исследуем влияние пола студента на успеваемость в сессию. Для этого введем фиктивную переменную Z (равную 1 для мужчин и 0 для женщин) и оценим параметры уравнения регрессии Y=mX+m1Z+b. Результаты функции ЛИНЕЙН для этого уравнения приведены в таблице 25. Таблица 25. Характеристики уравнений
Значение статистики Фишера F=5, 48 больше порога f(0, 05, 2, 9)=4, 26. Таким образом, уравнение Y=0, 743X-0, 466Z -1, 17 значимо, и успеваемость в сессию в основном определяется двумя факторами: результатами вступительных экзаменов и полом студента. Далее надо проверить значимость каждого из этих факторов. Рассчитаем статистики Стьюдента по формуле (36а): Сравнивая значения этих статистик с порогом t(0, 05, 9)=2, 26, получаем, что фактор X значим, а фактор Z незначим (см. формулу (37)). Таким образом, успеваемость студента в сессию в основном зависит от результатов вступительных экзаменов (и слабо зависит от пола студента). Незначимость переменной Z в рассматриваемом уравнении также означает, что пол студента не оказывает значимого влияния на величину сдвига b в уравнении Y=mX+b. Для оценки влияния пола и на коэффициент, и на сдвиг уравнения Y=mX+b надо проанализировать значимость параметров m1 и b1 в уравнении (45). В таблицу 24 для работы с уравнением (45) добавим столбец значений ZX. Результаты функции ЛИНЕЙН приведены в таблице 25. Значение статистики Фишера F=3, 31 меньше порога f(0, 05, 3, 8)=4, 07, что говорит о незначимости уравнения. Также оказываются незначимыми все коэффициенты уравнения (это предлагается проверить самостоятельно). По-видимому, двенадцати наблюдений недостаточно для оценивания четырех параметров уравнения. Поэтому для оценки влияния пола на коэффициент уравнения Y=mX+b проверим значимость коэффициента m1 в уравнении Y=mX+m1(ZX)+b; характеристики уравнения представлены в таблице 25. Применяя критерии Фишера и Стьюдента так же, как и для предыдущих уравнений, получим, что уравнение значимо, а коэффициент m1 незначим. Отсюда можно сделать вывод, что признак «Пол студента» не влияет на коэффициент уравнения регрессии Y=mX+b. Так как признак «Пол студента» не влияет ни на коэффициент, ни на сдвиг уравнения линейной регрессии Y=mX+b, то зависимость Y(Х) одинакова для лиц мужского и женского пола. Этот же вывод можно получить по критерию Г. Чоу (см. §1.3). Если гипотеза H0 верна (пол студента не влияет на зависимость Y(Х)), то справедливо уравнение Y=mX+b, поэтому Q0=13, 46, k0=10. Если H0 неверна, то зависимость Y от X описывается уравнением (45), поэтому Q1=12, 80, k1=8. Из формулы (46) имеем: DQ=0, 663, из (47): kD=2. Подставив эти значения в формулу (48), получим FЧоу=0, 207. Порог для статистики Чоу равен: f(0, 05, 2, 8)=4, 46. Неравенство (49) не справедливо, и гипотеза H0 не отклоняется. Заметим, что значение остаточной суммы Q1 можно было получить другим способом. Именно, надо разделить наблюдения на две части: в одну часть отнести наблюдения, для которых Z=0 (женщины), а в другую – для которых Z=1 (мужчины). Далее следует рассчитать остаточные суммы для каждой части (Q1(Z=0)=2, 19 и Q1(Z=1)=10, 61) и просуммировать их (получим Q1=12, 80). Популярное:
|
Последнее изменение этой страницы: 2016-08-31; Просмотров: 863; Нарушение авторского права страницы