Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Оценивание значимости уравнения регрессии
Абсолютное значение выборочного коэффициента корреляции вычислим по формуле, следующей из (12а): . Значение R2 берем из таблицы 3 результатов функции ЛИНЕЙН: R2=0, 750, |r|=0, 866. Следовательно, связь между Y и X достаточно тесная. Значения остаточной и регрессионной суммы получим из таблицы 3: Qe=8, 39, QR=25, 21. Так как QR> > Qe, то, скорее всего, уравнение регрессии значимо. Полную сумму квадратов вычислим по формуле (11): Q=33, 60. Смысл этих сумм был разъяснен в §1.5. Проверим гипотезу о незначимости уравнения регрессии по критерию Фишера. Из таблицы 3: F=24, 03. Квантиль F-распределения вычислим с помощью функции FРАСПОБР: f(0, 05; 1; 8)=5, 32. Таким образом, неравенство (14) выполнено, и уравнение значимо. Проверим гипотезу H о равенстве нулю коэффициента регрессии. Из таблицы 3: 1, 02, =0, 207. По формуле (15в) определяем: Т=4, 90. Квантиль распределения Стьюдента вычислим с помощью функции СТЬЮДРАСПОБР: t(0, 05; 8)=2, 31. Получили, что неравенство (16) выполнено. Следовательно, гипотезу H следует отклонить, и коэффициент регрессиизначим. 3. Задание* на самостоятельную работу Исследуется зависимость доли расходов на продовольственные товары в общих расходах (Y) от средней дневной заработной платы одного работающего (X) в семи территориях Уральского региона по данным, представленным в таблице 4. Провести анализ зависимости Y(X) по аналогии с §2.
Таблица 4. Зависимость доли расходов от средней заработной платы
Практическая работа №2. Интервальное оценивание Теоретическая часть Доверительный интервал коэффициента регрессии Так как статистика (15б) имеет распределение Стьюдента с n-2 степенями свободы, то с вероятностью γ =1-a справедливо соотношение: (17) где t(a; n-2) – квантиль распределения Стьюдента уровня 1-a. Из неравенства (17) получаем интервальную оценку коэффициента регрессии m доверительной вероятности (надежности) γ: (18) Доверительный интервал дисперсии возмущений Так как статистика S2 (см. формулу (8а)) имеет распределение хи-квадрат с n-2 степенями свободы, то с вероятностью γ =1-a справедливо соотношение: , где c2(z; n-2) –квантиль уровня значимости 1-z распределения хи-квадрат. Из последнего неравенства с учетом формулы (8а) получаем доверительный интервал дисперсии возмущений s2 надежности γ: . (19) Интервальное оценивание функции регрессии Под функцией регрессии (см. §1.1) понимается f(x)≡ MxY – условное математическое ожидание отклика Y при заданном значении x фактора. Из несмещенности оценок и и соотношения (2) следует: . Можно доказать (см., например, [5]), что для выборочного среднего квадратичного отклонения справедлива формула: , (20) а центрированная и нормированная статистика распределена по Стьюденту с числом степеней свободы n-2. Отсюда следует, что с вероятностью γ =1-a выполняется соотношение: , и доверительный интервал MxY надежности γ определяется неравенством: (21) Из соотношений (20), (21), в частности, следует, что величина доверительного интервала функции регрессии зависит от значения объясняющей переменной х: чем больше отклонение х от среднего значения , тем шире доверительный интервал, и, соответственно, меньше точность оценивания. Интервальное оценивание индивидуальных значений отклика Соотношение (21) дает интервальную оценку среднего значения отклика при условии заданного x в рамках классической нормальной линейной регрессионной модели. Доверительный интервал индивидуального значения отклика y* (см., например, [5]) задается соотношением: , (22) где . (23) Решение типовой задачи в среде Excel Постановка задачи Продолжаем исследовать зависимость добычи угля на 1 рабочего (Y) от толщины угольного пласта (Х) (см. таблицу 1). Требуется: 1. Найти с надежностью γ =0, 95 интервальные оценки коэффициента регрессии m и дисперсии s2 возмущений. 2. Построить 95-процентные доверительные интервалы линии регрессии и индивидуальных значений отклика. 3. Повторить п.п.1-2 для доверительной вероятности 0, 9. 2.2. Выполнение задания в среде Excel Доверительный интервал коэффициента регрессии определяем по формуле (18). В практической работе №1 уже нашли: 1, 02, =0, 207 (см. таблицу 3); t(0, 05; 8)=2, 31 (с помощью функции СТЬЮДРАСПОБР). Подставив эти значения в формулу (18), получаем 95-процентный доверительный интервал для коэффициента m: 0, 538≤ m≤ 1, 495. Для расчета интервальной оценки дисперсии возмущений в формулу (19) подставляем значение Qe=8, 39 из таблицы 3. Квантили распределения хи-квадрат находим, применяя функцию ХИ2ОБР: c2(0, 025; 8)=17, 53, c2(0, 975; 8)=2, 18. Получаем 95-процентный доверительный интервал дисперсии возмущений: 0, 479≤ s2≤ 3, 85. Расчеты доверительных границ функции регрессии и индивидуальных значений отклика приведены в таблице 5. Рассматривался немного более широкий диапазон x, чем диапазон наблюдений. Значения вычислялись по формуле (2), – по формуле (20), sy * – по формуле (23). Значения , , , s были взяты из таблицы 3. Через N (V) обозначена нижняя (верхняя) доверительная граница функции регрессии, через N инд (V инд) –нижняя (верхняя) доверительная граница индивидуальных значений отклика. В соответствии с соотношениями (21), (22) использовались формулы: Графики доверительных границ, построенные по таблице 5, показаны на рис. 4.
Таблица 5. Расчеты доверительного интервала функции регрессии
Для быстрого выполнения расчетов необходимо грамотно использовать абсолютные адреса ячеек Excel. Так, например, чтобы провести вычисления для двух значений доверительной вероятности (γ =0, 95 и γ =0, 9) достаточно:
3. Задание на самостоятельную работу. Продолжаем исследование зависимости доли расходов на продовольственные товары в общих расходах (Y) от средней дневной заработной платы одного работающего (X) в семи территориях Уральского региона (таблица 4). Необходимо провести расчеты доверительных интервалов параметров линейной регрессии по аналогии с §2. Популярное:
|
Последнее изменение этой страницы: 2016-08-31; Просмотров: 1136; Нарушение авторского права страницы