Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Модель множественной регрессии. Интерпретация уравнения регрессии
При решении задач экономического анализа и прогнозирования часто надо определить влияние на показатель Y значений более чем одного связанных с ним показателей (факторов) Х1, Х2, …, Хn, наблюдаемых в разные моменты времени t. Если между показателями Y и Xi нет функциональной зависимости, то рассматривают стохастическую модель вида Y = F(Х1, Х2…Xр) + U t, (5.30) где переменная Y называется зависимой (эндогенной) переменной, Х1, …, Хр – независимые (экзогенные) переменные (факторы), F – некоторая функция, Ut случайная величина (характеризует влияние неучтенных факторов), t – момент (период) наблюдения. Как и в случае простой регрессии U t обычно считается нормально распределенной случайной величиной с математическим ожиданием равным нулю M(Ut) = 0, постоянной дисперсией D(Ut) = const и ковариацией cov(Ut, Ut + s) = 0, s > 0. Функция F называется функцией множественной (многофакторной) регрессии, а уравнение ∧ Y = F(X1, X2,..., Xk ) (5.31
уравнением или моделью множественной регрессии, k – количество факторов. Если функция F – нелинейная функция, то регрессия называется нелинейной, иначе – линейной. Уравнение множественной линейной регрессией имеет вид: ∧ y = a0 + a1 X 1 + a2 X 2 + ... + a k X k . (5.32) Коэффициенты (а i, i = 1 – k) называются коэффициентами множественной регрессии. Основная задача теории линейных регрессионных моделей заключается в определении коэффициентов {аi, i = 1 – k} по наблюдаемым значениям переменных (Y(t), X1(t), …, Xk(t)) в различные моменты времени t = 1, 2, …, n, где n – количество наблюдений вектора (Y, X1, …, Xk). Для определения коэффициентов (а i, i = 0 – k) запишем уравнение (5.32) для различных моментов времени наблюдений (t = 1, 2, …, n). Получим систему n уравнений относительно k – неизвестных (а i, i = 0 – k), предполагается, что k < n: ∧ t t t t y = a0 + a1 x1 + a2 x2 + ... + a k x k , (5.33) t = 1, 2,..., n.
Систему уравнений (5.34) можно записать в матричном виде: ∧ Y = Xа, (5.34) где а = (а0…аk)Т – неизвестный вектор параметров модели (5.32); Х – матрица наблюдаемых значений факторов Х i: 1 1 1 ⎡ 1 x1 x2 ... x k ⎤ ⎢ 2 2 2 ⎥ X = ⎢ 1 x1 x2 ... x k ⎥ . (5.35) ⎢.................... ⎥ ⎢ ⎢ ⎣ 1 x n ⎥ x n ... x n ⎥ ⎦ 1 2 k Система уравнений (5.34) имеет n уравнений и (к + 1) неизвестных а = (а 0 … а k)Т.
rang(X) = k. Как и в простой линейной регрессии, для определения вектора неизвестных параметров а = (а0, …, аk)Т модели (5.32) по результатам наблюдений используется метод наименьших квадратов (МНК). Построим вектор наблюдаемых значений показателя Y: Y = (yt., y2, …, yn)T (5.36) и вектор регрессионных значений согласно (5.32): ∧ ∧ ∧ ∧ Y = ( y1, y 2,..., y n ). ∧ ∧ ∧ ∧ Вектор регрессии. e = Y − Y = ( y1 − y1, y 2 − y 2,..., y n − y n ) называется вектором остатков Параметры (а0, …, аk) находятся методом наименьших квадратов (МНК) из задачи минимизации суммы квадратов остатков:
Коэффициенты (аi) выбираются так, чтобы сумма квадратов остатков регрессии была минимальной. Если ввести функцию
L ( a 0, a 1,..., a k ) = n ∑ t = 1
( y t k − ∑ i = 0
(5.38) то задача (5.37) эквивалентна системе уравнений: ∂ L(a0, a1,..., a k ) = 0, ∂ a i i = 0, 1, 2,..., k. Для обеспечения качества модели необходимо, чтобы было n > 3k, где n – количество наблюдений, k – количество факторов. Модель множественной регрессии оценивается с помощью следующих критериев: 1. Коэффициент детерминации (R 2): Всегда 0 < R 2 < 1. Чем ближе R 2 к 1, тем точнее модель. Если R 2 > 0, 8, то модель считается точной, если R2 < 0, 5, то модель надо улучшить, либо выбрав другие факторы, либо увеличив количество наблюдений. 2. Коэффициент множественной корреляции: R = R 2 . (5.44) 3. Скорректированный коэффициент детерминации:
4. Стандартная ошибка: n − 1 n − k − 1
. (5.45) n ∑ (Y t ∧ − Y t ) 2 SE = t = 1 . (5.46) n − k − 1 5. Оценка значимости модели, т.е. оценка того насколько верна гипотеза о линейности регрессии между Y и факторами Xi осуществляется по F-критерию Фишера. По наблюдаемым значениям определяется значение
(n − k − 1). (5.47) набл (1 − R 2 )k
Если Fнабл > Fкр = Fтабл(0, 95; n – 1; n – k – 1), где 0, 95 – уровень доверительной вероятности, (n – 1) и (n – k – 1) степени свободы модели, то модель считается значимой, и принимается гипотеза о линейной регрессии между переменными Y и Xi, где Fтабл – табличное значение F-критерия Фишера. Иначе гипотеза о линейной регрессии отвергается и надо изменять модель: выбрать другие факторы, увеличить количество наблюдений или построить нелинейную регрессию. 6. Оценка значимости коэффициентов регрессии (кроме свободного члена) осуществляется сравнением статистики a j t j = (5.48) SE b jj с табличным значением t-статистики Стьюдента. В (5.48) bjj – диагональный элемент матрицы (ХТХ)–1. Если значение (5.48) превосходит табличное значение t-статистики Стьюдента, то j-й коэффициент считается значимым, в противном случае фактор, соответствующий данному коэффициенту следует исключить из модели. 7. Доверительный интервал для прогнозных значений линии регрессии определяется по формуле
∧ ∧
(5.49)
где V t = SE ⋅ t(α , n − k − 1) x T (t )( X T X ) − 1 x (t ), (5.50) t (a, n − k − 1) − табличное значение критерия Стьюдента при заданном уровне значимости α и числе степеней свободы (n – k – 1); х п(t) – вектор-столбец факторов для прогнозных значений времени (t = n + 1, n + 2, n + 3, …). Матрица (Х Т Х)–1 соответствует наблюдаемым значениям факторов. 8. Влияние факторов Х на показатель Y оценивается с помощью коэффициентов эластичности Эj и бета-коэффициентов: Коэффициенты эластичности Эj показывают, на сколько процентов изменится значение переменной Y при изменении Хj на 1%. Бета коэффициенты показывают, на какую часть среднеквадратичного отклонения изменится Y при изменении Хj на величину своего среднеквадратичного отклонения. Долю влияния j-го фактора в суммарном влиянии всех факторов на показатель Y оценивают с помощью дельта-коэффициентовr yj – коэффициент корреляции между j-м фактором и переменной Y. При k = 1 получаются оценки для модели простой (однофакторной) регрессии.
|
Последнее изменение этой страницы: 2019-04-09; Просмотров: 256; Нарушение авторского права страницы