Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Модель множественной регрессии. Интерпретация уравнения регрессии



При решении задач экономического анализа и прогнозирования часто надо определить влияние на показатель Y значений более чем одного связанных с ним показателей (факторов) Х1, Х2, …, Хn, наблюдаемых в разные моменты времени t.

Если между показателями Y и Xi нет функциональной зависимости, то рассматривают стохастическую модель вида

Y = F(Х1, Х2…Xр) + U t, (5.30)

где переменная Y называется зависимой (эндогенной) переменной, Х1, , Хр – независимые (экзогенные) переменные (факторы), F – некоторая функция, Ut случайная величина (характеризует влияние неучтенных факторов), t – момент (период) наблюдения. Как и в случае простой регрессии U t обычно считается нормально распределенной случайной величиной с математическим ожиданием равным нулю M(Ut) = 0, постоянной дисперсией D(Ut) = const и ковариацией cov(Ut, Ut + s) = 0, s > 0.

Функция F называется функцией множественной (многофакторной)

регрессии, а уравнение


Y = F(X1, X2,..., Xk )


(5.31


 

уравнением или моделью множественной регрессии, k – количество факторов.

Если функция F – нелинейная функция, то регрессия называется нелинейной, иначе –  линейной. Уравнение множественной линейной

регрессией имеет вид:

y = a0  + a1 X 1 + a2 X 2  + ... + a k X k . (5.32)

Коэффициенты (а i, i = 1 – k) называются коэффициентами

множественной регрессии.

Основная задача теории линейных регрессионных моделей заключается в определении коэффициентов {аi, i = 1 – k} по наблюдаемым значениям переменных (Y(t), X1(t), , Xk(t)) в различные моменты времени t = 1, 2, …, n, где n – количество наблюдений вектора (Y, X1, …, Xk).

Для определения коэффициентов (а i, i = 0 – k) запишем уравнение (5.32)

для различных моментов времени наблюдений (t = 1, 2, …, n). Получим

систему n уравнений относительно k – неизвестных (а i, i = 0 – k),

предполагается, что k < n:

t t t t


y = a0  + a1 x1  + a2 x2  + ... + a k x k ,


(5.33)


t = 1, 2,..., n.

 

Систему уравнений (5.34) можно записать в матричном виде:

Y = Xа, (5.34)

где а = (а0…аk)Т – неизвестный вектор параметров модели (5.32);


Х – матрица наблюдаемых значений факторов Х i:

1 1 1


⎡ 1 x1


x2  ... x k


⎢ 2 2 2 ⎥


X = ⎢ 1 x1


x2  ... x k ⎥ . (5.35)


⎢.................... ⎥


⎢ ⎣ 1 x n


x n  ... x n ⎥ ⎦


1 2 k

Система уравнений (5.34) имеет n уравнений и (к + 1) неизвестных

а = (а 0 … а k)Т.

i
В стандартном регрессионном анализе предполагается, что k < n и

rang(X) = k.

Как и  в простой  линейной регрессии, для определения вектора неизвестных параметров а = (а0, …, аk)Т модели (5.32) по результатам наблюдений используется метод наименьших квадратов (МНК).

Построим вектор наблюдаемых значений показателя Y:

Y = (yt., y2, , yn)T (5.36)

и вектор регрессионных значений согласно (5.32):

∧ ∧ ∧ ∧

Y = ( y1, y 2,..., y n ).

∧ ∧ ∧ ∧


Вектор

регрессии.


e = Y −  Y = ( y1 − y1, y 2  − y 2,..., y n  y n ) называется вектором остатков


Параметры (а0, , аk) находятся методом наименьших квадратов (МНК)

из задачи минимизации суммы квадратов остатков:

Коэффициенты (аi) выбираются так, чтобы сумма квадратов остатков регрессии была минимальной. Если ввести функцию


 

L ( a 0, a 1,...,


a k ) =


n

t = 1


 

( y t


k

− ∑

i = 0


 

i
)
t  2
a i X i


 

(5.38)


то задача (5.37) эквивалентна системе уравнений:

L(a0, a1,..., a k ) = 0,

a i

i = 0, 1, 2,..., k.

Для обеспечения качества модели необходимо, чтобы было n > 3k, где n – количество наблюдений, k – количество факторов. Модель множественной регрессии оценивается с помощью следующих критериев:

1. Коэффициент детерминации (R 2):

Всегда 0 < R 2 < 1. Чем ближе R 2 к 1, тем точнее модель. Если R 2 > 0, 8, то

модель считается точной, если R2 < 0, 5, то модель надо улучшить, либо выбрав другие факторы, либо увеличив количество наблюдений.

2. Коэффициент множественной корреляции:

R R 2 . (5.44)

3. Скорректированный коэффициент детерминации:


c
R 2  = 1 − (1 − R 2 )

4. Стандартная ошибка:


n −  1

n k −  1


 

. (5.45)


n

∑ (Y t


−  Y t ) 2


SE =


 t = 1 . (5.46)

n k −  1


5. Оценка значимости модели, т.е. оценка того насколько верна гипотеза о линейности регрессии между Y и факторами Xi осуществляется по F-критерию Фишера. По наблюдаемым значениям определяется значение


2
F = R


(n k −  1). (5.47)


набл


(1 − R 2 )k


 

 

Если Fнабл > Fкр = Fтабл(0, 95; n – 1; n – k – 1), где 0, 95 – уровень доверительной вероятности, (n – 1) и (n k – 1) степени свободы модели, то модель считается значимой, и принимается гипотеза о линейной регрессии между переменными Y и Xi, где Fтабл – табличное  значение F-критерия Фишера.

Иначе гипотеза о линейной регрессии отвергается и надо изменять модель: выбрать другие факторы, увеличить количество наблюдений или построить нелинейную регрессию.

6. Оценка значимости коэффициентов регрессии (кроме свободного члена) осуществляется сравнением статистики

a j

t j = (5.48)

SE b jj

с табличным значением t-статистики Стьюдента. В (5.48) bjj – диагональный элемент матрицы (ХТХ)–1. Если значение (5.48) превосходит табличное значение t-статистики Стьюдента, то j-й коэффициент считается значимым, в

противном случае фактор, соответствующий данному коэффициенту следует исключить из модели.

7. Доверительный интервал для прогнозных значений линии регрессии определяется по формуле

 

 

∧ ∧


п
п
(Y t −  V t , Y t V t ),


(5.49)


 

 


где


V t = SE ⋅  t(α  , n k −  1)


x T (t )( X T X ) − 1 x


(t ), (5.50)


t (a, n k −  1) −


табличное значение критерия Стьюдента при заданном


уровне значимости α и числе степеней свободы (n k – 1);

х п(t) вектор-столбец факторов для прогнозных значений времени

(t = n + 1, n + 2, n + 3, ).

Матрица (Х Т Х)–1 соответствует наблюдаемым значениям факторов.

8. Влияние факторов Х на показатель Y оценивается с помощью коэффициентов эластичности Эj и бета-коэффициентов:

Коэффициенты эластичности Эj показывают, на сколько процентов изменится значение переменной Y при изменении Хj на 1%. Бета коэффициенты показывают, на какую часть среднеквадратичного

отклонения изменится Y при изменении Хj на величину своего среднеквадратичного отклонения.

Долю влияния j-го фактора в суммарном влиянии всех факторов на показатель Y оценивают с помощью дельта-коэффициентовr yj – коэффициент корреляции между j-м фактором и переменной Y.

При k = 1 получаются оценки для модели простой (однофакторной)

регрессии.

 

 


 


Поделиться:



Последнее изменение этой страницы: 2019-04-09; Просмотров: 230; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.03 с.)
Главная | Случайная страница | Обратная связь