Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Рекуррентные методы оценки параметров эконометрических моделей



Использование рекуррентных методов при оценке параметров эконометрических моделей позволяет избежать обращения матрицы X ¢ X и тем самым, появления ошибок в результатах этой операции, обусловленных высокой корреляцией ряда ее столбцов и строк. Обращение матрицы в этом случае заменяется последовательностью более простых вычислительных процедур, которые на каждом шаге расчетов определяют обратную матрицу ( X t+1¢ X t+1)–1, t=T1, T1+1,..., T, T1> п+1, где X t+1 – матрица, образованная t+1-ми строками матрицы X, на основе предварительно оцененной матрицы ( X t¢ X t)–1 и t+1-й строки матрицы X, которую обозначим как . В этом случае и МНК сводится к итеративной процедуре, на каждом шаге которой уточняются оценки коэффициентов модели для исходных данных интервала (1, t+1) с учетом оценок, полученных для интервала (1, t), и новой информации, содержащейся в t+1-м элементе уt +1 вектора у и строке t+1-й строке матрицы Х.

Рассмотрим рекуррентные методы оценивания параметров эконометрических моделей более детально.

Предположим, что существуют оценки коэффициентов эконометрической модели, полученные для первых t элементов вектора у и строк матрицы X. Обозначим эти оценки как вектор a t=(a0t, a1t,..., an t)¢ , t> п+1.

Заметим, что эти оценки с учетом результирующего выражения МНК a t=( X t¢ X t)–1 X t¢ у t можно представить в виде произведения двух сомножителей – матрицы F t–1=( X t¢ X t)–1 и вектора g t= X t¢ у t, где X t – матрица значений факторов, образованная по первым t строкам матрицы X и у t – вектор, образованный по первым элементам t вектора у.

Имея в виду правило умножения матрицы на вектор-столбец, вектор g t+ 1 можно представить в следующем виде:

g t+1= g t+D g t, (4.1)

 

где D g t – корректирующая поправка к вектору g t, образованная произведением транспонированной t+1-й строки матрицы X ¢ (t+1-го столбца матрицы X ¢ ) на t+1-й элемент вектора у :

 

D g t = × уt+1. (4.2)

 

Для матрицы F t+1=( X t+1¢ X t+1) также с учетом операции умножения матриц по правилу строка на столбец можно записать

 

F t+1= F t+D F t, (4.3)

 

где D F t – корректирующая поправка к матрице F t, полученная путем умножения транспонированной t+1-й строки матрицы X ¢ (t+1-го столбца матрицы X ) на саму себя, т. е. на t+1-й столбец матрицы X:

D F t = × . (4.4)

 

Заметим, то операция (4.3) не дает возможности непосредственно получить матрицу F t+1–1, обратную матрице F t+1. Для ее определения воспользуемся леммой об обращении матриц, которая может быть представлена в виде следующего выражения:

 

F t+ 1–1= F t–1 F t–1 × (1+ × F t–1 × )–1 × F t–1. (4.5)

 

Поскольку выражение (1+ × F t–1× ) является скаляром (как результат умножения строки на столбец F t–1× ), то матрица F t+1–1 на основании выражения (4.5) определяется как разность двух матриц

 

F t+ 1–1= F t–1–D F t–1, (4.6)

 

где D F t–1= F t–1× (1+ × F t–1× )-1 × F t–1 – поправка к матрице F t–1, полученная лишь с помощью процедур умножения матриц и векторов по правилу “строка на столбец”.

Для доказательства справедливости выражения (4.5) умножим матрицу F t+1 (выражение (4.3)) с учетом (4.4) слева на F t+1–1 и справа на F t–1. Получим:

 

F t–1= F t+1–1 + F t+1–1 F t–1 . (4.7)

 

Далее умножим выражение (4.7) справа на вектор-столбец и вынесем сомножитель F t+1–1 . Получим:

 

F t–1 × = F t+1–1 (1+ × F t–1 × ). (4.8)

 

Выражение (4.8), в свою очередь, умножим справа на вектора × F t–1. В результате получим

 

F t+1–1 ¢ × F t–1=

= F t–1 × (1+ × F t–1 × ) -1 × F t–1. (4.9)

 

Конечный результат леммы (4.5) получим путем подстановки в (4.9) вместо матрицы F t+1–1 ¢ × F t–1 ее эквивалента F t–1 F t+ 1–1 из выражения (4.7).

Используем лемму (4.5) для определения уточненного вектора оценок a t+1 коэффициентов линейной эконометрической модели. Для этого обозначим через R t+1 следующий сомножитель-вектор:

 

R t+1= F t–1× (1+ × F t–1 × )-1. (4.10)

 

С учетом (4.10) вместо (4.5) можем записать

 

F t+1–1= F t–1 R t+ 1 F t–1. (4.11)

 

Сопоставляя выражения (4.11) и (4.7), непосредственно имеем

 

R t+1= F t+ 1–1 × . (4.12)

 

Поскольку вектор a t+1 может быть определен как

a t+1= F t+1–1× g t+1= F t+1–1( g t+ × уt+1)= F t+ 1–1× g t+ F t–1 × × уt+1, (4.13)

 

то с учетом (4.11) после подстановки (4.12) в (4.13) получим

a t+1= a t+ R t+1(уt+1 × a t) (4.14)

или

a t+1= a t+D a t. (4.15)

 

Заметим, что выражение уt+1 × a t = представляет собой ошибку модели в момент t+1, полученную для модели, построенной по t точкам. Иными словами, в данном случае значение характеризует как бы ошибку прогноза, поскольку произведение × a t= рассматривается как прогнозное значение величины у в момент t+1, полученное на основе модели, построенной с использованием информации за период (1, t), и прогнозного фона, определенного значениями факторов х1,..., хп для момента t+1, а значение уt+1 – фактическое значение переменной у в момент t+1.

Таким образом, выражения (4.14) и (4.15) определяют оценку вектора a t+1 параметров эконометрической модели, построенной по данным периода (1, t+1), как сумму оценок этого же вектора, но построенного по данным периода (1, t), т. е. a t, и корректирующего слагаемого, определенного как произведение корректирующего множителя R t+1 на ошибку прогноза . Вектор a t можно интерпретировать как априорную информацию, а вектор D a t из выражения (4.15) как поправку, полученную на основе апостериорных данных. Вследствие этого рассмотренная рекуррентная процедура отражает байесовский подход к получению оценок коэффициентов эконометрической модели.

Из изложенного материала непосредственно вытекает, что для реализации рекуррентной процедуры оценок параметров линейной эконометрической модели в условиях мультиколлинеарности независимых переменных в периоде (1, Т) необходимо в качестве исходной информации иметь “хорошо обусловленную” матрицу F t, к которой несложно применить операцию обращения. Ее можно получить, если линейная зависимость между факторами хi, i=1, 2,..., п в период (1, t) будет значительно слабее, чем в период (1, Т).

Если же подобные взаимосвязи между факторами не ослабевают с уменьшением временного интервала, то для решения проблемы получения оценок коэффициентов линейной эконометрической модели с помощью рекуррентной процедуры может быть использовано некоторое приближение матрицы F t.

Например, матрицу F t можно заменить матрицей F t следующего вида:

 

F t=( F t + Е × d)=( X t¢ X t+ Е × d), (4.16)

 

где d – некоторый скаляр, добавляемый к диагональным элементам матрицы F t = X t¢ X t с целью облегчения операции получения обратной матрицы F t1.

В этом случае вектор коэффициентов a t определяется из выражения

a t=( X t¢ X t+ Е × d)–1 X t¢ у, (4.17)

 

которое называют гребневым МНК, а полученные на его основе оценки коэффициентов модели – гребневыми оценками.

Недостатком гребневых оценок является их смещенность, которая увеличивается с ростом уровня константы d. Однако это смещение для интервала (1, t) можно свести к минимуму путем подбора минимально достаточного значения d. Кроме того, в ходе рекуррентного метода оценивания для моментов времени t+1, t+2,..., Т величина смещения также уменьшается.

Если это необходимо, то рекуррентные методы могут применяться и в рамках обобщенного МНК или взвешенной эконометрической модели. Для этого процедуру рекуррентного оценивания необходимо применить к преобразованным исходным данным.

Метод главных компонент

Метод главных компонент является одним из самых эффективных вычислительных средств, позволяющих оценить коэффициенты эконометрической модели при плохой обусловленности матрицы ( X ¢ X ), вызванной сильной корреляционной зависимостью между некоторыми объясняющими переменными. Однако, как это будет показано далее в этом разделе, использование данного метода обычно ведет к потере части информации, содержащейся в матрице X, что, в свою очередь, является причиной того, что построенная на его основе модель может не вполне адекватно отражать закономерности рассматриваемых явлений.

Вместе с тем, вычислительные преимущества метода главных компонент достаточно очевидны, что обусловливает его популярность в эконометрических исследованиях самого широкого круга процессов, особенно в ситуациях, когда число независимых переменных достаточно велико и даже не слишком значительные корреляции между ними делают матрицу X ¢ X плохо обусловленной.

Основная идея метода главных компонент состоит в замене объясняющих переменных xi, i=1, 2,..., n на новые переменные zj, j=1, 2,..., k; k£ n, которые, с одной стороны, свободны от недостатков, вызванных корреляционной зависимостью, а, с другой, – содержат в себе максимально возможную долю информации “старых” переменных xi. Обычно метод главных компонент работает с центрированными переменными (см. раздел 1.1, выражение (1.13)). С учетом этого эконометрическая модель с центрированными переменными определяется выражением (1.10), в котором свободный коэффициент a0 отсутствует, т. е.

 

 

где, напоминаем, центрированные переменные определяются как и их математические ожидания равны нулю, т. е. i=1, 2,..., n.

Таким образом, матрица определяется следующимвыражением:

=

Выражение является мерой изменчивости переменной xi относительно ее среднего значения на интервале (1, Т). Аналогично, выражение определяет взаимную изменчивость переменных xi и xr на рассматриваемом интервале. Несложно заметить, что, если разделить эти изменчивости на Т–1, то получим дисперсию переменной xi и ковариацию переменных xi и xr соответственно. Таким образом, сумма диагональных элементов матрицы в данном случае содержит в себе всю информацию относительно изменчивости включен ных в исходную модель переменных xi. Эта сумма называется следом матрицы и обычно обозначается как tr( ).

Главные компоненты (новые переменные zjt) формируются как линейные комбинации “старых центрированных переменных” с учетом введения для них двух следующих принципиальных ограничений.

1. Полная совокупность главных компонент должна содержать в себе всю изменчивость переменных xi, i=1, 2,..., n.

2. Главные компоненты должны быть ортогональны между собой, т. е. для любой пары компонент j и r, j¹ r должно выполняться соотношение

 

 

Запишем линейное представление главных компонент через центрированные переменные в следующем виде:

Заметим, что поскольку то для всех j=1, 2,..., k. С учетом этого выражение (4.20) можно интерпретировать в том смысле, что взаимная изменчивость переменных zj и zr равна нулю.

В матричной форме выражение (4.21) запишем следующим образом:

z 1= b 1, (4.22)

 

где z 1=(z11,..., z1T)¢ – вектор-столбец значений z1t первой компоненты в моменты t; b 1=(b11,..., b1n)¢ – вектор-столбец коэффициентов линейной зависимости, выражающей связь первой компоненты со значениями центрированных переменных в моменты t=1, 2,..., Т; – матрица центрированных переменных , i=1, 2,..., n, в которой столбец, состоящий из единиц, отсутствует.

С учетом выражения (4.22) сумма квадратов элементов z1t, т. е. , характеризующая изменчивость первой главной компоненты, выражается следующим образом:

 

( z 1¢, z 1)= b 1¢ b 1. (4.23)

 

Определим неизвестный вектор коэффициентов b 1 таким образом, чтобы первая главная компонента вобрала в себя максимальную долю изменчивости, содержащейся в матрице , но при условии, что сами значения коэффициентов не будут влиять на эту характеристику. Это можно сделать введя нормирующее ограничение на элементы вектора b 1, которое выражается следующим соотношением

 

( b 1¢, b 1)=b112+b122+...+b1n2=1. (4.24)

 

Очевидно, что при выполнении условия (4.24) уровень изменчивости ( z 1¢, z 1) не сможет превзойти изменчивость всей матрицы .

Задача максимизации квадратичной формы (4.23) при условии (4.24) может быть решена на основе метода множителей Лагранжа, согласно которому искомое решение, т. е. вектор b 1, является значением аргумента, максимизирующим следующий функционал:

 

f 1= b 1¢ b 1 m1( b 1¢ b 1 –1), (4.25)

 

где m 1 – множитель Лагранжа.

Исходя из условия оптимума ¶ji / b i=0, дифференцируя правую часть (4.25) по вектору b 1 с учетом очевидного условия ¶mi / b i =0, получим

 

( b 1=m1 b 1. (4.26)

 

Из равенства (4.26) следует, что m1 – максимальное собственное число (перронов корень), положительно определенной матрицы ( ), а b 1 – соответствующий ему собственный вектор, координаты которого должны удовлетворять соотношению (4.24).

Аналогичным образом значения второй главной компоненты в моменты t=1, 2,..., Т определим как линейную комбинацию независимых переменных , i=1, 2,..., n, что может быть выражено равенством:

 

z 2= b 2, (4.27)

 

где z 2=(z21, z22,..., z2T)¢; b 2=(b21, b22,..., b2n)¢.

Неизвестные коэффициенты-компоненты вектора b 2 определим из (4.27) с учетом трех отмеченных выше условий. Компонента z 2 должна вобрать в себя максимальную долю изменчивости матрицы , оставшейся после компоненты z 1, вектора z 1 и z 2 должны быть ортогональны друг другу, а координаты вектора b 2 должны быть нормированы согласно соотношению типа (4.24).

Сочетание этих условий соответствует постановке задачи максимизации квадратичной формы

 

b 2¢ b 2®max (4.28)

 

при ограничениях

 

( b 2¢, b 1)=0. (4.30)

 

При этом отметим, что вид функционала (4.28) вытекает из определения изменчивости компоненты z 2 как скалярного произведения ( z 2¢, z 2)= b 2¢ b 2, выражение (4.29) является аналогом условия (4.24), а равенство (4.30) является следствием условия ортогональности компонент z 1 и z 2 .

В самом деле, условие ортогональности z 1 и z 2 можно представить с учетом свойства (4.26) в следующем виде:

 

0=( z 2¢, z 1)= b 2¢ b 1 =m1( b 2¢, b 1). (4.31)

 

Из (4.31) непосредственно следует ограничение (4.30).

Оптимизационная задача (4.28)–(4.30) также решается с помощью метода множителей Лагранжа как задача безусловной максимизации следующей квадратичной формы:

 

f2= b 2¢ b 2 m2( b 2¢ b 2–1)–h 1( b 2¢ b 1 –0), (4.32)

 

где m2 и h1 – множители Лагранжа.

Условие максимума (4.32) приводит к следующему выражению:

¶j 2 / b 2=2 b 2–2m2 b 2h1 b 1=0. (4.33)

 

Несложно показать, что множитель h1=0. Для этого умножим равенство (4.33) слева на b 1¢. В результате

 

2 b 1¢ b 2 –2m 2( b 1¢ b 2)–h1( b 1¢ b 1)=0. (4.34)

 

Поскольку

 

b 1¢ = b 1=m1 b 1, ( b 1¢, b 2)=0 и ( b 1¢, b 1)=1,

 

то из условия (4.34) непосредственно следует, что h 1= 0.

В этом случае выражение (4.33) можно представить в виде аналогичном (4.26):

b 2=m2 b 2. (4.35)

 

Из (4.35) следует, что множитель Лагранжа m 2 является вторым по величине собственным корнем матрицы ( ) и положительным числом (поскольку у положительно определенной матрицы все собственные числа положительные). Этому собственному числу соответствует собственный вектор b 2, координаты которого удовлетворяют условию (4.29).

Продолжение процесса формирования главных компонент как линейных комбинаций независимых переменных приводит к следующему результату. Коэффициенты этих линейных комбинаций являются нормированными собственными векторами b 1, b 2,..., b n матрицы , которым соответствуют собственные числа m 1, m 2,..., m n, удовлетворяющие соотношению

m1> m 2 ³ m3 ³...³ m n. (4.36)

 

Объединим вектора-столбцы b i, i=1, 2,..., n в матрицу следующего вида:

В =( b 1, b 2,..., b n). (4.37)

 

Тогда матрица значений главных компонент Z в общем случае, имеющая размер n´ Т определяется согласно следующему выражению:

Z = В, (4.38)

 

матрица Z ¢ Z (аналог матрицы ) с учетом свойств ортогональности компонент и нормированности векторов b i, i=1, 2,..., n имеет следующий вид:

 
 


Z ¢ Z = В ¢ В = . (4.39)

 

Заметим, что tr Z ¢ Z, т. е. является следом матрицы Z ¢ Z и определяет общую изменчивость главных компонент. Можно формально показать, что

tr( Z ¢ Z )=tr( ), (4.40)

 

т. е. изменчивость переменных , i=1, 2,..., n равна изменчивости главных компонент zj, j=1, 2,..., k.

При доказательстве равенства (4.40) будем использовать два результата теории матриц. Первый из них относится к свойствам матрицы В. Из условий типа (4.26), (4.29) и (4.30), определяющих свойства нормированности векторов b i, i=1, 2,..., n; и их ортогональности, следует, что

В ¢ В = Е. (4.41)

 

Таким образом, В ¢ = В –1 и для таких матриц справедливым является следующее равенство:

ВВ ¢ = Е. (4.42)

 

Из последнего результата вытекают определенные свойства следов матриц, которые могут быть сформулированы следующим образом: для произвольной матрицы А имеет место равенство следов матриц А ¢ А и АА ¢, т. е.

tr( А ¢ А )=tr( АА ¢ ). (4.43)

 

Как частный случай равенства (4.43) можно рассматривать следующий результат: скалярное произведение вектора-строки х ¢ на вектор-столбец х равно следу матрицы, полученной путем умножения вектора-столбца х на вектор-строку х ¢. Иными словами,

 

( х ¢ х )= =tr( хх ¢ ), (4.44)

 

где хi – координаты вектора х.

С учетом свойств (4.42) и (4.44) имеем

tr( Z ¢ Z )= = tr( В ¢ В )=tr( В ¢ В )=tr( )=

= . (4.45)

 

Таким образом, отношение можно интерпретировать как вклад (долю) компоненты zj в общую изменчивость независимых факторов , i=1, 2,..., n. Иными словами, справедливым является следующее равенство:

 

(4.46)

 

Условие (4.46) является ключевым при решении вопроса о том, сколько главных компонент целесообразно включить в эконометрическую модель. Как уже было отмечено выше, в том случае, когда матрица ( ) является плохо обусловленной, но ее определитель отличен от нуля, ½ ½ ¹ 0, теоретически общее число главных компонент совпадает с числом объясняющих переменных п. Однако информативная ценность главных компонент различна. Компоненты с большими номерами, как правило, определяют лишь незначительную долю общей изменчивости переменных и их обычно не включают в эконометрическую модель. Решение о том, на какой компоненте целесообразно остановиться может быть принято на основе анализа кумулятивной переменной I(mr), определяемой как

I(mr) = . (4.47)

Если I(mr) определяет достаточную долю изменчивости переменных и эта доля для компоненты с номером r+1 рассматривается как относительно небольшая (на практике – менее процента от общей изменчивости), то компоненты с номерами r+1, r+2,..., k в модель обычно не включают (см. рис. 4.1), ограничиваясь первыми r номерами из них.

На рис. 4.1 изображен вариант изменения кумулятивной изменчивости главных компонент. Из графика непосредственно видно, что первые четыре компоненты определяют около 95% общей изменчивости переменных , так что доля 5-й и последующих компонент явно незначительна. В этом случае в модель целесообразно включить лишь первые четыре компоненты.

В том случае, если ½ ½ = 0, матрица имеет ранг r< n, у нас имеется лишь r отличных от нуля собственных чисел, которым соответствуют r главных компонент, определяющих суммарную изменчивость переменных , i=1, 2,..., n. Тогда число включаемых в модель компонент не превосходит числа r. В исследованиях реальных процессов число главных компонент обычно существенно меньше количества независимых переменных.

 

I(mr)

 

1

0, 9

0, 8

0, 7

0, 6

0, 5

 

 
 


1 2 3 4 5 6 7 8 9 10 k

Рис.4.1. График изменения кумулятивной


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-03-25; Просмотров: 786; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.141 с.)
Главная | Случайная страница | Обратная связь