Рекуррентные методы оценки параметров эконометрических моделей

⇐ ПредыдущаяСтр 2 из 12Следующая ⇒

Использование рекуррентных методов при оценке параметров эконометрических моделей позволяет избежать обращения матрицы X ¢ X и тем самым, появления ошибок в результатах этой операции, обусловленных высокой корреляцией ряда ее столбцов и строк. Обращение матрицы в этом случае заменяется последовательностью более простых вычислительных процедур, которые на каждом шаге расчетов определяют обратную матрицу ( X _t+₁¢ X _t+₁)^–1, t=T₁, T₁+1,..., T, T₁> п+1, где X _t₊₁ – матрица, образованная t+1-ми строками матрицы X, на основе предварительно оцененной матрицы ( X _t¢ X _t)^–1и t+1-й строки матрицы X, которую обозначим как . В этом случае и МНК сводится к итеративной процедуре, на каждом шаге которой уточняются оценки коэффициентов модели для исходных данных интервала (1, t+1) с учетом оценок, полученных для интервала (1, t), и новой информации, содержащейся в t+1-м элементе у_t₊₁ вектора у и строке t+1-й строке матрицы Х.

Рассмотрим рекуррентные методы оценивания параметров эконометрических моделей более детально.

Предположим, что существуют оценки коэффициентов эконометрической модели, полученные для первых t элементов вектора у и строк матрицы X. Обозначим эти оценки как вектор a _t=(a₀^t, a₁^t,..., a_n^t)¢ , t> п+1.

Заметим, что эти оценки с учетом результирующего выражения МНК a _t=( X _t¢ X _t)^–1 X _t¢ у _tможно представить в виде произведения двух сомножителей – матрицы F _t^–1=( X _t¢ X _t)^–1и вектора g _t= X _t¢ у _t, где X _t – матрица значений факторов, образованная по первым t строкам матрицы X и у _t – вектор, образованный по первым элементам t вектора у.

Имея в виду правило умножения матрицы на вектор-столбец, вектор g _t+₁ можно представить в следующем виде:

g _t₊₁= g _t+D g _t, (4.1)

где D g _t – корректирующая поправка к вектору g _t, образованная произведением транспонированной t+1-й строки матрицы X ¢ (t+1-го столбца матрицы X ¢ ) на t+1-й элемент вектора у :

D g _t= × у_t₊₁. (4.2)

Для матрицы F _t₊₁=( X _t₊₁¢ X _t₊₁) также с учетом операции умножения матриц по правилу строка на столбец можно записать

F _t₊₁= F _t+D F _t, (4.3)

где D F _t – корректирующая поправка к матрице F _t, полученная путем умножения транспонированной t+1-й строки матрицы X ¢ (t+1-го столбца матрицы X ) на саму себя, т. е. на t+1-й столбец матрицы X:

D F _t= × . (4.4)

Заметим, то операция (4.3) не дает возможности непосредственно получить матрицу F _t+₁^–1, обратную матрице F _t+₁. Для ее определения воспользуемся леммой об обращении матриц, которая может быть представлена в виде следующего выражения:

F _t+₁^–1= F _t^–1– F _t^–1× (1+ × F _t^–1× )^–1 × F _t^–1. (4.5)

Поскольку выражение (1+ × F _t^–1× ) является скаляром (как результат умножения строки на столбец F _t^–1× ), то матрица F _t₊₁^–1на основании выражения (4.5) определяется как разность двух матриц

F _t+₁^–1= F _t^–1–D F _t^–1, (4.6)

где D F _t^–1= F _t^–1× (1+ × F _t^–1× )^-1 × F _t^–1– поправка к матрице F _t^–1, полученная лишь с помощью процедур умножения матриц и векторов по правилу “строка на столбец”.

Для доказательства справедливости выражения (4.5) умножим матрицу F _t+₁ (выражение (4.3)) с учетом (4.4) слева на F _t₊₁^–1 и справа на F _t^–1. Получим:

F _t^–1= F _t₊₁^–1+ F _t₊₁^–1 F _t^–1. (4.7)

Далее умножим выражение (4.7) справа на вектор-столбец и вынесем сомножитель F _t₊₁^–1 . Получим:

F _t^–1× = F _t₊₁^–1 (1+ × F _t^–1× ). (4.8)

Выражение (4.8), в свою очередь, умножим справа на вектора × F _t^–1. В результате получим

F _t₊₁^–1 ¢ × F _t^–1=

= F _t^–1× (1+ × F _t^–1× )^-1 × F _t^–1. (4.9)

Конечный результат леммы (4.5) получим путем подстановки в (4.9) вместо матрицы F _t₊₁^–1 ¢ × F _t^–1ее эквивалента F _t^–1– F _t+₁^–1из выражения (4.7).

Используем лемму (4.5) для определения уточненного вектора оценок a _t₊₁коэффициентов линейной эконометрической модели. Для этого обозначим через R _t₊₁ следующий сомножитель-вектор:

R _t₊₁= F _t^–1× (1+ × F _t^–1× )^-1. (4.10)

С учетом (4.10) вместо (4.5) можем записать

F _t₊₁^–1= F _t^–1– R _t+₁ F _t^–1. (4.11)

Сопоставляя выражения (4.11) и (4.7), непосредственно имеем

R _t₊₁= F _t+₁^–1× . (4.12)

Поскольку вектор a _t₊₁ может быть определен как

a _t₊₁= F _t₊₁^–1× g _t₊₁= F _t₊₁^–1( g _t+ × у_t₊₁)= F _t+₁^–1× g _t+ F _t^–1× × у_t₊₁, (4.13)

то с учетом (4.11) после подстановки (4.12) в (4.13) получим

a _t₊₁= a _t+ R _t₊₁(у_t₊₁– × a _t) (4.14)

или

a _t₊₁= a _t+D a _t. (4.15)

Заметим, что выражение у_t₊₁– × a _t= представляет собой ошибку модели в момент t+1, полученную для модели, построенной по t точкам. Иными словами, в данном случае значение характеризует как бы ошибку прогноза, поскольку произведение × a _t= рассматривается как прогнозное значение величины у в момент t+1, полученное на основе модели, построенной с использованием информации за период (1, t), и прогнозного фона, определенного значениями факторов х₁,..., х_п для момента t+1, а значение у_t₊₁ – фактическое значение переменной у в момент t+1.

Таким образом, выражения (4.14) и (4.15) определяют оценку вектора a _t₊₁ параметров эконометрической модели, построенной по данным периода (1, t+1), как сумму оценок этого же вектора, но построенного по данным периода (1, t), т. е. a _t, и корректирующего слагаемого, определенного как произведение корректирующего множителя R _t₊₁ на ошибку прогноза . Вектор a _t можно интерпретировать как априорную информацию, а вектор D a _t из выражения (4.15) как поправку, полученную на основе апостериорных данных. Вследствие этого рассмотренная рекуррентная процедура отражает байесовский подход к получению оценок коэффициентов эконометрической модели.

Из изложенного материала непосредственно вытекает, что для реализации рекуррентной процедуры оценок параметров линейной эконометрической модели в условиях мультиколлинеарности независимых переменных в периоде (1, Т) необходимо в качестве исходной информации иметь “хорошо обусловленную” матрицу F _t, к которой несложно применить операцию обращения. Ее можно получить, если линейная зависимость между факторами х_i, i=1, 2,..., п в период (1, t) будет значительно слабее, чем в период (1, Т).

Если же подобные взаимосвязи между факторами не ослабевают с уменьшением временного интервала, то для решения проблемы получения оценок коэффициентов линейной эконометрической модели с помощью рекуррентной процедуры может быть использовано некоторое приближение матрицы F _t.

Например, матрицу F _tможно заменить матрицей F _t следующего вида:

F _t=( F _t+ Е × d)=( X _t¢ X _t+ Е × d), (4.16)

где d – некоторый скаляр, добавляемый к диагональным элементам матрицы F _t= X _t¢ X _t с целью облегчения операции получения обратной матрицы F _t^–¹.

В этом случае вектор коэффициентов a _t определяется из выражения

a _t=( X _t¢ X _t+ Е × d)^–1 X _t¢ у, (4.17)

которое называют гребневым МНК, а полученные на его основе оценки коэффициентов модели – гребневыми оценками.

Недостатком гребневых оценок является их смещенность, которая увеличивается с ростом уровня константы d. Однако это смещение для интервала (1, t) можно свести к минимуму путем подбора минимально достаточного значения d. Кроме того, в ходе рекуррентного метода оценивания для моментов времени t+1, t+2,..., Т величина смещения также уменьшается.

Если это необходимо, то рекуррентные методы могут применяться и в рамках обобщенного МНК или взвешенной эконометрической модели. Для этого процедуру рекуррентного оценивания необходимо применить к преобразованным исходным данным.

Метод главных компонент

Метод главных компонент является одним из самых эффективных вычислительных средств, позволяющих оценить коэффициенты эконометрической модели при плохой обусловленности матрицы ( X ¢ X ), вызванной сильной корреляционной зависимостью между некоторыми объясняющими переменными. Однако, как это будет показано далее в этом разделе, использование данного метода обычно ведет к потере части информации, содержащейся в матрице X, что, в свою очередь, является причиной того, что построенная на его основе модель может не вполне адекватно отражать закономерности рассматриваемых явлений.

Вместе с тем, вычислительные преимущества метода главных компонент достаточно очевидны, что обусловливает его популярность в эконометрических исследованиях самого широкого круга процессов, особенно в ситуациях, когда число независимых переменных достаточно велико и даже не слишком значительные корреляции между ними делают матрицу X ¢ X плохо обусловленной.

Основная идея метода главных компонент состоит в замене объясняющих переменных x_i, i=1, 2,..., n на новые переменные z_j, j=1, 2,..., k; k£ n, которые, с одной стороны, свободны от недостатков, вызванных корреляционной зависимостью, а, с другой, – содержат в себе максимально возможную долю информации “старых” переменных x_i. Обычно метод главных компонент работает с центрированными переменными (см. раздел 1.1, выражение (1.13)). С учетом этого эконометрическая модель с центрированными переменными определяется выражением (1.10), в котором свободный коэффициент a₀ отсутствует, т. е.

где, напоминаем, центрированные переменные определяются как и их математические ожидания равны нулю, т. е. i=1, 2,..., n.

Таким образом, матрица определяется следующимвыражением:

Выражение является мерой изменчивости переменной x_i относительно ее среднего значения на интервале (1, Т). Аналогично, выражение определяет взаимную изменчивость переменных x_iи x_rна рассматриваемом интервале. Несложно заметить, что, если разделить эти изменчивости на Т–1, то получим дисперсию переменной x_iи ковариацию переменных x_i и x_rсоответственно. Таким образом, сумма диагональных элементов матрицы в данном случае содержит в себе всю информацию относительно изменчивости включен ных в исходную модель переменных x_i. Эта сумма называется следом матрицы и обычно обозначается как tr( ).

Главные компоненты (новые переменные z_jt) формируются как линейные комбинации “старых центрированных переменных” с учетом введения для них двух следующих принципиальных ограничений.

1. Полная совокупность главных компонент должна содержать в себе всю изменчивость переменных x_i, i=1, 2,..., n.

2. Главные компоненты должны быть ортогональны между собой, т. е. для любой пары компонент j и r, j¹ r должно выполняться соотношение

Запишем линейное представление главных компонент через центрированные переменные в следующем виде:

Заметим, что поскольку то для всех j=1, 2,..., k. С учетом этого выражение (4.20) можно интерпретировать в том смысле, что взаимная изменчивость переменных z_jи z_rравна нулю.

В матричной форме выражение (4.21) запишем следующим образом:

z ₁= b ₁, (4.22)

где z ₁=(z₁₁,..., z_1T)¢ – вектор-столбец значений z_1t первой компоненты в моменты t; b ₁=(b₁₁,..., b_1n)¢ – вектор-столбец коэффициентов линейной зависимости, выражающей связь первой компоненты со значениями центрированных переменных в моменты t=1, 2,..., Т; – матрица центрированных переменных , i=1, 2,..., n, в которой столбец, состоящий из единиц, отсутствует.

С учетом выражения (4.22) сумма квадратов элементов z_1t, т. е. , характеризующая изменчивость первой главной компоненты, выражается следующим образом:

( z ₁¢, z ₁)= b ₁¢ b ₁. (4.23)

Определим неизвестный вектор коэффициентов b ₁ таким образом, чтобы первая главная компонента вобрала в себя максимальную долю изменчивости, содержащейся в матрице , но при условии, что сами значения коэффициентов не будут влиять на эту характеристику. Это можно сделать введя нормирующее ограничение на элементы вектора b ₁, которое выражается следующим соотношением

( b ₁¢, b ₁)=b₁₁²+b₁₂²+...+b_1n²=1. (4.24)

Очевидно, что при выполнении условия (4.24) уровень изменчивости ( z ₁¢, z ₁) не сможет превзойти изменчивость всей матрицы .

Задача максимизации квадратичной формы (4.23) при условии (4.24) может быть решена на основе метода множителей Лагранжа, согласно которому искомое решение, т. е. вектор b ₁, является значением аргумента, максимизирующим следующий функционал:

f₁= b ₁¢ b ₁–m₁( b ₁¢ b ₁–1), (4.25)

где m₁ – множитель Лагранжа.

Исходя из условия оптимума ¶j_i /¶ b _i=0, дифференцируя правую часть (4.25) по вектору b ₁с учетом очевидного условия ¶m_i/¶ b _i=0, получим

( )× b ₁=m₁ b ₁. (4.26)

Из равенства (4.26) следует, что m₁ – максимальное собственное число (перронов корень), положительно определенной матрицы ( ), а b ₁ – соответствующий ему собственный вектор, координаты которого должны удовлетворять соотношению (4.24).

Аналогичным образом значения второй главной компоненты в моменты t=1, 2,..., Т определим как линейную комбинацию независимых переменных , i=1, 2,..., n, что может быть выражено равенством:

z ₂= b ₂, (4.27)

где z ₂=(z₂₁, z₂₂,..., z_2T)¢; b ₂=(b₂₁, b₂₂,..., b_2n)¢.

Неизвестные коэффициенты-компоненты вектора b ₂ определим из (4.27) с учетом трех отмеченных выше условий. Компонента z ₂ должна вобрать в себя максимальную долю изменчивости матрицы , оставшейся после компоненты z ₁, вектора z ₁ и z ₂должны быть ортогональны друг другу, а координаты вектора b ₂должны быть нормированы согласно соотношению типа (4.24).

Сочетание этих условий соответствует постановке задачи максимизации квадратичной формы

b ₂¢ b ₂®max (4.28)

при ограничениях

( b ₂¢, b ₁)=0. (4.30)

При этом отметим, что вид функционала (4.28) вытекает из определения изменчивости компоненты z ₂как скалярного произведения ( z ₂¢, z ₂)= b ₂¢ b ₂, выражение (4.29) является аналогом условия (4.24), а равенство (4.30) является следствием условия ортогональности компонент z ₁ и z ₂.

В самом деле, условие ортогональности z ₁ и z ₂можно представить с учетом свойства (4.26) в следующем виде:

0=( z ₂¢, z ₁)= b ₂¢ b ₁=m₁( b ₂¢, b ₁). (4.31)

Из (4.31) непосредственно следует ограничение (4.30).

Оптимизационная задача (4.28)–(4.30) также решается с помощью метода множителей Лагранжа как задача безусловной максимизации следующей квадратичной формы:

f₂= b ₂¢ b ₂–m₂( b ₂¢ b ₂–1)–h₁( b ₂¢ b ₁–0), (4.32)

где m₂ и h₁ – множители Лагранжа.

Условие максимума (4.32) приводит к следующему выражению:

¶j₂/¶ b ₂=2 b ₂–2m₂ b ₂–h₁ b ₁=0. (4.33)

Несложно показать, что множитель h₁=0. Для этого умножим равенство (4.33) слева на b ₁¢. В результате

2 b ₁¢ b ₂–2m₂( b ₁¢ b ₂)–h₁( b ₁¢ b ₁)=0. (4.34)

Поскольку

b ₁¢ = b ₁=m₁ b ₁, ( b ₁¢, b ₂)=0 и ( b ₁¢, b ₁)=1,

то из условия (4.34) непосредственно следует, что h₁= 0.

В этом случае выражение (4.33) можно представить в виде аналогичном (4.26):

b ₂=m₂ b ₂. (4.35)

Из (4.35) следует, что множитель Лагранжа m₂является вторым по величине собственным корнем матрицы ( ) и положительным числом (поскольку у положительно определенной матрицы все собственные числа положительные). Этому собственному числу соответствует собственный вектор b ₂, координаты которого удовлетворяют условию (4.29).

Продолжение процесса формирования главных компонент как линейных комбинаций независимых переменных приводит к следующему результату. Коэффициенты этих линейных комбинаций являются нормированными собственными векторами b ₁, b ₂,..., b _nматрицы , которым соответствуют собственные числа m₁, m₂,..., m_n, удовлетворяющие соотношению

m₁> m₂³ m₃³...³ m_n. (4.36)

Объединим вектора-столбцы b _i, i=1, 2,..., n в матрицу следующего вида:

В =( b ₁, b ₂,..., b _n). (4.37)

Тогда матрица значений главных компонент Z в общем случае, имеющая размер n´ Т определяется согласно следующему выражению:

Z = В, (4.38)

матрица Z ¢ Z (аналог матрицы ) с учетом свойств ортогональности компонент и нормированности векторов b _i, i=1, 2,..., n имеет следующий вид:

Z ¢ Z = В ¢ В = . (4.39)

Заметим, что tr Z ¢ Z, т. е. является следом матрицы Z ¢ Z и определяет общую изменчивость главных компонент. Можно формально показать, что

tr( Z ¢ Z )=tr( ), (4.40)

т. е. изменчивость переменных , i=1, 2,..., n равна изменчивости главных компонент z_j, j=1, 2,..., k.

При доказательстве равенства (4.40) будем использовать два результата теории матриц. Первый из них относится к свойствам матрицы В. Из условий типа (4.26), (4.29) и (4.30), определяющих свойства нормированности векторов b _i, i=1, 2,..., n; и их ортогональности, следует, что

В ¢ В = Е. (4.41)

Таким образом, В ¢ = В ^–1и для таких матриц справедливым является следующее равенство:

ВВ ¢ = Е. (4.42)

Из последнего результата вытекают определенные свойства следов матриц, которые могут быть сформулированы следующим образом: для произвольной матрицы А имеет место равенство следов матриц А ¢ А и АА ¢, т. е.

tr( А ¢ А )=tr( АА ¢ ). (4.43)

Как частный случай равенства (4.43) можно рассматривать следующий результат: скалярное произведение вектора-строки х ¢ на вектор-столбец х равно следу матрицы, полученной путем умножения вектора-столбца х на вектор-строку х ¢. Иными словами,

( х ¢ х )= =tr( хх ¢ ), (4.44)

где х_i– координаты вектора х.

С учетом свойств (4.42) и (4.44) имеем

tr( Z ¢ Z )= = tr( В ¢ В )=tr( В ¢ В )=tr( )=

= . (4.45)

Таким образом, отношение можно интерпретировать как вклад (долю) компоненты z_jв общую изменчивость независимых факторов , i=1, 2,..., n. Иными словами, справедливым является следующее равенство:

(4.46)

Условие (4.46) является ключевым при решении вопроса о том, сколько главных компонент целесообразно включить в эконометрическую модель. Как уже было отмечено выше, в том случае, когда матрица ( ) является плохо обусловленной, но ее определитель отличен от нуля, ½ ½ ¹ 0, теоретически общее число главных компонент совпадает с числом объясняющих переменных п. Однако информативная ценность главных компонент различна. Компоненты с большими номерами, как правило, определяют лишь незначительную долю общей изменчивости переменных и их обычно не включают в эконометрическую модель. Решение о том, на какой компоненте целесообразно остановиться может быть принято на основе анализа кумулятивной переменной I(m_r), определяемой как

I(m_r) = . (4.47)

Если I(m_r) определяет достаточную долю изменчивости переменных и эта доля для компоненты с номером r+1 рассматривается как относительно небольшая (на практике – менее процента от общей изменчивости), то компоненты с номерами r+1, r+2,..., k в модель обычно не включают (см. рис. 4.1), ограничиваясь первыми r номерами из них.

На рис. 4.1 изображен вариант изменения кумулятивной изменчивости главных компонент. Из графика непосредственно видно, что первые четыре компоненты определяют около 95% общей изменчивости переменных , так что доля 5-й и последующих компонент явно незначительна. В этом случае в модель целесообразно включить лишь первые четыре компоненты.

В том случае, если ½ ½ = 0, матрица имеет ранг r< n, у нас имеется лишь r отличных от нуля собственных чисел, которым соответствуют r главных компонент, определяющих суммарную изменчивость переменных , i=1, 2,..., n. Тогда число включаемых в модель компонент не превосходит числа r. В исследованиях реальных процессов число главных компонент обычно существенно меньше количества независимых переменных.

I(m_r)

1

0, 9

0, 8

0, 7

0, 6

0, 5

1 2 3 4 5 6 7 8 9 10 k

Рис.4.1. График изменения кумулятивной

⇐ Предыдущая 123 4 5 6 7 8 9 10 Следующая ⇒
Поделиться:

Популярное:
D.3. Системы эконометрических уравнений
Анализ моделей - аналогов в разрезе проектируемой модели
ВЗАИМОСВЯЗЬ ПАРАМЕТРОВ ПРИ МЕХАНИЧЕСКОЙ ОБРАБОТКЕ ДРЕВЕСИНЫ
Виды моделей и моделирования
Влияние паразитных параметров на выходной импульс
Второй этап. Определение системы параметров.
Выбор закона регулирования и параметров настройки регулятора
ВЫБОР ОСНОВНЫХ ПАРАМЕТРОВ ВЕРТЛЮГА.
Выбор программного обеспечения для создания 3D-моделей рукояток
Выявление основных параметров и ограничений
Глава 3. Расчет параметров сетевых графиков
ГЛАВА I. ПРОБЛЕМЫ ПОСТРОЕНИЯ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ

Последнее изменение этой страницы: 2016-03-25; Просмотров: 786; Нарушение авторского права страницы