Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Рекуррентные методы оценки параметров эконометрических моделей
Использование рекуррентных методов при оценке параметров эконометрических моделей позволяет избежать обращения матрицы X ¢ X и тем самым, появления ошибок в результатах этой операции, обусловленных высокой корреляцией ряда ее столбцов и строк. Обращение матрицы в этом случае заменяется последовательностью более простых вычислительных процедур, которые на каждом шаге расчетов определяют обратную матрицу ( X t+1¢ X t+1)–1, t=T1, T1+1,..., T, T1> п+1, где X t+1 – матрица, образованная t+1-ми строками матрицы X, на основе предварительно оцененной матрицы ( X t¢ X t)–1 и t+1-й строки матрицы X, которую обозначим как . В этом случае и МНК сводится к итеративной процедуре, на каждом шаге которой уточняются оценки коэффициентов модели для исходных данных интервала (1, t+1) с учетом оценок, полученных для интервала (1, t), и новой информации, содержащейся в t+1-м элементе уt +1 вектора у и строке t+1-й строке матрицы Х. Рассмотрим рекуррентные методы оценивания параметров эконометрических моделей более детально. Предположим, что существуют оценки коэффициентов эконометрической модели, полученные для первых t элементов вектора у и строк матрицы X. Обозначим эти оценки как вектор a t=(a0t, a1t,..., an t)¢ , t> п+1. Заметим, что эти оценки с учетом результирующего выражения МНК a t=( X t¢ X t)–1 X t¢ у t можно представить в виде произведения двух сомножителей – матрицы F t–1=( X t¢ X t)–1 и вектора g t= X t¢ у t, где X t – матрица значений факторов, образованная по первым t строкам матрицы X и у t – вектор, образованный по первым элементам t вектора у. Имея в виду правило умножения матрицы на вектор-столбец, вектор g t+ 1 можно представить в следующем виде: g t+1= g t+D g t, (4.1)
где D g t – корректирующая поправка к вектору g t, образованная произведением транспонированной t+1-й строки матрицы X ¢ (t+1-го столбца матрицы X ¢ ) на t+1-й элемент вектора у :
D g t = × уt+1. (4.2)
Для матрицы F t+1=( X t+1¢ X t+1) также с учетом операции умножения матриц по правилу строка на столбец можно записать
F t+1= F t+D F t, (4.3)
где D F t – корректирующая поправка к матрице F t, полученная путем умножения транспонированной t+1-й строки матрицы X ¢ (t+1-го столбца матрицы X ) на саму себя, т. е. на t+1-й столбец матрицы X: D F t = × . (4.4)
Заметим, то операция (4.3) не дает возможности непосредственно получить матрицу F t+1–1, обратную матрице F t+1. Для ее определения воспользуемся леммой об обращении матриц, которая может быть представлена в виде следующего выражения:
F t+ 1–1= F t–1– F t–1 × (1+ × F t–1 × )–1 × F t–1. (4.5)
Поскольку выражение (1+ × F t–1× ) является скаляром (как результат умножения строки на столбец F t–1× ), то матрица F t+1–1 на основании выражения (4.5) определяется как разность двух матриц
F t+ 1–1= F t–1–D F t–1, (4.6)
где D F t–1= F t–1× (1+ × F t–1× )-1 × F t–1 – поправка к матрице F t–1, полученная лишь с помощью процедур умножения матриц и векторов по правилу “строка на столбец”. Для доказательства справедливости выражения (4.5) умножим матрицу F t+1 (выражение (4.3)) с учетом (4.4) слева на F t+1–1 и справа на F t–1. Получим:
F t–1= F t+1–1 + F t+1–1 F t–1 . (4.7)
Далее умножим выражение (4.7) справа на вектор-столбец и вынесем сомножитель F t+1–1 . Получим:
F t–1 × = F t+1–1 (1+ × F t–1 × ). (4.8)
Выражение (4.8), в свою очередь, умножим справа на вектора × F t–1. В результате получим
F t+1–1 ¢ × F t–1= = F t–1 × (1+ × F t–1 × ) -1 × F t–1. (4.9)
Конечный результат леммы (4.5) получим путем подстановки в (4.9) вместо матрицы F t+1–1 ¢ × F t–1 ее эквивалента F t–1– F t+ 1–1 из выражения (4.7). Используем лемму (4.5) для определения уточненного вектора оценок a t+1 коэффициентов линейной эконометрической модели. Для этого обозначим через R t+1 следующий сомножитель-вектор:
R t+1= F t–1× (1+ × F t–1 × )-1. (4.10)
С учетом (4.10) вместо (4.5) можем записать
F t+1–1= F t–1– R t+ 1 F t–1. (4.11)
Сопоставляя выражения (4.11) и (4.7), непосредственно имеем
R t+1= F t+ 1–1 × . (4.12)
Поскольку вектор a t+1 может быть определен как a t+1= F t+1–1× g t+1= F t+1–1( g t+ × уt+1)= F t+ 1–1× g t+ F t–1 × × уt+1, (4.13)
то с учетом (4.11) после подстановки (4.12) в (4.13) получим a t+1= a t+ R t+1(уt+1– × a t) (4.14) или a t+1= a t+D a t. (4.15)
Заметим, что выражение уt+1– × a t = представляет собой ошибку модели в момент t+1, полученную для модели, построенной по t точкам. Иными словами, в данном случае значение характеризует как бы ошибку прогноза, поскольку произведение × a t= рассматривается как прогнозное значение величины у в момент t+1, полученное на основе модели, построенной с использованием информации за период (1, t), и прогнозного фона, определенного значениями факторов х1,..., хп для момента t+1, а значение уt+1 – фактическое значение переменной у в момент t+1. Таким образом, выражения (4.14) и (4.15) определяют оценку вектора a t+1 параметров эконометрической модели, построенной по данным периода (1, t+1), как сумму оценок этого же вектора, но построенного по данным периода (1, t), т. е. a t, и корректирующего слагаемого, определенного как произведение корректирующего множителя R t+1 на ошибку прогноза . Вектор a t можно интерпретировать как априорную информацию, а вектор D a t из выражения (4.15) как поправку, полученную на основе апостериорных данных. Вследствие этого рассмотренная рекуррентная процедура отражает байесовский подход к получению оценок коэффициентов эконометрической модели. Из изложенного материала непосредственно вытекает, что для реализации рекуррентной процедуры оценок параметров линейной эконометрической модели в условиях мультиколлинеарности независимых переменных в периоде (1, Т) необходимо в качестве исходной информации иметь “хорошо обусловленную” матрицу F t, к которой несложно применить операцию обращения. Ее можно получить, если линейная зависимость между факторами хi, i=1, 2,..., п в период (1, t) будет значительно слабее, чем в период (1, Т). Если же подобные взаимосвязи между факторами не ослабевают с уменьшением временного интервала, то для решения проблемы получения оценок коэффициентов линейной эконометрической модели с помощью рекуррентной процедуры может быть использовано некоторое приближение матрицы F t. Например, матрицу F t можно заменить матрицей F t следующего вида:
F t=( F t + Е × d)=( X t¢ X t+ Е × d), (4.16)
где d – некоторый скаляр, добавляемый к диагональным элементам матрицы F t = X t¢ X t с целью облегчения операции получения обратной матрицы F t–1. В этом случае вектор коэффициентов a t определяется из выражения a t=( X t¢ X t+ Е × d)–1 X t¢ у, (4.17)
которое называют гребневым МНК, а полученные на его основе оценки коэффициентов модели – гребневыми оценками. Недостатком гребневых оценок является их смещенность, которая увеличивается с ростом уровня константы d. Однако это смещение для интервала (1, t) можно свести к минимуму путем подбора минимально достаточного значения d. Кроме того, в ходе рекуррентного метода оценивания для моментов времени t+1, t+2,..., Т величина смещения также уменьшается. Если это необходимо, то рекуррентные методы могут применяться и в рамках обобщенного МНК или взвешенной эконометрической модели. Для этого процедуру рекуррентного оценивания необходимо применить к преобразованным исходным данным. Метод главных компонент Метод главных компонент является одним из самых эффективных вычислительных средств, позволяющих оценить коэффициенты эконометрической модели при плохой обусловленности матрицы ( X ¢ X ), вызванной сильной корреляционной зависимостью между некоторыми объясняющими переменными. Однако, как это будет показано далее в этом разделе, использование данного метода обычно ведет к потере части информации, содержащейся в матрице X, что, в свою очередь, является причиной того, что построенная на его основе модель может не вполне адекватно отражать закономерности рассматриваемых явлений. Вместе с тем, вычислительные преимущества метода главных компонент достаточно очевидны, что обусловливает его популярность в эконометрических исследованиях самого широкого круга процессов, особенно в ситуациях, когда число независимых переменных достаточно велико и даже не слишком значительные корреляции между ними делают матрицу X ¢ X плохо обусловленной. Основная идея метода главных компонент состоит в замене объясняющих переменных xi, i=1, 2,..., n на новые переменные zj, j=1, 2,..., k; k£ n, которые, с одной стороны, свободны от недостатков, вызванных корреляционной зависимостью, а, с другой, – содержат в себе максимально возможную долю информации “старых” переменных xi. Обычно метод главных компонент работает с центрированными переменными (см. раздел 1.1, выражение (1.13)). С учетом этого эконометрическая модель с центрированными переменными определяется выражением (1.10), в котором свободный коэффициент a0 отсутствует, т. е.
где, напоминаем, центрированные переменные определяются как и их математические ожидания равны нулю, т. е. i=1, 2,..., n. Таким образом, матрица определяется следующимвыражением: =
Выражение является мерой изменчивости переменной xi относительно ее среднего значения на интервале (1, Т). Аналогично, выражение определяет взаимную изменчивость переменных xi и xr на рассматриваемом интервале. Несложно заметить, что, если разделить эти изменчивости на Т–1, то получим дисперсию переменной xi и ковариацию переменных xi и xr соответственно. Таким образом, сумма диагональных элементов матрицы в данном случае содержит в себе всю информацию относительно изменчивости включен ных в исходную модель переменных xi. Эта сумма называется следом матрицы и обычно обозначается как tr( ). Главные компоненты (новые переменные zjt) формируются как линейные комбинации “старых центрированных переменных” с учетом введения для них двух следующих принципиальных ограничений. 1. Полная совокупность главных компонент должна содержать в себе всю изменчивость переменных xi, i=1, 2,..., n. 2. Главные компоненты должны быть ортогональны между собой, т. е. для любой пары компонент j и r, j¹ r должно выполняться соотношение
Запишем линейное представление главных компонент через центрированные переменные в следующем виде:
Заметим, что поскольку то для всех j=1, 2,..., k. С учетом этого выражение (4.20) можно интерпретировать в том смысле, что взаимная изменчивость переменных zj и zr равна нулю. В матричной форме выражение (4.21) запишем следующим образом: z 1= b 1, (4.22)
где z 1=(z11,..., z1T)¢ – вектор-столбец значений z1t первой компоненты в моменты t; b 1=(b11,..., b1n)¢ – вектор-столбец коэффициентов линейной зависимости, выражающей связь первой компоненты со значениями центрированных переменных в моменты t=1, 2,..., Т; – матрица центрированных переменных , i=1, 2,..., n, в которой столбец, состоящий из единиц, отсутствует. С учетом выражения (4.22) сумма квадратов элементов z1t, т. е. , характеризующая изменчивость первой главной компоненты, выражается следующим образом:
( z 1¢, z 1)= b 1¢ b 1. (4.23)
Определим неизвестный вектор коэффициентов b 1 таким образом, чтобы первая главная компонента вобрала в себя максимальную долю изменчивости, содержащейся в матрице , но при условии, что сами значения коэффициентов не будут влиять на эту характеристику. Это можно сделать введя нормирующее ограничение на элементы вектора b 1, которое выражается следующим соотношением
( b 1¢, b 1)=b112+b122+...+b1n2=1. (4.24)
Очевидно, что при выполнении условия (4.24) уровень изменчивости ( z 1¢, z 1) не сможет превзойти изменчивость всей матрицы . Задача максимизации квадратичной формы (4.23) при условии (4.24) может быть решена на основе метода множителей Лагранжа, согласно которому искомое решение, т. е. вектор b 1, является значением аргумента, максимизирующим следующий функционал:
f 1= b 1¢ b 1 –m1( b 1¢ b 1 –1), (4.25)
где m 1 – множитель Лагранжа. Исходя из условия оптимума ¶ji /¶ b i=0, дифференцируя правую часть (4.25) по вектору b 1 с учетом очевидного условия ¶mi /¶ b i =0, получим
( )× b 1=m1 b 1. (4.26)
Из равенства (4.26) следует, что m1 – максимальное собственное число (перронов корень), положительно определенной матрицы ( ), а b 1 – соответствующий ему собственный вектор, координаты которого должны удовлетворять соотношению (4.24). Аналогичным образом значения второй главной компоненты в моменты t=1, 2,..., Т определим как линейную комбинацию независимых переменных , i=1, 2,..., n, что может быть выражено равенством:
z 2= b 2, (4.27)
где z 2=(z21, z22,..., z2T)¢; b 2=(b21, b22,..., b2n)¢. Неизвестные коэффициенты-компоненты вектора b 2 определим из (4.27) с учетом трех отмеченных выше условий. Компонента z 2 должна вобрать в себя максимальную долю изменчивости матрицы , оставшейся после компоненты z 1, вектора z 1 и z 2 должны быть ортогональны друг другу, а координаты вектора b 2 должны быть нормированы согласно соотношению типа (4.24). Сочетание этих условий соответствует постановке задачи максимизации квадратичной формы
b 2¢ b 2®max (4.28)
при ограничениях
( b 2¢, b 1)=0. (4.30)
При этом отметим, что вид функционала (4.28) вытекает из определения изменчивости компоненты z 2 как скалярного произведения ( z 2¢, z 2)= b 2¢ b 2, выражение (4.29) является аналогом условия (4.24), а равенство (4.30) является следствием условия ортогональности компонент z 1 и z 2 . В самом деле, условие ортогональности z 1 и z 2 можно представить с учетом свойства (4.26) в следующем виде:
0=( z 2¢, z 1)= b 2¢ b 1 =m1( b 2¢, b 1). (4.31)
Из (4.31) непосредственно следует ограничение (4.30). Оптимизационная задача (4.28)–(4.30) также решается с помощью метода множителей Лагранжа как задача безусловной максимизации следующей квадратичной формы:
f2= b 2¢ b 2 –m2( b 2¢ b 2–1)–h 1( b 2¢ b 1 –0), (4.32)
где m2 и h1 – множители Лагранжа. Условие максимума (4.32) приводит к следующему выражению: ¶j 2 /¶ b 2=2 b 2–2m2 b 2–h1 b 1=0. (4.33)
Несложно показать, что множитель h1=0. Для этого умножим равенство (4.33) слева на b 1¢. В результате
2 b 1¢ b 2 –2m 2( b 1¢ b 2)–h1( b 1¢ b 1)=0. (4.34)
Поскольку
b 1¢ = b 1=m1 b 1, ( b 1¢, b 2)=0 и ( b 1¢, b 1)=1,
то из условия (4.34) непосредственно следует, что h 1= 0. В этом случае выражение (4.33) можно представить в виде аналогичном (4.26): b 2=m2 b 2. (4.35)
Из (4.35) следует, что множитель Лагранжа m 2 является вторым по величине собственным корнем матрицы ( ) и положительным числом (поскольку у положительно определенной матрицы все собственные числа положительные). Этому собственному числу соответствует собственный вектор b 2, координаты которого удовлетворяют условию (4.29). Продолжение процесса формирования главных компонент как линейных комбинаций независимых переменных приводит к следующему результату. Коэффициенты этих линейных комбинаций являются нормированными собственными векторами b 1, b 2,..., b n матрицы , которым соответствуют собственные числа m 1, m 2,..., m n, удовлетворяющие соотношению m1> m 2 ³ m3 ³...³ m n. (4.36)
Объединим вектора-столбцы b i, i=1, 2,..., n в матрицу следующего вида: В =( b 1, b 2,..., b n). (4.37)
Тогда матрица значений главных компонент Z в общем случае, имеющая размер n´ Т определяется согласно следующему выражению: Z = В, (4.38)
матрица Z ¢ Z (аналог матрицы ) с учетом свойств ортогональности компонент и нормированности векторов b i, i=1, 2,..., n имеет следующий вид: Z ¢ Z = В ¢ В = . (4.39)
Заметим, что tr Z ¢ Z, т. е. является следом матрицы Z ¢ Z и определяет общую изменчивость главных компонент. Можно формально показать, что tr( Z ¢ Z )=tr( ), (4.40)
т. е. изменчивость переменных , i=1, 2,..., n равна изменчивости главных компонент zj, j=1, 2,..., k. При доказательстве равенства (4.40) будем использовать два результата теории матриц. Первый из них относится к свойствам матрицы В. Из условий типа (4.26), (4.29) и (4.30), определяющих свойства нормированности векторов b i, i=1, 2,..., n; и их ортогональности, следует, что В ¢ В = Е. (4.41)
Таким образом, В ¢ = В –1 и для таких матриц справедливым является следующее равенство: ВВ ¢ = Е. (4.42)
Из последнего результата вытекают определенные свойства следов матриц, которые могут быть сформулированы следующим образом: для произвольной матрицы А имеет место равенство следов матриц А ¢ А и АА ¢, т. е. tr( А ¢ А )=tr( АА ¢ ). (4.43)
Как частный случай равенства (4.43) можно рассматривать следующий результат: скалярное произведение вектора-строки х ¢ на вектор-столбец х равно следу матрицы, полученной путем умножения вектора-столбца х на вектор-строку х ¢. Иными словами,
( х ¢ х )= =tr( хх ¢ ), (4.44)
где хi – координаты вектора х. С учетом свойств (4.42) и (4.44) имеем tr( Z ¢ Z )= = tr( В ¢ В )=tr( В ¢ В )=tr( )= = . (4.45)
Таким образом, отношение можно интерпретировать как вклад (долю) компоненты zj в общую изменчивость независимых факторов , i=1, 2,..., n. Иными словами, справедливым является следующее равенство:
(4.46)
Условие (4.46) является ключевым при решении вопроса о том, сколько главных компонент целесообразно включить в эконометрическую модель. Как уже было отмечено выше, в том случае, когда матрица ( ) является плохо обусловленной, но ее определитель отличен от нуля, ½ ½ ¹ 0, теоретически общее число главных компонент совпадает с числом объясняющих переменных п. Однако информативная ценность главных компонент различна. Компоненты с большими номерами, как правило, определяют лишь незначительную долю общей изменчивости переменных и их обычно не включают в эконометрическую модель. Решение о том, на какой компоненте целесообразно остановиться может быть принято на основе анализа кумулятивной переменной I(mr), определяемой как I(mr) = . (4.47) Если I(mr) определяет достаточную долю изменчивости переменных и эта доля для компоненты с номером r+1 рассматривается как относительно небольшая (на практике – менее процента от общей изменчивости), то компоненты с номерами r+1, r+2,..., k в модель обычно не включают (см. рис. 4.1), ограничиваясь первыми r номерами из них. На рис. 4.1 изображен вариант изменения кумулятивной изменчивости главных компонент. Из графика непосредственно видно, что первые четыре компоненты определяют около 95% общей изменчивости переменных , так что доля 5-й и последующих компонент явно незначительна. В этом случае в модель целесообразно включить лишь первые четыре компоненты. В том случае, если ½ ½ = 0, матрица имеет ранг r< n, у нас имеется лишь r отличных от нуля собственных чисел, которым соответствуют r главных компонент, определяющих суммарную изменчивость переменных , i=1, 2,..., n. Тогда число включаемых в модель компонент не превосходит числа r. В исследованиях реальных процессов число главных компонент обычно существенно меньше количества независимых переменных.
I(mr)
1 0, 9 0, 8 0, 7 0, 6 0, 5
1 2 3 4 5 6 7 8 9 10 k Рис.4.1. График изменения кумулятивной Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 786; Нарушение авторского права страницы