Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ГЛАВА IV. ПОСТРОЕНИЕ МОДЕЛЕЙ В УСЛОВИЯХ МУЛЬТИКОЛЛИНЕАРНОСТИ НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ



ГЛАВА IV. ПОСТРОЕНИЕ МОДЕЛЕЙ В УСЛОВИЯХ МУЛЬТИКОЛЛИНЕАРНОСТИ НЕЗАВИСИМЫХ ПЕРЕМЕННЫХ

В данной главе будут рассмотрены некоторые приемы и методы оценки коэффициентов эконометрической модели в условиях сильной корреляционной зависимости (мультиколлинеарности) между объясняющими переменными.

Как было отмечено в разделе 2.1, существование сильной линейной зависимости между переменными, входящими в правую часть эконометрической модели и характеризующейся близостью значений коэффициентов парной корреляции ряда столбцов матрицы Х к единице, вызывает целый ряд проблем при оценке коэффициентов этой модели.

Во-первых, это явление делает матрицу X ¢ X плохо обусловленной (ее детерминант становится близким, а в пределе равным нулю), и в этом случае МНК и ММП как методы оценки коэффициентов модели не могут быть использованы*. Во-вторых, плохая обусловленность матрицы X ¢ X своим следствием, как правило, имеет ухудшение точности оценок коэффициентов модели, рост их дисперсий. В-третьих, оценки коэффициентов модели становятся чрезвычайно чувствительными к незначительным изменениям исходных данных (значений элементов вектора у и матрицы X ), а также к ошибкам округлений числовых данных расчетов, неизбежным при обращении матрицы X ¢ X. Иными словами, незначительные изменения в исходных данных или округления результатов промежуточных расчетов вызывают резкие скачки в значениях оценок. Это говорит о неустойчивости оценок параметров моделей по отношению к исходным данным, о низкой обоснованности построенного варианта эконометрической модели, о ее неадекватности описываемому ею процессу.

Вместе с тем, на практике решать проблему мультиколлинеарности путем исключения части взаимосвязанных между собой независимых переменных часто бывает нецелесообразно, поскольку, например, их взаимосвязь может отражать явление ложной корреляции, а не вытекать из содержания отображаемых ими явлений. При этом каждая из этих переменных может быть чрезвычайно важна для выражения закономерностей развития независимой переменной.

Невозможность использования «классических» подходов при построении эконометрических моделей в условиях плохой обратимости матрицы ( X ¢ X ) обусловливает необходимость применения при оценке их параметров специальных процедур и методов, которые позволяют снизить отрицательное влияние высокой корреляции между объясняющими переменными на точность и достоверность получаемых оценок.

Метод главных компонент

Метод главных компонент является одним из самых эффективных вычислительных средств, позволяющих оценить коэффициенты эконометрической модели при плохой обусловленности матрицы ( X ¢ X ), вызванной сильной корреляционной зависимостью между некоторыми объясняющими переменными. Однако, как это будет показано далее в этом разделе, использование данного метода обычно ведет к потере части информации, содержащейся в матрице X, что, в свою очередь, является причиной того, что построенная на его основе модель может не вполне адекватно отражать закономерности рассматриваемых явлений.

Вместе с тем, вычислительные преимущества метода главных компонент достаточно очевидны, что обусловливает его популярность в эконометрических исследованиях самого широкого круга процессов, особенно в ситуациях, когда число независимых переменных достаточно велико и даже не слишком значительные корреляции между ними делают матрицу X ¢ X плохо обусловленной.

Основная идея метода главных компонент состоит в замене объясняющих переменных xi, i=1, 2,..., n на новые переменные zj, j=1, 2,..., k; k£ n, которые, с одной стороны, свободны от недостатков, вызванных корреляционной зависимостью, а, с другой, – содержат в себе максимально возможную долю информации “старых” переменных xi. Обычно метод главных компонент работает с центрированными переменными (см. раздел 1.1, выражение (1.13)). С учетом этого эконометрическая модель с центрированными переменными определяется выражением (1.10), в котором свободный коэффициент a0 отсутствует, т. е.

 

 

где, напоминаем, центрированные переменные определяются как и их математические ожидания равны нулю, т. е. i=1, 2,..., n.

Таким образом, матрица определяется следующимвыражением:

=

Выражение является мерой изменчивости переменной xi относительно ее среднего значения на интервале (1, Т). Аналогично, выражение определяет взаимную изменчивость переменных xi и xr на рассматриваемом интервале. Несложно заметить, что, если разделить эти изменчивости на Т–1, то получим дисперсию переменной xi и ковариацию переменных xi и xr соответственно. Таким образом, сумма диагональных элементов матрицы в данном случае содержит в себе всю информацию относительно изменчивости включен ных в исходную модель переменных xi. Эта сумма называется следом матрицы и обычно обозначается как tr( ).

Главные компоненты (новые переменные zjt) формируются как линейные комбинации “старых центрированных переменных” с учетом введения для них двух следующих принципиальных ограничений.

1. Полная совокупность главных компонент должна содержать в себе всю изменчивость переменных xi, i=1, 2,..., n.

2. Главные компоненты должны быть ортогональны между собой, т. е. для любой пары компонент j и r, j¹ r должно выполняться соотношение

 

 

Запишем линейное представление главных компонент через центрированные переменные в следующем виде:

Заметим, что поскольку то для всех j=1, 2,..., k. С учетом этого выражение (4.20) можно интерпретировать в том смысле, что взаимная изменчивость переменных zj и zr равна нулю.

В матричной форме выражение (4.21) запишем следующим образом:

z 1= b 1, (4.22)

 

где z 1=(z11,..., z1T)¢ – вектор-столбец значений z1t первой компоненты в моменты t; b 1=(b11,..., b1n)¢ – вектор-столбец коэффициентов линейной зависимости, выражающей связь первой компоненты со значениями центрированных переменных в моменты t=1, 2,..., Т; – матрица центрированных переменных , i=1, 2,..., n, в которой столбец, состоящий из единиц, отсутствует.

С учетом выражения (4.22) сумма квадратов элементов z1t, т. е. , характеризующая изменчивость первой главной компоненты, выражается следующим образом:

 

( z 1¢, z 1)= b 1¢ b 1. (4.23)

 

Определим неизвестный вектор коэффициентов b 1 таким образом, чтобы первая главная компонента вобрала в себя максимальную долю изменчивости, содержащейся в матрице , но при условии, что сами значения коэффициентов не будут влиять на эту характеристику. Это можно сделать введя нормирующее ограничение на элементы вектора b 1, которое выражается следующим соотношением

 

( b 1¢, b 1)=b112+b122+...+b1n2=1. (4.24)

 

Очевидно, что при выполнении условия (4.24) уровень изменчивости ( z 1¢, z 1) не сможет превзойти изменчивость всей матрицы .

Задача максимизации квадратичной формы (4.23) при условии (4.24) может быть решена на основе метода множителей Лагранжа, согласно которому искомое решение, т. е. вектор b 1, является значением аргумента, максимизирующим следующий функционал:

 

f 1= b 1¢ b 1 m1( b 1¢ b 1 –1), (4.25)

 

где m 1 – множитель Лагранжа.

Исходя из условия оптимума ¶ji / b i=0, дифференцируя правую часть (4.25) по вектору b 1 с учетом очевидного условия ¶mi / b i =0, получим

 

( b 1=m1 b 1. (4.26)

 

Из равенства (4.26) следует, что m1 – максимальное собственное число (перронов корень), положительно определенной матрицы ( ), а b 1 – соответствующий ему собственный вектор, координаты которого должны удовлетворять соотношению (4.24).

Аналогичным образом значения второй главной компоненты в моменты t=1, 2,..., Т определим как линейную комбинацию независимых переменных , i=1, 2,..., n, что может быть выражено равенством:

 

z 2= b 2, (4.27)

 

где z 2=(z21, z22,..., z2T)¢; b 2=(b21, b22,..., b2n)¢.

Неизвестные коэффициенты-компоненты вектора b 2 определим из (4.27) с учетом трех отмеченных выше условий. Компонента z 2 должна вобрать в себя максимальную долю изменчивости матрицы , оставшейся после компоненты z 1, вектора z 1 и z 2 должны быть ортогональны друг другу, а координаты вектора b 2 должны быть нормированы согласно соотношению типа (4.24).

Сочетание этих условий соответствует постановке задачи максимизации квадратичной формы

 

b 2¢ b 2®max (4.28)

 

при ограничениях

 

( b 2¢, b 1)=0. (4.30)

 

При этом отметим, что вид функционала (4.28) вытекает из определения изменчивости компоненты z 2 как скалярного произведения ( z 2¢, z 2)= b 2¢ b 2, выражение (4.29) является аналогом условия (4.24), а равенство (4.30) является следствием условия ортогональности компонент z 1 и z 2 .

В самом деле, условие ортогональности z 1 и z 2 можно представить с учетом свойства (4.26) в следующем виде:

 

0=( z 2¢, z 1)= b 2¢ b 1 =m1( b 2¢, b 1). (4.31)

 

Из (4.31) непосредственно следует ограничение (4.30).

Оптимизационная задача (4.28)–(4.30) также решается с помощью метода множителей Лагранжа как задача безусловной максимизации следующей квадратичной формы:

 

f2= b 2¢ b 2 m2( b 2¢ b 2–1)–h 1( b 2¢ b 1 –0), (4.32)

 

где m2 и h1 – множители Лагранжа.

Условие максимума (4.32) приводит к следующему выражению:

¶j 2 / b 2=2 b 2–2m2 b 2h1 b 1=0. (4.33)

 

Несложно показать, что множитель h1=0. Для этого умножим равенство (4.33) слева на b 1¢. В результате

 

2 b 1¢ b 2 –2m 2( b 1¢ b 2)–h1( b 1¢ b 1)=0. (4.34)

 

Поскольку

 

b 1¢ = b 1=m1 b 1, ( b 1¢, b 2)=0 и ( b 1¢, b 1)=1,

 

то из условия (4.34) непосредственно следует, что h 1= 0.

В этом случае выражение (4.33) можно представить в виде аналогичном (4.26):

b 2=m2 b 2. (4.35)

 

Из (4.35) следует, что множитель Лагранжа m 2 является вторым по величине собственным корнем матрицы ( ) и положительным числом (поскольку у положительно определенной матрицы все собственные числа положительные). Этому собственному числу соответствует собственный вектор b 2, координаты которого удовлетворяют условию (4.29).

Продолжение процесса формирования главных компонент как линейных комбинаций независимых переменных приводит к следующему результату. Коэффициенты этих линейных комбинаций являются нормированными собственными векторами b 1, b 2,..., b n матрицы , которым соответствуют собственные числа m 1, m 2,..., m n, удовлетворяющие соотношению

m1> m 2 ³ m3 ³...³ m n. (4.36)

 

Объединим вектора-столбцы b i, i=1, 2,..., n в матрицу следующего вида:

В =( b 1, b 2,..., b n). (4.37)

 

Тогда матрица значений главных компонент Z в общем случае, имеющая размер n´ Т определяется согласно следующему выражению:

Z = В, (4.38)

 

матрица Z ¢ Z (аналог матрицы ) с учетом свойств ортогональности компонент и нормированности векторов b i, i=1, 2,..., n имеет следующий вид:

 
 


Z ¢ Z = В ¢ В = . (4.39)

 

Заметим, что tr Z ¢ Z, т. е. является следом матрицы Z ¢ Z и определяет общую изменчивость главных компонент. Можно формально показать, что

tr( Z ¢ Z )=tr( ), (4.40)

 

т. е. изменчивость переменных , i=1, 2,..., n равна изменчивости главных компонент zj, j=1, 2,..., k.

При доказательстве равенства (4.40) будем использовать два результата теории матриц. Первый из них относится к свойствам матрицы В. Из условий типа (4.26), (4.29) и (4.30), определяющих свойства нормированности векторов b i, i=1, 2,..., n; и их ортогональности, следует, что

В ¢ В = Е. (4.41)

 

Таким образом, В ¢ = В –1 и для таких матриц справедливым является следующее равенство:

ВВ ¢ = Е. (4.42)

 

Из последнего результата вытекают определенные свойства следов матриц, которые могут быть сформулированы следующим образом: для произвольной матрицы А имеет место равенство следов матриц А ¢ А и АА ¢, т. е.

tr( А ¢ А )=tr( АА ¢ ). (4.43)

 

Как частный случай равенства (4.43) можно рассматривать следующий результат: скалярное произведение вектора-строки х ¢ на вектор-столбец х равно следу матрицы, полученной путем умножения вектора-столбца х на вектор-строку х ¢. Иными словами,

 

( х ¢ х )= =tr( хх ¢ ), (4.44)

 

где хi – координаты вектора х.

С учетом свойств (4.42) и (4.44) имеем

tr( Z ¢ Z )= = tr( В ¢ В )=tr( В ¢ В )=tr( )=

= . (4.45)

 

Таким образом, отношение можно интерпретировать как вклад (долю) компоненты zj в общую изменчивость независимых факторов , i=1, 2,..., n. Иными словами, справедливым является следующее равенство:

 

(4.46)

 

Условие (4.46) является ключевым при решении вопроса о том, сколько главных компонент целесообразно включить в эконометрическую модель. Как уже было отмечено выше, в том случае, когда матрица ( ) является плохо обусловленной, но ее определитель отличен от нуля, ½ ½ ¹ 0, теоретически общее число главных компонент совпадает с числом объясняющих переменных п. Однако информативная ценность главных компонент различна. Компоненты с большими номерами, как правило, определяют лишь незначительную долю общей изменчивости переменных и их обычно не включают в эконометрическую модель. Решение о том, на какой компоненте целесообразно остановиться может быть принято на основе анализа кумулятивной переменной I(mr), определяемой как

I(mr) = . (4.47)

Если I(mr) определяет достаточную долю изменчивости переменных и эта доля для компоненты с номером r+1 рассматривается как относительно небольшая (на практике – менее процента от общей изменчивости), то компоненты с номерами r+1, r+2,..., k в модель обычно не включают (см. рис. 4.1), ограничиваясь первыми r номерами из них.

На рис. 4.1 изображен вариант изменения кумулятивной изменчивости главных компонент. Из графика непосредственно видно, что первые четыре компоненты определяют около 95% общей изменчивости переменных , так что доля 5-й и последующих компонент явно незначительна. В этом случае в модель целесообразно включить лишь первые четыре компоненты.

В том случае, если ½ ½ = 0, матрица имеет ранг r< n, у нас имеется лишь r отличных от нуля собственных чисел, которым соответствуют r главных компонент, определяющих суммарную изменчивость переменных , i=1, 2,..., n. Тогда число включаемых в модель компонент не превосходит числа r. В исследованиях реальных процессов число главных компонент обычно существенно меньше количества независимых переменных.

 

I(mr)

 

1

0, 9

0, 8

0, 7

0, 6

0, 5

 

 
 


1 2 3 4 5 6 7 8 9 10 k

Рис.4.1. График изменения кумулятивной

Вопросы к главе IV

1. Опишите процедуру оценки параметров экономерической модели с помощью рекуррентных методов?

2. В чем метода главных компонент?

3. Каковы проблемы использования моделей с главными компонентами?

4. В чем суть метода Ширли Алмон?

Упражнения к главе IV

Задание 4.1

Для линейного двухфакторного уравнения регрессии

 

yt =a0+ a1 х1t + a2 х2t +et (t=1,..., Т)

 

имеется следующая таблица данных:

х1t
х2t
yt

 

Требуется:

1. Определить коэффициент корреляции r12и матрицу ( X *¢ X *)–1.

2. Провести следующее преобразование факторов: u1t = х1t и u2t= х1t х2t и определить коэффициент корреляции r12(u), также матрицу ( U *¢ U *)-1.

3. Показать, что с точки зрения прогнозирования исходное и преобразованное уравнение эквивалентны, т. е. для каждой пары значений экзогенных переменных (х10, х20) дают одинаковые точечные и интервальные прогнозы математического ожидания.

 

Задание 4.2

Имеется линейное двухфакторное уравнение регрессии

 

yt =a0+ a1 х1t + a2 х2t +et (t=1,..., Т).

Требуется:

1. Рассмотреть в общем виде трендовое выравнивание как метод устранения коллинеарности.

2. Показать, что при трендовом выравнивании оценки параметров регрессии остаются неизменными.

 

Задание 4.3

Для линейного трехфакторного уравнения регрессии

 

yt =a0+ a1 х1t + a2 х2t + a3 х3t +et (t=1,..., Т),

 

имеются следующие данные:

х1t 10, 3 14, 6 11, 4 17, 1 10, 6
х2t 20, 8 28, 0 23, 0 30, 5 21, 7
х3t 4, 1 20, 3 9, 8 8, 1 17, 7
yt 40, 0 80, 0 55, 0 58, 0 70, 0

 

Требуется:

1. Определить корреляционную матрицу R и содержащийся в этих данных размер коллинеарности как det(R).

2. Рассчитать размер коллинеарности, в случае если из уравнения выводится переменная х2.

3. Учесть дополнительную внешнюю информацию, что a1=1, 5a2 и определить размер коллинеарности в этом случае.

4. Построить точечный прогноз математического ожидания целевой переменной у0 для значений экзогенных переменных (х10, х20, х30)¢ =(8, 0; 16, 0; 6, 0)¢

а) при использовании исходного уравнения;

б) при отбрасывании из уравнения экзогенной переменной х2;

в) при использовании внешней информации из п.3.

 

Задание 4.4

Для линейного трехфакторного уравнения регрессии

 

yt =a0+ a1 х1t + a2 х2t + a3 х3t +et (t=1,..., Т),

 

имеются данные из задания 4.3.

Требуется:

1. Определить гребневые оценки параметров для гребневой константы, равной 0, 5 и 0, 8.

2. Построить точечный прогноз математического ожидания целевой переменной у0 для значений экзогенных переменных (х10, х20, х30)¢ =(8, 0; 16, 0; 6, 0)¢ по обоим оцененным уравнениям.

Задание 4.5

Для линейного трехфакторного уравнения регрессии

 

yt =a0+ a1 х1t + a2 х2t + a3 х3t +et (t=1,..., Т),

 

имеются данные из задания 4.3.

Требуется:

1. Оценить уравнение с помощью метода главных компонент, если известно, что первые две главные компоненты учитывают 98, 97% изменчивости матрицы факторов и формируются следующим образом:

 

 

2. Построить точечный прогноз математического ожидания целевой переменной у0 для значений экзогенных переменных (х10, х20, х30)¢ =(8, 0; 16, 0; 6, 0)¢

Задание 4.6

Для линейного уравнения с лаговыми независимыми переменными

yt =a0 хt + a1 хt–1 + a2 хt–2 +... +et (t=1,..., Т)

 

имеются следующие данные (см. табл. 4.1).

Таблица 4.1

хt
yt
хt
yt

 

Требуется:

1. Оценить параметры уравнения с помощью метода Ш. Алмон, если максимальный лаг равен 5, а порядок аппроксимирующего многочлена – 3.

2. Построить ретроспективный точечный прогноз целевой переменной yt.


Вопросы к главе V

1. Какие проблемы возникают при построении моделей с лаговыми переменными?

2. Что представляет собой модель Койка?

3. Перечислите основные подходы к оценке коэффициентов эконометрической модели, содержащей лаговые зависимые переменные?

4. Каковы особенности использования инструментальных переменных в оценках параметров моделей?

Упражнения к главе V

Задание 5.1

Имеется модель с лаговыми эндогенными переменными.

Требуется:

1. Представить модель в общем виде в матричной форме записи

у = Х × a + e

 

и пояснить специфику матрицы Х.

2. Выяснить, какими свойствами должен обладать вектор оценок параметров a

 

 

Исходить из гомоскедастичности и отсутствия автокорреляции ошибок.

3. Дать 3 модели с лаговыми переменными, объясняющие потребление домашних хозяйств. В качестве экзогенной переменной использовать доход.

 

Задание 5.2

Имеется модель Койка

 

 

как частный случай модели с распределенными лагами.

Требуется:

1. Показать, что это уравнение является моделью с лаговыми эндогенными переменными.

2. Показать распределение лагов для g=0, 5 и g=0, 8.

3. Определить средний лаг.

 

Задание 5.3

Имеется следующая модель с распределенными лагами:

 

 

где et ~(0, s2).

Требуется:

1. Определить коэффициенты реакции yt на xt–j–1 для первых трех периодов.

2. Определить веса отдельных хt–j-1для j=0,..., 2 в распределении лагов.

3. Преобразовать модель в уравнение с конечным числом переменных.

 

Задание 5.4

Связь между ВНП и денежной массой исследуется с помощью следующей модели:

 

 

Установлено, что et не коррелированны и гомоскедастичны. Получены оценки a=0, 3 и b=0, 7.

Требуется:

1. Представить исходную модель в виде геометрической модели с распределенными лагами.

2. Определить реакцию дохода в году t0+3, если денежная масса в году t0 увеличилась на 1 единицу.

Стационарные временные ряды

Широкий круг социально-экономических, технических и естественнонаучных процессов часто представляется набором последовательных значений показателя у1, у2,..., уt,..., уТ, зафиксированных в равноотстоящие друг от друга моменты времени t=1, 2,... Т, так что интервал (t, t+1) является постоянным. Этот набор значений уt, t=1, 2,... обычно называется временным рядом (временной серией). Такой ряд представляет собой дискретный временной процесс.

Изменения значений уt во времени в реальной жизни обычно происходят под воздействием каких-либо причин, факторов. Однако в силу их многочисленности, сложности измерения, неразработанности теоретических предположений относительно взаимосвязей с переменной у и т. п. обосновать и построить “подходящую” для описания процесса уt, t=1, 2,... многофакторную эконометрическую модель классического типа не всегда представляется возможным. В результате в отношении ряда уt часто выдвигается предположение, что совокупное влияние этих факторов формирует как бы внутренние закономерности в развитии процесса уt, что дает возможность применить для его описания эконометрическую модель из специфического класса моделей временных рядов.

Модели временных рядов активно применяются в исследованиях динамики значительного числа реальных процессов различной природы. Они часто используются в исследованиях динамики пассажиропотоков, складских запасов, спроса на различные виды продукции, миграционных процессов в человеческом и биологических сообществах, в радиотехнике, анализе химических процессов, моделировании природных событий: динамики числа солнечных пятен, природных катастроф и многих других процессов.

Самое широкое применение модели временных рядов нашли в исследованиях финансовых рынков, в анализе динамики финансовых показателей, прогнозировании цен на различные товары, курсов акций, соотношений курсов валют и т. п.

Пожалуй, общим для всех моделей временных рядов является предположение о том, что текущее значение процесса yt в значительной степени предопределено его предысторией, т. е. величина показателя yt генерируется значениями yt–1, yt–2,... согласно характерным для этого временного ряда закономерностям. Математически это допущение может быть выражено следующим общим уравнением:

 

 

где, как и ранее, et представляет собой ошибку модели в момент t.

Функция f как раз и выражает характер взаимосвязей, сложившихся в рассматриваемом временном ряду уt, t=1, 2,... При удачном подборе этой функции правая “детерминированная” часть выражения (6.1) будет в некотором смысле “близка” к реальным значениям этого ряда. Как и ранее “степень близости” обычно устанавливается по характеристикам и свойствам ряда ошибки et, t=1, 2,... Здесь имеется в виду прежде всего минимальная дисперсия, соответствие белому шуму и т. п.

Для широкого круга процессов функция f имеет линейный вид. Например, Вопросы построения линейных моделей временных рядов и анализа их основных свойств и будут рассмотрены в данной главе.

Линейные модели временных рядов применяются, как правило, для описания стационарных процессов. При этом обычно имеются в виду стационарные процессы второго порядка. Напомним, что стационарный процесс п-го порядка характеризуется постоянными значениями всех своих моментов порядк<


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-03-25; Просмотров: 1286; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.205 с.)
Главная | Случайная страница | Обратная связь