Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Метод инструментальных переменных
Для получения несмещенных (по крайней мере состоятельных) оценок параметров эконометрических моделей в ситуациях, когда имеют место (теоретически допускаются) корреляционные взаимосвязи между независимыми переменными xit и ошибкой et, теория рекомендует подходы и методы, основанные на использовании инструментальных переменных. Напомним, что в тех случаях, когда некоторые столбцы матрицы значений независимых переменных Х и вектор-столбец ошибки e взаимосвязаны между собой, математическое ожидание второго слагаемого в правой части выражения (2.9) отлично от нуля, M[( Х ¢ Х )–1 Х ¢ × e ]¹ 0, и, следовательно, например, оценки МНК параметров модели, определяемые согласно известному выражению а =( Х ¢ Х )–1 Х ¢ × у, оказываются смещенными, поскольку
M[ a – а ]= M[( Х ¢ Х )–1 Х ¢ × e ]¹ 0. (3.51)
Заметим, что появление смещения у оценок МНК всех параметров моделей вызывает присутствие только одной независимой переменной, например, xi, связанной с ошибкой e. В этом случае непосредственно видно, что произведение Х ¢ × e =(0,..., 0, сi, 0,..., 0)¢, где константа стоит на месте, соответствующем i-й переменной, и, таким образом, имеем ( Х ¢ Х )–1¢ × e =сi× (s0i, s1i,..., sni)¢ = =сi× s i, где sji – j-й элемент i-го столбца s i матрицы ( Х ¢ Х )–1. Из полученного результата вытекает, что в соответствии с выражением (2.9) имеем а = a + сi× s i. Из чего следует, что смещенными оказываются все оценки коэффициентов модели. В эконометрике обычно исследуются асимптотические свойства оценок параметров моделей. В этом случае, если в пределе при Т®¥ существует зависимость между столбцами матрицы Х и ошибкой модели e, т. е.
то оценки МНК параметров эконометрической модели являются несостоятельными (а, следовательно, и асимптотически смещенными). Это непосредственно вытекает из того факта, что второе слагаемое в правой части выражения
plim( a )=
отлично от нуля, поскольку из начальных условий (предположений) (2.42) вытекает, что Использование инструментальных переменных теоретически позволяет устранить отрицательные последствия взаимосвязей независимых переменных и ошибки модели e, связанные с несостоятельностью оценок МНК параметров линейных эконометрических моделей. Формально, без излишней строгости, выражение для вектора оценок МНК параметров эконометрической модели с использованием инструментальных переменных может быть получено следующим образом. Предположим, что существуют так называемые “инструментальные” переменные zi, число которых в общем случае совпадает с числом независимых факторов модели хi, i=1, 2,..., n; и при t=1, 2,..., Т, каждая из которых характеризуется нулевыми корреляционными взаимосвязями с ошибкой эконометрической модели e. При заданном Т матрица значений инструментальных переменных Z имеет такой же размер, как матрица Х. Умножим слева векторно-матричное уравнение на матрицу у = Х × a + e на матрицу Z ¢. Получим
Z ¢ у = Z ¢ Х × a + Z ¢ × e, (3.53)
С учетом того, что M[ Z ¢ × e ]=0, умножая выражение (3.53) слева на ( Z ¢ Х )–1, непосредственно имеем
a z =( Z ¢ Х )–1 Z ¢ у, (3.54)
где a z – вектор оценок параметров эконометрической модели, полученный с использованием инструментальных переменных. Результат (3.54) можно получить и традиционным путем. Для этого обозначим у *= Z ¢ у; Х *= Z ¢ Х; e *= Z ¢ × e. В этом случае выражение (3.53) имеет традиционный для эконометрической модели вид:
у *= Х *× a + e *. (3.55)
Используя для модели (3.55) традиционный для МНК критерий минимума суммы квадратов ошибки
s*2=( e *¢, e *)=( e ¢ Z × Z ¢ × e )=( Z ¢ у – Z ¢ Х × a )¢ ( Z ¢ у – Z ¢ Х × a )®min (3.56)
и приравнивая вектор производных показателя s*2 по вектору параметров a к нулю, , непосредственно получим следующее выражение для вектора оценок этих параметров:
a z =( Х ¢ Z Z ¢ Х )–1 Х ¢ ZZ ¢ × у. (3.57)
Далее, принимая во внимание, что произведения матриц Х ¢ Z и Z ¢ Х равны между собой, т. е. Х ¢ Z = Z ¢ Х, выражение (3.57) несложно привести к виду (3.54).
a z=( Х ¢ ZZ ¢ Х )–1 Х ¢ ZZ ¢ × у =( Х ¢ Z )–1( Х ¢ Z )–1 Х ¢ ZZ ¢ × у =( Х ¢ Z )–1 Z ¢ × у = =( Z ¢ Х )–1 Z ¢ × у.
Покажем также, что при наличии у матрица Z размерностью Т´ (п+1) в пределе при Т®¥ следующих свойств:
plim Z ¢ × e )=0; (3.58) plim Z ¢ × Х )= å Z ¢ Х; (3.59) plim Z ¢ × Z )= å Z ¢ Z, (3.60)
где матрицы å ZХ и å ZZ существуют и не вырождены, оценки параметров эконометрической модели, определенные выражением (3.54), являются состоятельными. Для этого, как и при выводе выражения (2.9), подставим вместо вектора у в формулу (3.54) у = Х × a + e. Получим
a z= a +( Z ¢ Х )–1 Z ¢ e, (3.61)
В пределе при Т®¥ имеем
plim a z = a +plim Z ¢ Х )–1× plim Z ¢ e )= a + å –1 Z ¢ Z × 0= a. (3.62)
Обратим внимание на некоторые свойства оценок параметров, полученных с использованием инструментальных переменных на основе выражения (3.54). В частности, отметим, что в общем случае эти оценки являются неэффективными. В самом деле, вид ковариационной матрицы ошибки e *= Z ¢ × e модели (3.53) свидетельствует о наличии в ее ряду автокорреляционных зависимостей даже в том случае, когда эти зависимости отсутствовали у ошибки e:
Cov ( e *)=M[ e *¢, e *]=M[ Z ¢ × e × e ¢ Z )=se( Z ¢ Z ). (3.63)
В этом случае ковариационная матрица оценок a z параметров модели (3.53) имеет следующий вид:
Cov ( a z)=M[( a z – a )( a z – a )¢ ]= M[( Z ¢ Х )–1 Z ¢ e × e ¢ Z ( Z ¢ Х )–1]= =se2( Z ¢ Х )–1 Z ¢ × Z ( Z ¢ Х )–1, (3.64)
где дисперсия ошибки se2 на практике может быть оценена на основании следующего выражения:
В пределе при Т®¥ с учетом предположений (3.59) и (3.60) можно определить асимптотическую ковариационную матрицу оценок a z на основании следующего выражения:
asy.var( a z)= plim[T( a z – a )( a z – a )¢ ]= = plim[T( Z ¢ Х )–1 Z ¢ e × e ¢ Z ( Х ¢ Z )–1]= = plim( Z ¢ Х )–1)plim( Z ¢ e × e ¢ Z )plim( Х ¢ Z )–1= = se2 å –1 Z ¢ Хå Z ¢ Zå –1 Z ¢ Х. (3.66)
Для получения эффективных оценок на базе инструментальных переменных можно использовать обобщенных МНК. Для ковариационной матрицы ошибок модели, определенной выражением (3.63), оценки коэффициентов, полученные с использованием этого метода, определяются на основании следующего выражения, вытекающего из формулы (3.57):
a z.0=( Х ¢ Z ( Z ¢ Z )–1 Z ¢ Х )–1 Х ¢ Z ( Z ¢ Z )–1× у =( Х ¢ Р z Х )–1 Х ¢ Р z× у, (3.67)
где Р z = Z ( Z ¢ Z )––1. Несложно показать, что ковариационная матрица оценок обобщенного МНК для инструментальных переменных имеет следующий вид:
Сov ( a z.0)=se2( Х ¢ Р z Х )–1, (3.68)
где на практике дисперсия ошибки se2 определяется следующим выражением:
Вектор оценок a z.0, полученный на основании формулы (3.67) является асимптотически несмещенным. Это следует из выражения:
a z.0= a +( Х ¢ Р z Х )–1( Х ¢ Р z ε ), (3.70) где ( Х ¢ Р z Х )=( Х ¢ Z )( Z ¢ Z ) –1( Z ¢ X ), ( Х ¢ Р z e )=( Х ¢ Z )( Z ¢ Z ) –1( Z ¢ e ).
Переходя в выражении (3.70) к пределу при Т®¥, с учетом свойств (3.58)–(3.60) получим
plim a z.0= a +( å Х ¢ Zå –1 Z ¢ Zå Z ¢ Х )–1 å Z ¢ Хå –1 Z ¢ Z × 0= a. (3.71)
Однако заметим, что на практике обобщенный МНК для оценки параметров моделей с инструментальными переменными применяется не часто. Это связано с тем, что дисперсии оценок их параметров, полученных на основе выражения (.41), при удачном подборе инструментальных переменных увеличиваются не столь значительно, и такую потерю эффективности во внимание можно не принимать. В самом деле, если инструментальные переменные zi характеризуются достаточно сильной корреляционной связью (коэффициент парной корреляции r z, x®1) с соответствующими независимыми переменными хi, то при одинаковых масштабах этих переменных произведения матриц Z ¢ Z и Z ¢ X будут приблизительно равными между собой и в этом случае, как это следует из выражения (3.64),
Cov ( a z)»se2( Z ¢ Х )–1»se2( Х ¢ Х )–1. (3.72)
И, наоборот, если переменные zi и хi слабо взаимосвязаны между собой, то диагональные элементы матрицы ( Z ¢ Х )–1 в силу того, что определитель ½ Z ¢ Х ½ уменьшается, существенно возрастают. В этом случае при использовании выражения (3.54) за несмещенность оценок приходится платить падением их эффективности. Этот вывод достаточно очевиден при рассмотрении однофакторной модели yt=a0+a1xt+et, при оценке параметров которой используется инструментальная переменная zt. Несложно видеть, что оценка коэффициента a1 в этом случае согласно выражению (3.54) определяется по следующей формуле:
а выборочная дисперсия этой оценки по формуле:
где дисперсия se2 определена выражением типа (3.65) при п=1. Из выражения (3.73) непосредственно видно, что при слабой зависимости между переменными хt и zt его знаменатель уменьшается (в пределе до нуля), и выборочная дисперсия параметра az может стать как угодно большой. Вследствие этого на практике инструментальные переменные zi стремятся выбирать согласно следующему правилу: переменные zi должны иметь сильные корреляционные связи с соответствующими переменными хi и быть независимыми по отношению к ошибке модели e. Выполнение этого правила в эконометрических исследованиях реальных процессов, для которых характерной чертой является корреляционная связь между независимыми факторами и ошибкой, достигается с помощью некоторых специальных приемов, правил формирования инструментальных переменных. Эти правила будут рассмотрены в соответствующих разделах данного учебника (см. главы V и VIII). В заключении данного раздела рассмотрим некоторые особенности формирования матрицы инструментальных переменных Z. Очевидно, что общее число таких переменных должно быть равно количеству независимых факторов в модели. При этом, если какая-либо из переменных хi оказывается не связанной с ошибкой e, то она сама может выступать в качестве “инструментальной” переменной. В результате матрицу Х можно представить в следующем виде:
Х =[ Х 1 Х 2],
где подматрица Х 1 объясняет переменные, независимые по отношению к ошибке модели e, а подматрица Х 2 – зависимые. В этом случае матрица Z имеет следующий вид:
Z =[ Х 1 Z 2],
где Z 2 подматрица инструментальных переменных, замещающих независимые факторы, образующие матрицу Х 2. Заметим также, что выражение Z ( Z ¢ Z )–1 Z ¢ Х = Р z Х = , используемое в формуле (3.67), может рассматриваться как матрица расчетных значений факторов хit, полученных как оценки зависимых переменных при использовании в качестве независимых факторов инструментальных переменных zi, i=1, 2,..., п. В самом деле, выражение ( Z ¢ Z )–1 Z ¢ х i определяет оценки коэффициентов следующей модели:
и, таким образом, ( Z ¢ Z )–1 Z ¢ Х = B, где B – матрица оценок коэффициентов моделей типа (3.74) для i=1, 2,... п; имеющая следующий вид:
Тогда матрица Z ¢ B = представляет собой матрицу расчетных значений независимых факторов исходной модели, полученных в результате их выражения эконометрическими моделями типа (3.74) в зависимости от выбранных значений инструментальных переменных. Отметим также, что если значения инструментальных переменных и независимых факторов исходной модели равны между собой, т. е. Z = X, тогда = Х ( Х ¢ Х )–1 Х ¢ Х = Х. С учетом этого равенства получим, что при частичной замене исходных факторов на инструментальные переменные матрица Z будет иметь следующий вид:
Z =[ Х 1 ],
где = Z ( Z ¢ Z )–1 Z ¢ Х 2 и Z =[ Х 1 Z 2]. Вопросы к главе III 1. Как выглядит ковариационная матрица ошибок модели при наличии автокорреляционных связей в ряду ошибки et? 2. Как выглядит ковариационная матрица ошибок модели при наличии гетероскедастичности ошибок? 3. Каковы последствия автокорреляции и гетероскедастичности ошибок? 4. В чем суть обобщенного МНК (ОМНК)? 5. Как определяется ковариационная матрица ОМНК-оценок параметров? 6. Каковы предпосылки обобщенного метода максимального правдоподобия? 7. В чем суть двухшагового МНК Дарбина? 8. В чем суть взвешенного МНК? 9. В чем суть метода инструментальных переменных? Упражнения к главе III Задание 3.1 Для обобщенной линейной регрессионной модели
yt =a0+ a1 хt +et (t=1,..., Т)
имеется T=10 пар наблюдений, которые представлены в табл. 3.1. Таблица 3.1
Требуется: 1. Определить оценки обобщенного МНК для параметров модели, исходя из того, что имеется “чисто” гетероскедастичная модель с известными дисперсиями ошибки. Они составляют 0, 04; если 5, 0£ хt < 15, 0; 0, 16; если 15, 0£ хt < 25, 0; 1, 00, если 25, 0£ хt £ 40, 0.
2. Оценить параметры модели классическим МНК. Определить ошибку, которая возникает из-за неправильной спецификации модели. 3. Определить для описанной в п.1 ситуации ковариационную матрицу оценок параметров, полученных обобщенным МНК. 4. Определить ковариационную матрицу оценок параметров, полученных классическим МНК.
Задание 3.2 Имеется “чисто” гетероскедастичная модель линейной однофакторной регрессии. Дисперсии ошибок et (t=1,..., T) обозначим st2. Tребуется: 1. Показать, что оценки обобщенного МНК для параметров регрессии a0 и a1рассчитываются следующим образом:
2. Определить ковариационную матрицу вектора оценок, полученного обобщенным МНК. 3. Показать, что в частном случае “чистой” гомоскедастичности вектор оценок, полученный обобщенным МНК, совпадает с вектором оценок, полученным классическим МНК.
Задание 3.3 Имеется “чисто” гетероскедастичная модель линейной однофакторной регрессии
yt =a0+ a1 хt +et (t=1,..., Т),
дисперсия ошибки которой . Требуется: 1. Определить для этой модели ковариационную матрицу ошибок, а также матрицу Т, с помощью которой модель может быть преобразована в классическую. 2. Перейти к преобразованной модели и определить на ее основе оценки параметров регрессии a0 и a1. 3. Определить оценку параметра s2 для данной модели.
Задание 3.4 Имеется линейное однофакторное уравнение регрессии
yt =a0+ a1 хt +et (t=1,..., Т),
а также 10 пар наблюдений переменных (хt, yt), которые представлены в табл. 3.2 Таблица 3.2
Требуется: 1. Определить линию регрессии с помощью гетероскедастичной модели из задания 3.3. 2. Определить линию регрессии на основе классической модели. 3. Изобразить обе линии регрессии и фактические данные на диаграмме рассеяния и сравнить их друг с другом.
Задание 3.5 Рассмотрим частный случай гетероскедастичной модели однофакторной регрессии
yt =a0+ a1 хt +et (t=1,..., Т),
для которого выполняется условие (t=1,..., Т). Имеются следующие фактические данные:
Требуется: 1. Определить вектор оценок параметров регрессии a с помощью классического МНК. 2. Определить вектор оценок параметров регрессии a A с помощью обобщенного МНК. 3. Определить потерю эффективности, которая возникает из-за применения классического МНК вместо обобщенного. 4. Определить оценку ковариационной матрицы вектора оценок и сравните ее с Соv( a ).
Задание 3.6 Рассмотрим “чисто” гетероскедастичную однофакторную регрессионную модель
сt =a0+ a1 yt +et (t=1,..., Т),
где с – потребление домохозяйства определенной структуры, у – доход этого домохозяйства. Ошибки попарно не коррелированы, дисперсия ошибки при доходе от 50 до 100 единиц в 2 раза больше, чем при доходе до 50 единиц. Имеется следующая выборка объемом 9 наблюдений:
Требуется: 1. Определить ковариационную матрицу ошибки для этой модели. 2. Оценить параметры уравнения с помощью обобщенного МНК. 3. Оценить параметры уравнения при измененном условии: дисперсии ошибки должны быть пропорциональны квадрату дохода. Сравнить результат с соответствующим результатом в п. 2.
Задание 3.7 Объем потребления домохозяйств объясняется с помощью однородного уравнения:
где yjt – потребление; хjt(1) – заработная плата; хjt(2) – дивиденды домохозяйства j в период t. Для ошибки этого уравнения выполняются предпосылки классической регрессионной модели. Параметры регрессии a1 и a2 должны оцениваться на основе эмпирических данных, но для каждого периода нет данных об индивидуальном потреблении yjt, а есть только совокупное потребление всех kt домохозяйств, т. е.
Требуется: 1. Вывести модифицированное уравнение, которое позволяет оценить вектор параметров модели a. 2. Показать, что это уравнение является моделью с чистой гетероскедастичностью, в которой ковариационная матрица ошибки известная с точностью до s2. 3. Определить оценки параметров a1 и a2.
Задание 3.8 Объем потребления домохозяйств объясняется с помощью трехфакторного уравнения:
где yjt – потребление домохозяйства j в период t; xt – индекс цен в период t; wjt – число членов и zjt – доход домохозяйства j в период t. Для ошибки этого уравнения выполняются предпосылки классической регрессионной модели. Параметры регрессии a1 , a2, a3 и a4 должны оцениваться на основе эмпирических данных, но отдельные данные известны только для 0-го периода, а для всех последующих периодов, к сожалению, известны только средние объемы потребления, среднее число членов домохозяйств и средние доходы всех домохозяйств, т. е.
Требуется: 1. Вывести модифицированное уравнение, которое позволяет оценить вектор параметров модели a на основе всех имеющихся данных. 2. Построить ковариационную матрицу ошибки модифицированного уравнения. 3. Определить вектор оценок параметров a.
Задание 3.9 Для линейного однофакторного уравнения регрессии
yt =a0+ a1 хt +et (t=1,..., Т)
имеется T=20 пар наблюдений целевой переменной у и экзогенной переменной х, которые представлены в табл. 3.3. Таблица 3.3
Будем исходить из нормального распределения ошибки и отсутствия автокорреляции. Имеется подозрение на гетероскедастичность. Требуется: 1. Проанализировать следующий способ проверки на гетероскедастичность: с помощью критерия Фишера проверяется нулевая гипотеза о гомоскедастичности для Т1=5, для Т2=10 и для Т3=15 наблюдений при уровне значимости a=0, 05, и если хотя бы один из этих тестов отклонит нулевую гипотезу, то имеется гетероскедастичность. 2. Для уровня значимости a=0, 05 проверить гипотезу, что дисперсии ошибки для первых и последних 10 пар наблюдений различны.
Задание 3.10 Имеется обобщенная регрессионная модель
сt =a0+ a1 yt +et (t=1,..., Т),
где с – потребление домохозяйства определенной структуры, у – доход этого домохозяйства. Имеется выборка из задачи 3.6. Рассматриваемые домохозяйства разбиваются на две группы: с доходом до 50 единиц и с доходом от 50 до 100 единиц. Требуется с учетом предположения о нормальном распределении ошибки проверить при уровне значимости a=0, 05 нулевую гипотезу, что дисперсия ошибки во второй группе домохозяйств в два раза больше, чем в первой. Задание 3.10 Имеется линейное уравнение множественной регрессии
yt =a0+ a1 х1t +...+an хnt + et (t=1,..., Т),
для ошибок которого выполняются предпосылки авторегрессии первого порядка, параметр r известен. Для оценивания параметров a0, a1,..., an предлагается провести следующее преобразование: из t-го уравнения вычесть t–1-e уравнение, умноженное на r, t=1,..., Т, т. е. осуществить переход к обобщенным первым разностям. Требуется: 1. Определить матрицу преобразований T r, с помощью которой осуществляется переход к модифицированному уравнению. 2. Определить “оптимальные” оценки параметров модифицированного уравнения и показать, как от них можно перейти к оценкам параметров исходного уравнения. 3. Определить “оптимальные” оценки параметров исходного уравнения и сравнить их с оценками из п. 3.
Задание 3.11 Для линейного однофакторного уравнения регрессии
yt =a0+ a1 хt +et (t=1,..., Т)
имеется T=12 пар наблюдений целевой переменной у и экзогенной переменной х, которые представлены в табл. 3.4. Таблица 3.4
Для ошибки уравнения et выполняются предпосылки авторегрессии первого порядка с известными значениями r=–0, 4 и se2 =1. Требуется: 1. Оценить параметры уравнения a0 и a1с помощью обобщенного МНК. 2. Оценить параметры уравнения a0 и a1с помощью модифицированного уравнения из задачи 3.10. 3. Определить ошибки, которые возникают при использовании классического МНК и оценивания из п. 2 по сравнению с “оптимальными” оценками из п. 1. Задание 3.12 Для линейного однофакторного уравнения регрессии
yt =a0+ a1 хt +et (t=1,..., Т)
имеется T=18 пар наблюдений целевой переменной у и экзогенной переменной х, которые представлены в табл. 3.5. Таблица 3.5
Для ошибки уравнения et выполняются предпосылки авторегрессии первого порядка. Требуется: 1. Определить оценку r параметра авторегрессии ошибки. 2. Определить с использованием полученной в п. 1 оценки параметра авторегрессии первый вектор оценок параметров a0 и a1. 3. Рассчитать с использованием полученного в п.2 результата новую оценку r¢ и определить с ее помощью новый вектор оценок обоих параметров регрессии. 4. Определить следующую оценку r¢ ¢ и сравнить оценки r, r¢ и r¢ ¢ друг с другом.
Задание 3.13 Для линейного однофакторного уравнения регрессии
yt =a0+ a1 хt +et (t=1,..., Т)
имеется T=18 пар наблюдений целевой переменной у и экзогенной переменной х, которые представлены в табл. 3.5 (см. задание 3.12). Требуется: 1. Проверить при уровне значимости a=0, 10 гипотезу об отсутствии автокорреляции первого порядка у ошибок et. 2. Проверить при уровне значимости a=0, 05 гипотезу о наличие негативной автокорреляции ошибок линейного регрессионного уравнения с тремя экзогенными переменными, если для 20 наблюдений получены следующие остатки: 0, 8; –1, 2; 0, 0; –0, 6; 1, 1; 0, 9; 0, 2; 0, 4; –0, 6; 0, 1; –0, 7; 1, 4; 1, 0; 1, 5; –0, 8; 0, 2; –1, 4; 0, 3; 0, 8; –1.
Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 796; Нарушение авторского права страницы