Оценка дисперсии истинной ошибки модели

⇐ ПредыдущаяСтр 9 из 17Следующая ⇒

На практике вместо дисперсии истинной ошибки s_e², значение которой не известно, используется ее оценка, рассчитываемая на основе фактических значений ошибки е_tсогласно следующей формулы (см. (1.32), (2.19)):

Обоснованность такой замены можно подтвердить, показав, что M[s_e²]=s_e², т. е. математическое ожидание дисперсии фактической ошибки, определенной на основании известных оценок МНК параметров эконометрической модели, равно дисперсии ее “истинной” ошибки.

Заметим, что векторы значений фактической и “истинной” ошибки связаны следующим соотношением:

e = у – Х × a = Х × a + e – Х × [( Х ¢ Х )^–1× Х ¢ × ( Х × a + e )]=

= e – Х × ( Х ¢ Х )^–1× Х ¢ × e =[ E _T – Х × ( Х ¢ Х )^–1× Х ¢ ]× e = G × e, (2.57)

где E _T – единичная матрица размера Т´ Т и G = E _T– Х × ( Х ¢ Х )^–1× Х ¢ – симметрическая полуопределенная идемпотентная матрица, обладающая согласно ее определению следующим свойством*:

G ^k= G, k=2, 3,... (2.58)

Из (2.57) следует, что расчетные значения фактической ошибки е_tлинейной эконометрической модели могут быть выражены в виде линейных комбинаций неизвестных значений истинной ошибки e_t. В этом случае сумму квадратов значений фактической ошибки можно представить в следующем виде:

( e ¢ e )= e ¢ G ¢ Ge = e ¢ Ge. (2.59)

При выводе выражения (2.59) учтено, что G – симметрическая идемпотентная матрица.

Найдем математическое ожидание левой и правой частей выражения (2.59).

M[ e ¢ e ]= M[ e ¢ Ge ]=

tr( G ), (2.60)

где tr( G )= – след матрицы G, представляющий собой сумму ее диагональных элементов (сумму элементов главной диагонали); =s_e²– дисперсия “истинной” ошибки модели.

При выводе выражения (2.60) также учтено, что M[e_t× e_j]=0, если t¹ j в силу независимости разновременных значений ошибки e_t.

След матрицы G может быть определен с учетом свойств этой характеристики. В связи с этим напомним, что:

а) след арифметической суммы матриц равен сумме следов каждой из них

tr( G )= tr( E _T)– tr[ Х × ( Х ¢ Х )^–1× Х ¢ ]; (2.61)

б) следы произведений матриц AB и BA равны между собой, естественно при условии, что оба произведения AB и BA матриц A и B существуют.

Тогда, учитывая, что матрица Х ¢ Х имеет размер (п+1)´ (п+1), получим

tr[ Х × ( Х ¢ Х )^–1× Х ¢ ]=tr[( Х ¢ Х )^–1× Х ¢ Х ]=tr E _п₊₁, (2.62)

где E _п₊₁ – единичная матрица размера (п+1)´ (п+1).

Поскольку в силу формы единичных матриц tr E _T=Т и tr E _п₊₁= п+1, то из выражения (2.60) вытекает, что несмещенная оценка дисперсии истинной ошибки модели s_e²определяется на основании следующего выражения:

2.2.4. Особенности проверки обратимости матрицы Х¢ Х

Как было отмечено ранее, при наличии достаточно сильной корреляции между двумя или несколькими переменными х_i, i=1, 2,..., n, могут возникнуть трудности, связанные с обращением матрицы Х ¢ Х, следствием которых являются ошибки при определении оценок коэффициентов эконометрической модели. Последствия мультиколлинеарности могут быть разные.

Во-первых, падает точность оценивания, что проявляется в росте дисперсий ошибок коэффициентов модели, возникновении сильной зависимости между ними.

Во-вторых, может быть неправильно определена значимость независимых переменных. Иными словами, ошибки, появляющиеся при обращении плохо обусловленной матрицы Х ¢ Х приводят к тому, что искажается оценка степени влияния независимых факторов на зависимую переменную у. Вследствие этого, некоторые значимые факторы на этапе их отбора сверху могут быть исключены из модели, а незначимые, наоборот, оставлены.

В-третьих, оценки коэффициентов становятся крайне чувствительными к изменениям исходных данных эконометрической модели. Малейшие изменения значений переменных y_t и х_itили их количества вызывают значительные сдвиги в оценках коэффициентов a₀, a₁,..., a_n. В результате этого иногда меняется содержательный смысл модели. Это свидетельствует о ее ненадежности, неадекватности рассматриваемому реальному процессу.

Информация о плохой обусловленности матрицы Х ¢ Х может содержаться в матрице выборочных коэффициентов парной корреляции переменных х_i, i=1, 2,..., n. Значения, близкие по абсолютной величине к единице у коэффициентов некоторой даже незначительной по количеству группы переменных, уже указывают на возможные трудности, связанные с обращением матрицы Х ¢ Х. Вместе с тем, плохая обусловленность матрицы Х ¢ Х может иметь место и при относительно небольших значениях парных коэффициентов корреляции (|r |» 0, 8) у группы, содержащей достаточно большее число переменных.

Для выявления сильной мультиколлинеарности между независимыми переменными х_i, i=1, 2,..., n, обуславливающей плохую обратимость матрицы Х ¢ Х, можно использовать специальные тесты.

Простейший из них связан с использованием понятия чувствительности оценок коэффициентов эконометрической модели к незначительному изменению состава исходных данных. Тестирование в этом случае состоит в сопоставлении оценок коэффициентов первоначального варианта модели со значениями коэффициентов модели, построенной на меньшем количестве данных, т. е. при удалении из вектора у и матрицы Х нескольких элементов и строк соответственно с одинаковыми индексами.

Если некоторые из коэффициентов изменились достаточно сильно, то это свидетельствует о плохой обратимости матрицы Х ¢ Х, вызванной значительной мультиколлинеарностью между независимыми факторами модели.

На наличие мультиколлинеарности указывают и высокие значения множественных коэффициентов детерминации, вычисляемых между объясняющими переменными, на основе значений их парных коэффициентов корреляции, объединенных в соответствующую матрицу. Напомним, что множественный коэффициент детерминации D_i определяет уровень линейной связи переменной х_i с набором оставшихся переменных х₁, х₂,..., х_i–₁, х_i₊,..., х_n. Его значение может быть определено на основе следующего выражения:

ê W ê / W _ii, (2.64)

где ê W ê – определитель матрицы W; W _ii– алгебраическое дополнение матрицы W к элементу с индексами ii, R_i – коэффициент множественной корреляции между переменной х_i и оставшимся набором переменных.

W = (2.65)

Матрица W симметрична, поскольку r_ij=r_ji, на ее главной диагонали стоят единицы, поскольку r_ii º 1 и при n переменных она имеет размер n´ n, i=1, 2,..., n.

Значимость коэффициента детерминации определяется на основании критерия Фишера, величина которого рассчитывается согласно следующей формулы:

Если некоторые из показателей F_i, i=1, 2,..., n будут весьма значительными, т. е. существенно превосходить порог статистической значимости показателя D_i, равный табличному значению критерия Фишера F_*(Т–1, Т–n, p_*), то существуют серьезные основания полагать, что между переменными х₁, х₂,..., х_nсуществует сильная корреляционная зависимость.

В заключении данного раздела отметим следующее. В тех случаях, когда проведенные тесты подтвердили выполнимость условий (2.21)–(2.24), процедуру построения линейной эконометрической модели можно считать завершенной. Однако, если хотя бы один из тестов показал отрицательный результат нельзя утверждать, что построенная эконометрическая модель характеризуется высоким качеством. В таком случае необходимо разобраться с причинами невыполнения условий (2.21)–(2.24). Они могут не выполняться из-за неправильного выбора формы модели, неверного состава независимых факторов. В этом случае необходимо вернуться к этапу содержательного анализа проблемы построения модели и еще раз проверить обоснованность использования выбранной функциональной зависимости, состава, входящих в нее переменных, корректность измерения их количественных значений и т. п.

В разделе 2.3 будет, например, показано, что смещенность оценок параметров эконометрической модели может быть обусловлена невключением в модель ряда значимых факторов.

На рис. 2.1 изображены последствия неправильного выбора линейной формы функционала y_t=a₀+a₁х_tэконометрической модели вместо квадратичной функции y_t=b₀+b₁х_t+b₂х_t².

Несложно заметить, что при линейной форме зависимости между значениями ошибки существует определенная закономерность, т. е. ошибку нельзя будет считать случайной. Она проявляется хотя бы в том, что значения ошибки линейной модели на каждом из рассмотренных интервалов имеют одинаковый знак. Ошибка квадратичной зависимости имеет “более случайный” характер.

у —квадратическая