Идентификация моделей авторегрессии-скользящего среднего

⇐ ПредыдущаяСтр 10 из 12Следующая ⇒

Из рассмотренного в данной главе материала вытекает, что произвольный реальный стационарный процесс второго порядка может быть выражен разными вариантами моделей временных рядов. Чтобы показать это, запишем, например, модель АР(1) в более компактном виде с использованием оператора сдвига назад В. Его воздействие на любую переменную, зависящую от времени, определяется следующими соотношениями:

С учетом (6.102) модель АР(1) можно представить в следующей форме записи:

Поскольку ï a₁ï < 1, то является суммой бесконечно убывающей геометрической прогрессии

С учетом (6.104) модель (6.103) запишем в следующем виде:

где в данном случае a₁=–b₁, a₁²=–b₂,....

Из выражения (6.105) следует, что модель авторегрессии первого порядка оказывается эквивалентной модели скользящего среднего бесконечного порядка. Аналогичным образом можно показать и обратное соотношение между порядками этих моделей. Так, для модели СС(1) имеем

Поскольку ï b₁ï < 1(из условия стационарности процесса у_t), то из выражения (6.106) получим

где в данном случае a₁=–b₁, a₂=–b₁²,... – коэффициенты модели авторегрессии бесконечного порядка.

В общем случае модель авторегрессии k-го порядка оказывается эквивалентной модели скользящего среднего т-го порядка

где многочлен т-й степени – результат деления единицы на многочлен k-й степени.

Из рассмотренных соотношений вытекает важный вывод: на практике можно подобрать модель с минимальным числом параметров, которая описывает временной ряд у_t, являющийся стационарным процессом второго порядка, не “хуже”, чем другие варианты моделей с большим числом параметров. Обычно понятие “не хуже” связывается с минимальной дисперсией модели и отсутствием автокорреляции в ряду ее ошибки.

Практическая ценность этого вывода состоит в следующем. При построении моделей временных рядов нужно стремиться к минимизации числа их параметров, а, следовательно, и порядка самой модели. Дело в том, что параметры таких моделей оцениваются на основе коэффициентов автокорреляции исходного процесса у_t. С увеличением порядка модели для определения значений ее параметров необходимо использовать в качестве исходных данных и большее число выборочных коэффициентов автокорреляции (с большими номерами). Точность их оценки с ростом сдвига падает, да и их абсолютные значения либо стремятся к нулю, либо попадают в область повышенной неопределенности их значений. Все это снижает надежность оценок коэффициентов моделей временных рядов высоких порядков, как и качество самих моделей. Все это и заставляет эконометриков искать для описания реальных процессов модели временных рядов с минимальным числом параметров.

Процесс выбора модели, в наилучшей степени соответствующей рассматриваемому реальному процессу, называется идентификацией модели. В нашем случае идентификация состоит в определении общего вида модели из класса моделей АРСС(k, т), характеризующейся наименьшим числом параметров (минимальным порядком) по сравнению с другими возможными вариантами, без потерь в точности описания исходного процесса.

Вообще говоря, идентификация – это достаточно грубая процедура (последовательность процедур), целью которой является определение некоторой области приемлемых значений характеристик порядка k и т модели АРСС(k, т), которая в ходе дальнейших исследований должна быть сведена к конкретным их величинам.

Обычно в этой части идентификация сопровождается процедурами оценки параметров альтернативных вариантов моделей и выбора наилучшего из них, на основе использования критериев качества.

Таким образом, в общем случае формирование модели, в наилучшей степени подходящей для описания реального процесса, как бы состоит из трех пересекающихся и дополняющих друг друга этапов – идентификации, оценивания и диагностики (согласования модели с исходными данными с целью выявления ее недостатков и последующего улучшения).

Для проведения идентификации модели АРСС(k, т) обычно используется тот же временной процесс у_t, который в нашем случае обладает свойством стационарности второго порядка. Общая идея идентификации модели АРСС(k, т) состоит в том, что свойства реального процесса и свойства наилучшей модели в некоторой степени должны быть близки друг к другу.

Эта близость, как это было показано ранее, практически целиком определяется на основе сопоставления поведения их автокорреляционных функций: теоретической – для модели и эмпирической – для реального процесса, выборочные коэффициенты автокорреляции которого оценены на основе наблюдаемых данных. Здесь следует отметить, что, поскольку выборочные коэффициенты автокорреляции могут характеризоваться достаточно большими ошибками и, кроме того, сильными корреляционными взаимосвязями между собой (см. выражения (6.22)–(6.24)), то на практике точного сходства между “теоретической” и “эмпирической” автокорреляционными функциями ожидать не следует, особенно при больших сдвигах. Например, вследствие статистической взаимосвязи между коэффициентами автокорреляции процесса относительно значимые уровни выборочных коэффициентов автокорреляции (всплески) могут иметь место и в областях сдвигов, где их теоретические аналоги близки к нулю. Поэтому при сопоставлении теоретических и выборочных автокорреляционых функций обычно учитывают лишь их главные свойства. Именно их совпадение позволяет значительно сузить круг приемлемых для описания реального процесса вариантов модели. Окончательный выбор в пользу одной из них обычно делается по результатам оценивания значений коэффициентов моделей и диагностики моделей.

Отметим наиболее характерные свойства автокорреляционных функций типовых моделей АРСС(k, т), рассмотренных в данной главе.

Как следует из выражения (6.65), автокорреляционная функция модели авторегрессии первого порядка – АР(1) спадает строго по экспоненте (точнее этот вывод справедлив для абсолютных значений коэффициентов автокорреляции). Плавный характер уменьшения коэффициентов автокорреляции характерен и для моделей авторегрессии более высоких порядков. В одном случае спад происходит либо чуть быстрее, чем строго по экспоненте, либо чуть медленнее, а в другом – по закономерности, соответствующей затухающей синусоиде.

Чрезвычайно важная информация о порядке модели авторегрессии содержится в так называемой частной автокорреляционной функции.

Для процесса, описываемого моделью АР(k), ее значениями являются последние значения коэффициентов моделей авторегрессии порядков, не превосходящих k, т. е. моделей с порядками i=1, 2,..., k–1, k. Обозначим значения частной автокорреляционной функции модели АР(k) через p_k₁, p_k₂,..., p_kk.

Тогда для модели АР(k) значение p_k₁равно r₁ и на практике определяется как оценка коэффициента a₁модели АР(1) по формуле

значение (см. выражение (6.63)) – как коэффициент a₂модели АР(2). На практике значение p_k₂, таким образом, определяется по формуле

и оценка любого коэффициента определяется как оценка коэффициента a_iмодели АР(i) по формуле

Можно показать, что для модели АР(k) значения частной автокорреляционной функции являются значимыми (отличными от нуля) до задержки k включительно, т. е. p_ki> 0, i£ k и равными нулю при сдвигах, превышающих порядок модели, т. е. p_ki=0, i> k. На практике этот результат следует понимать в “статистическом смысле”, поскольку оценки значений коэффициентов частной автокорреляционной функции определяются на основании выборочных значений коэффициентов автокорреляции и, поэтому сами являются случайными величинами, характеризующимися определенной ошибкой. Для оценок коэффициентов частной автокорреляционной функции, порядок которых превышает порядок модели, дисперсия ошибки приблизительно может быть оценена по следующей формуле:

где i > k; Т – объем динамического ряда показателя у_t.

Таким образом, поведение частной автокорреляционной функции моделей авторегрессии аналогично поведению автокорреляционных функций моделей скользящего среднего. Для модели АР(k) ее частная автокорреляционная функция “обрывается” после задержки k, как это имело бы место у автокорреляционной функции модели СС(k). Это свойство частной автокорреляционной функции удобно использовать при идентификации моделей авторегрессии. Если значения такой функции, рассчитанной для реального процесса, обрываются (становятся нулевыми), начиная со сдвига k+1, то это указывает на то, что модель авторегрессии k-го порядка соответствуют свойствам рассматриваемого процесса.

Как вытекает из выражения (6.75) теоретическая автокорреляционная функция модели СС(т) обрывается после задержки т. Поэтому, если автокорреляционная функция реального процесса обладает аналогичными свойствами, то это указывает на то, что для его описания целесообразно использовать модель скользящего среднего соответствующего порядка. Иными словами, если у процесса у_t оказался значимым только первый коэффициент автокорреляции r₁ и при этом, в соответствии с выражением (6.82) r₁£ 0, 5, то данный факт указывает на целесообразность выбора для его описания модели СС(1). Если “обрыв” имеет место после второго сдвига – то модель СС(2) и т.д.

Точно также как и для моделей авторегрессии частные автокорреляционные функции могут быть построены и для моделей скользящего среднего любых порядков. Для оценки их коэффициентов используются выражения (6.109)–(6.111). При этом с учетом того, что для модели СС(1) первый коэффициент автокорреляции r₁ и параметр модели b₁ связаны соотношением r₁=–b₁(1+b₁²) (см. (6.78)), то для i=2, 3,... с учетом того, что r₂=r₃=...=0, можно показать, что значения частных коэффициентов автокорреляции этой модели определяются по следующей формуле:

Из (6.113) непосредственно вытекает, что

откуда следует, что частная автокорреляционная функция модели СС(1) (т. е. абсолютные значения ее частных коэффициентов автокорреляции) затухает по закону близкому к экспоненциальному. Иными словами, ее поведение похоже на автокорреляционную функцию модели АР(1).

Можно показать, что аналогичное соответствие свойств характерно для частной автокорреляционной функции модели СС(2) и автокорреляционной функции модели АР(2). Они представляют собой либо плавно спадающие с ростом сдвига зависимости экспоненциального типа, либо затухающие синусоиды. Такое соответствие автокорреляционных и частных автокорреляционных функций характерно и для моделей авторегрессии и скользящего среднего более высоких порядков.

Для моделей АРСС(k, т) поведение автокорреляционной функции после задержки т похоже на поведение автокорреляционной функции модели АР(k). Однако на практике обычно используется модель АРСС(1, 1), т. е. только первого порядка. Как было показано выше, 6.4 (см. выражения (6.103)–(6.108)), это связано с тем, что составляющая модели, относящаяся к авторегрессии первого порядка поглощает все процессы скользящего среднего более высоких порядков, и, наоборот, составляющая скользящего среднего первого порядка поглощает процессы авторегрессии высоких порядков. Вследствие этого и поведение автокорреляционной и частной автокорреляционной функций модели АРСС(1, 1) характеризуется как бы комбинацией свойств этих функций, имевших место для моделей АР(1) и СС(1).

Иными словами, составляющая АР(1) способствует тому, что автокорреляционная функция модели АРСС(1, 1) (абсолютные значения коэффициентов автокорреляции) затухает экспоненциально, но после первой задержки (первого сдвига). Это непосредственно вытекает из выражений (6.77) и (6.79). В свою очередь, составляющая СС(1) определяет закономерности поведения частной автокорреляционной функции модели АРСС(1, 1), которая также затухает примерно экспоненциально в соответствии с выражением (6.113) и (6.114).

Здесь еще раз следует отметить, что рассмотренные подходы к идентификации основаны на сопоставлении свойств выборочных автокорреляционных и частных автокорреляционных функций реального стационарного процесса и предполагаемой для его описания модели. На практике идеальное совпадение свойств этих функций встречается не часто, поскольку и реальные процессы обычно не слишком точно соответствуют своим теоретическим аналогам-моделям, и оценки их коэффициентов автокорреляции характеризуются наличием ошибок. Вследствие этого процедура идентификации служит для обоснования выбора некоторой пробной модели из общей группы моделей типа АРСС(k, m), которая является как бы начальной точкой на пути построения “оптимального” теоретического аналога (модели) рассматриваемого процесса на основе использования более точных процедур диагностики и методов оценки параметров модели.

Обычно с помощью процедур диагностики исследуют свойства фактической ошибки модели е_t, которую часто называют остаточной ошибкой. При этом целесообразно руководствоваться следующей логикой анализа временного ряда е_t, значения которого определяется как разность между фактическими и расчетными значениями процесса в момент t, т. е. где – значения процесса, рассчитываемые по соответствующей модели.

Для “удачной” модели можно ожидать, что ряд ошибки e_t, t=1, 2,..., Т по своим свойствам будет достаточно близок к белому шуму – случайному процессу, характеризующемуся полным отсутствием каких-либо закономерностей в своих значениях, за исключением известного закона их распределения, обычно предполагаемого нормальным. Для нашего случая это означает, что математическое ожидание фактической ошибки должно быть равно нулю (М[е_t]=0), ее дисперсия постоянна на любом участке ее измерения (s_e²=const) и между рядами e _t, e _t–₁, е _t–₂, ... отсутствует автокорреляционная зависимость, т. е. первый и последующие выборочные коэффициенты автокорреляции ряда e_t, t=1, 2,..., Т , близки к нулю.

В более общем случае условие отсутствия закономерностей в ряду e_t, t=1, 2,..., Т, распространяется и на третий и на четвертый моменты ошибки e_t, что, например, означает равенство нулю любого третьего момента ошибки типа М[e_t, e_t–i, e_t–j], i, j ³ 1, постоянство ее четвертого момента (М[e_t⁴]=const) отсутствие автокорреляционной связи между значениями квадратов ошибки, рассматриваемых в различные моменты времени и т. п.

Иными словами, фактическая ошибка модели е_tдолжна быть “настолько случайна”, что ее невозможно было бы уточнить никакой другой моделью.

Кроме того, как это было показано выше, желательно, чтобы дисперсия ошибки s_e²была существенно меньше дисперсии процесса у_t–s_у², s_e²< < s_у². В этом случае модель, описывающая процесс у_t, как бы снимает значительную часть неопределенности в его изменчивости, что позволяет с большей обоснованностью предсказывать его значения.

Наличие каких-либо закономерностей в ряду ошибки e_tуказывает на то, что построенная модель неадекватна рассматриваемому процессу у_t. Причинами неадекватности могут быть ошибки в оценках параметров, либо, так называемая, неопределенность модели. Примерами такой неопределенности является использование модели АР(1) вместо адекватной процессу модели АРСС(1, 1). В этом случае ошибка модели АР(1) характеризуется свойствами модели СС(1). На это укажет отличный от нуля ее первый коэффициент автокорреляции.

Вообще говоря, и неверные значения параметров модели приводят к такому же эффекту, когда ряд e_tхарактеризуется какими-либо “неслучайностями”. Вследствие этого на практике однозначно указать какой-либо путь уточнения модели на основе анализа свойств ошибки e_t, отличных от свойств белого шума, обычно не представляется возможным. В такой ситуации можно сначала рекомендовать уточнить значения параметров модели путем использования более эффективных процедур их оценки, а затем, если это окажется необходимым – доопределить модель.

Для этой цели могут быть использованы и другие более точные методы оценивания (например, нелинейные), в которых найденные оценки (по методу Юла-Уокера, например, и другие) используются как начальные приближения к “оптимальным” значениям параметров модели АРСС(k, т).

Из приведенных выше рассуждений вытекает, что диагностика модели сводится к исследованию свойств ее ошибки с целью выявления степени соответствия ее свойств свойствам белого шума. Такие исследования в случае модели стационарных процессов второго порядка обычно сводятся к проверке значимости коэффициентов автокорреляции фактической ошибки е_t.

На практике можно ожидать, что вследствие сложного характера распределения ошибок выборочных коэффициентов автокорреляции их значения, особенно при малых сдвигах, могут находиться в некоторой зоне неопределенности, когда затруднительно однозначно сделать вывод относительно значимости или незначимости каждого из них.

В заключение данного раздела напомним, что для проверки гипотезы о соответствии свойств ошибки модели свойствам белого шума могут использоваться процедуры проверки гипотез о постоянстве и равенстве нулю ее математического ожидания, постоянстве дисперсии, равенстве нулю ее коэффициентов автокорреляции. В последнем случае применимы критерии Дарбина-Уотсона (для первого коэффициента автокорреляции), критерий Стьюдента, расчетное значение которого для выборочного коэффициента автокорреляции k-го порядка определяется согласно следующей формулы:

где s(r_k)–среднеквадратическая ошибка выборочного коэффициента автокорреляции r_k, для оценки которой могут быть использованы выражения (6.25) (при q=0) и (6.26).

Для этих же целей во многих случаях предпочтительнее использовать так называемый совокупный критерий согласия (критерий Бокса-Пирса), с помощью которого оценивается значимость некоторой последовательности выборочных коэффициентов автокорреляции, начиная с первого. Для любого процесса АРСС(k, т) его расчетное значение определяется по следующей формуле:

Случайная величина Q распределена приблизительно по закону Пирсона c²(q–k–т). Таким образом, если оказывается, что выполняется следующее соотношения для первых q коэффициентов автокорреляции (q> k+т):

Q< c²(р_*, n), (6.117)

где n=q–k–т, то с вероятностью р_*гипотеза об отсутствии в ряду ошибки автокорреляционных зависимостей может быть принята.

⇐ Предыдущая 3 4 5 6 7 8 91011 12 Следующая ⇒