Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Аналитическое сглаживание временного ряда. Уравнение тренда.



 

Кривые роста, описывающие закономерности развития явлений во времени – это результат аналитического выравнивания динамических рядов. Выравнивание ряда с помощью тех или иных функций в большинстве случаев оказывается удобным средством описания эмпирических данных. Это средство при соблюдении ряда условий можно применить и для прогнозирования. Процесс выравнивания состоит из следующих основных этапов:

- выбора типа кривой, форма которой соответствует характеру изменения динамического ряда;

- определения численных значений (оценка) параметров кривой;

- апостериорного контроля качества выбранного тренда.

В пакете Анализа данных Excel все перечисленные этапы реализуются одновременно, как правило, в рамках одной процедуры.

Аналитическое сглаживание с использованием той или иной функции позволяет получить выровненные, или, как их иногда не вполне правомерно называют, теоретические значения уровней динамического ряда, т.е. уровни, которые наблюдались бы, если бы динамика явления полностью совпадала с кривой. Эта же функция с некоторой корректировкой или без нее, применяется в качестве модели для экстраполяции (прогноза).

Вопрос о выборе типа кривой является основным при выравнивании ряда. При всех прочих равных условиях ошибка в решении этого вопроса оказывается более значимой по своим последствиям (особенно для прогнозирования), чем ошибка, связанная со статистическим оцениванием параметров.

Поскольку форма тренда объективно существует, то при выявлении ее следует исходить из материальной природы изучаемого явления, исследуя внутренние причины его развития, а также внешние условия и факторы на него влияющие. Только после глубокого содержательного анализа можно переходить к использованию специальных приемов, разработанных статистикой.

Весьма распространенным приемом выявления формы тренда является графическое изображение временного ряда. Но при этом велико влияние субъективного фактора, даже при отображении выровненных уровней.

Наиболее надежные методы выбора уравнения тренда основаны на свойствах различных кривых, применяемых при аналитическом выравнивании. Такой подход позволяет увязать тип тренда с теми или иными качественными свойствами развития явления. Нам представляется, что в большинстве случаев практически приемлемым является метод, который основывается на сравнении характеристик изменения приростов исследуемого динамического ряда с соответствующими характеристиками кривых роста. Для выравнивания выбирается та кривая, закон изменения прироста которой наиболее близок к закономерности изменения фактических данных.

При выборе формы кривой надо иметь в виду еще одно обстоятельство. Рост сложности кривой в целом ряде случаев может действительно увеличить точность описания тренда в прошлом, однако в связи с тем, что более сложные кривые содержат большее число параметров и более высокие степени независимой переменной, их доверительные интервалы будут, в общем, существенно шире, чем у более простых кривых при одном и том же периоде упреждения.

В настоящее время, когда использование специальных программ без особых усилий позволяет одновременно строить несколько видов уравнений, широко эксплуатируются формальные статистические критерии для определения лучшего уравнения тренда.

Из сказанного выше, по-видимому, можно сделать вывод о том, что выбор формы кривой для выравнивания представляет собой задачу, которая не решается однозначно, а сводится к получению ряда альтернатив. Окончательный выбор не может лежать в области формального анализа, тем более, если предполагается с помощью выравнивания не только статистически описать закономерность поведения уровня в прошлом, но и экстраполировать найденную закономерность в будущее. Вместе с тем различные статистические приемы обработки данных наблюдения могут принести существенную пользу, по крайней мере, с их помощью можно отвергнуть заведомо непригодные варианты и тем самым существенно ограничить поле выбора.

Рассмотрим наиболее используемые типы уравнений тренда:

1. Линейная форма тренда: .

2. Параболическая (полином 2-ой степени) форма тренда: .

3. Логарифмическая форма тренда: .

4. Мультипликативная (степенная) форма тренда: .

5. Полином 3-ей степени: .

Естественно, кривых, описывающих основные тенденции, гораздо больше. Однако формат учебного пособия не позволяет описать все их многообразие. Показанные далее приемы построения моделей позволят пользователю самостоятельно использовать другие функции, в частности обратные.

Для решения поставленной задачи по аналитическому сглаживанию динамических рядов с помощью Мастера диаграмм потребуется следует сделать активным правой кнопкой мыши в зоне графика следующее меню, рисунок 3.4.

Нам предстоит построить 5-6 различных уравнений тренда, которые по существу являются уравнениями регрессии, в котором в качестве результирующего фактора выступает число осужденных за преступления, связанные с присвоением или растратой.

 

Рис. 3.4. Запуск процедуры Добавить линию тренда

 

В итоге получается следующий рабочий лист (рисунок 3.5)

 

Рис. 3.5. Рабочий лист с вариантами выбора параметров линии тренда

 


Данная процедура позволяет строить регрессионные модели как линейного, так и нелинейного типа, рисунок 3.6.

 

Рис. 3.6. Исходный динамический ряд и основные модели тренда,
предлагаемые в пакете Анализа данных Excel

 

 

Выбор трендовой модели

 

Как уже отмечалось, проблема выбора формы кривой – одна из основных проблем, с которой сталкиваются при выравнивании ряда динамики. Решение этой проблемы во многом определяет результаты экстраполяции тренда. В большинстве специализированных программ для выбора лучшего уравнения тренда предоставляется возможность воспользоваться несколькими критериями, приведем некоторые из них:

1. Минимальное значение среднеквадратической ошибки тренда:

 

, (3.11)

 

 

где – фактические значения уровней ряда динамики; – значения уровней ряда, определенные по уравнению тренда; n –число уровней ряда; m –число параметровв уравнении тренда.

 

2. Минимальное значение остаточной дисперсии:

 

. (3.12)

 

3. Минимальное значение средней ошибки аппроксимации (MAPE – Mean Absolute Percentage Error):

 

. (3.13)

4. Минимальное значение среднего абсолютного отклонения MASD – Mean Absolute Derivation):

 

. (3.14)

 

5. Максимальное значение коэффициента детерминации

, (3.15)

где – общая дисперсия; – остаточная дисперсия.

 

6. Максимальное значение F- критерия Фишера:

 

: . (3.16)

 

В данном пособии для идентификации тренда используется формальный метод, который основывается на использовании численного критерия. В качестве такого критерия рассматривается максимальный коэффициент детерминации, который показывает, какая доля общей дисперсии результативного признака обусловлена вариацией признака – фактора.

Напоминаем, что значение коэффициента детерминации необходимо было выписать (см. раздел 3.3.). Если этого не было сделано, то нужно рассчитать его значение по формуле (3.15).

Далее необходимо проанализировать выбранную модель тренда с точки зрения ее адекватности реальным тенденциям исследуемого временного ряда через оценку надежности полученных уравнений трендов по F-критерию Фишера и параметров уравнений трендов по t-критерию Стьюдента.

Поскольку F-критерий основан на соотношении факторной и остаточной дисперсий, то вполне логично его использование для оценки качества модели. Если объясненная дисперсия существенно больше необъясненной, это означает, что в уравнение тренда фактор времени учтен, верно. Статистическая значимость уравнения одновременно означает статистическую значимость коэффициента детерминации.

Если , то делается вывод о статистической значимости уравнения в целом.

Рассмотрим оценку значимости уравнения на примере линейного тренда. Согласно расчетной таблице (см. рис. 3.18) , а для определения теоретического значения F-критерия необходимо воспользоваться встроенным вероятностным калькулятором STATISTICA. Для этого запускаем процедуру Statistics/Probability Calculator/Distributions (рис. 3.27). В появившемся окне в левом столбце выбираем распределение Фишера F(Fisher), далее ставим метку в поле (1-Cumulative p), далее в поле p (теоретический уровень значимости) ставим 0, 05 (поскольку установленная вероятность равна 95%), в поле df1 заносим число степеней свободы трендового уравнения (равно числу параметров трендового уравнения, для линейного – 2), в поле df2 заносим число степеней свободы остаточной дисперсии (число уровней ряда минус число параметров уравнения, в нашем случае – 8) и нажимаем кнопку Compute. В поле F появляется теоретического значения F-критерия (в нашем случае – 4, 458970) (рис. 3.28). Отметим, что число степеней свободы для каждого уравнения также можно взять из таблицы дисперсионного анализа (см. рис. 3.18).

Таким образом, линейную модель тренда следует считать статистически значимой. То же самое необходимо проделать и для остальных моделей.

 

Оценка статистической значимости параметров модели означает проверку нулевых гипотез о равенстве параметров генеральной совокупности нулю, т.е.:

 

Н0: =0, Н0: =0.

Проверка производится с использованием t-статистики, которая в этом случае представляет собой отношение значения параметра к его стандартной (среднеквадратической) ошибке S:

 

и , (3.17)

 

поскольку =0 и =0, то

 

, , (3.18)

 

где – стандартная ошибка параметра : = ; – стандартная ошибка параметра : = .

Фактические значения t-критерия сравниваются с табличными (с учетом уровня значимости α и числа степеней свободы. Параметры признаются статистически значимыми, т.е. сформированными под воздействием неслучайных факторов, если tфакт > tтабл.

Фактические значения t-критерия можно взять из таблицы расчета параметров уравнения тренда (см. рис. 3.17) в соответствующем столбце, там же подписано и значения числа степеней свободы. Для получения теоретических значений t-критерия опять воспользуемся встроенным вероятностным калькулятором, однако теперь в столбце слева выберем распределение Стьюдента t (Student). Ставим метку в полях (1-Cumulative p) и Two-tailed, далее в поле p (теоретический уровень значимости) ставим 0, 05 (поскольку установленная вероятность равна 95%), в поле df заносим число степеней свободы и нажимаем кнопку Compute. В поле t появляется теоретического значения t-критерия (в нашем случае – 2, 306004) (рис. 3.29). Поскольку tфакт для параметров линейного уравнения соответственно равны 5, 66455 и 10, 08865, то их следует признать статистически значимыми.

То же самое следует определить и для остальных трендовых моделей.

Результаты оценки уравнения могут быть разными. Возможен вариант, когда уравнение в целом статистически значимо, а некоторые параметры уравнения незначимы. Это означает, что описанная зависимость может служить основой для принятия некоторых управленческих решений, но полученное уравнение тренда нельзя использовать для прогнозирования. Уравнение признается моделью и может быть использовано в целях прогнозирования, если статистически значимы и параметры, и уравнение в целом.

После анализа значимости уравнений тренда и параметров уравнений, а также выбора критерия сравнения (коэффициент детерминации), рекомендуется составить следующую таблицу (рисунок. 3.7)

Рис. 3.7. Итоговые характеристики построенных уравнений тренда

 

Сопоставив значения коэффициентов детерминации для различных типов кривых можно сделать вывод о том, что для исследуемого динамического ряда лучшей форма тренда будет полином 3-ей степени, однако анализ значимости параметров уравнения говорит о невозможности использования полиномов 2-й и 3-й степени для прогнозирования. Исходя из этого рассматривать стоит только три модели, которые имеет значимые оценки уравнения и параметров уравнения, а наибольший коэффициент детерминации имеет линейная.

 

 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2017-03-11; Просмотров: 807; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.049 с.)
Главная | Случайная страница | Обратная связь