Выявление структуры временного ряда

⇐ ПредыдущаяСтр 10 из 11Следующая ⇒

Временнó й ряд – это совокупность значений какого – либо показателя за несколько последовательных моментов или периодов времени. Каждое значение (уровень) временного ряда формируется под воздействием большого числа факторов, которые можно условно разделить на три группы:

- факторы, формирующие тенденцию ряда;

- факторы, формирующие циклические колебания ряда;

- случайные факторы.

Тенденция характеризует долговременное воздействие факторов на динамику показателя. Тенденция может быть возрастающей или убывающей.

Циклические колебания могут носить сезонный характер или отражать динамику конъюнктуры рынка, а также фазу бизнес – цикла, в которой находится экономика страны.

Реальные данные часто содержат все три компоненты. В большинстве случаев временной ряд можно представить как сумму или произведение трендовой , циклической и случайной компонент. В случае суммы имеет место аддитивная модель временного ряда:

(1)

в случае произведения – мультипликативная модель:

. (2)

Основная задача эконометрического исследования отдельного временного ряда – выявление количественного выражения каждой из компонент и использование полученной информации для прогноза будущих значений ряда или построение модели взаимосвязи двух или более временных рядов.

Сначала рассмотрим основные подходы к анализу отдельного временного ряда. Такой ряд может содержать, помимо случайной составляющей, либо только тенденцию, либо только сезонную (циклическую) компоненту, либо все компоненты вместе. Для того, чтобы выявить наличие той или иной неслучайной компоненты, исследуется корреляционная зависимость между последовательными уровнями временного ряда, или автокорреляция уровней ряда. Основная идея такого анализа заключается в том, что при наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих.

Количественно автокорреляцию можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

Коэффициент автокорреляции уровней ряда первого порядка измеряет зависимость между соседними уровнями ряда и т.е. при лаге 1.

Он вычисляется по следующей формуле:

(3)

где в качестве средних величин берутся значения:

(4)

В первом случае усредняются значения ряда, начиная со второго до последнего, во втором случае - значения ряда с первого до предпоследнего.

Формулу (3) можно представить как формулу выборочного коэффициента корреляции:

(5)

где в качестве переменной берется ряд а в качестве переменной ряд

Если значение коэффициента (3) близко к единице, это указывает на очень тесную зависимость между соседними уровнями временного ряда и о наличии во временном ряде сильной линейной тенденции.

Аналогично определяются коэффициенты автокорреляции более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями и и определяется по формуле:

(6)

где в качестве одной средней величины берут среднюю уровней ряда с третьего до последнего, а в качестве другой - среднюю с первого уровня до

(7)

Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Для обеспечения статистической достоверности максимальный лаг, как считают некоторые известные эконометристы, не должен превышать четверти общего объема выборки.

Коэффициент автокорреляции строится по аналогии с линейным коэффициентом корреляции, и поэтому он характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. По нему можно судить о наличии линейной или близкой к линейной тенденции. Однако для некоторых временных рядов с сильной нелинейной тенденцией (например, параболической или экспоненциальной), коэффициент автокорреляции уровней ряда может приближаться к нулю.

Кроме того, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных имеют положительную автокорреляцию уровней, однако при этом не исключается убывающая тенденция.

Последовательность коэффициентов автокорреляции уровней различных порядков, начиная с первого, называется автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага называется коррелограммой. Анализ автокорреляционной функции и коррелограммы помогает выявить структуру ряда. Здесь уместно привести следующие качественные рассуждения.

Если наиболее высоким является коэффициент автокорреляции первого порядка, очевидно, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка τ , ряд содержит циклические колебания с периодичностью в τ моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, то либо ряд не содержит тенденции и циклических колебаний и имеет только случайную составляющую, либо ряд содержит сильную нелинейную тенденцию, для исследования которой нужно провести дополнительный анализ.

Пример. Пусть имеются данные об объёмах потребления электроэнергии жителями района за 16 кварталов, млн. квт.-ч:

t
y_t	6, 0	4, 4	5, 0	9, 0	7, 2	4, 8	6, 0	10, 0	8, 0	5, 6	6, 4	11, 0	9, 0	6, 6	7, 0	10, 8

Нанесем эти значения на график:

Определим автокорреляционную функцию данного временного ряда. Рассчитаем коэффициент автокорреляции первого порядка. Для этого определим средние значения:

С учетом этих значений можно построить вспомогательную таблицу:

t	y_t
	6, 0		-1, 0667			1, 137778
	4, 4	-2, 9867	-2, 6667	3, 185778	8, 920178	7, 111111
	5, 0	-2, 3867	-2, 0667	6, 364444	5, 696178	4, 271111
	9, 0	1, 6133	1, 9333	-3, 33422	2, 602844	3, 737778
	7, 2	-0, 1867	0, 1333	-0, 36089	0, 034844	0, 017778
	4, 8	-2, 5867	-2, 2667	-0, 34489	6, 690844	5, 137778
	6, 0	-1, 3867	-1, 0667	3, 143111	1, 922844	1, 137778
	10, 0	2, 6133	2, 9333	-2, 78756	6, 829511	8, 604444
	8, 0	0, 6133	0, 9333	1, 799111	0, 376178	0, 871111
	5, 6	-1, 7867	-1, 4667	-1, 66756	3, 192178	2, 151111
	6, 4	-0, 9867	-0, 6667	1, 447111	0, 973511	0, 444444
	11, 0	3, 6133	3, 9333	-2, 40889	13, 05618	15, 47111
	9, 0	1, 6133	1, 9333	6, 345778	2, 602844	3, 737778
	6, 6	-0, 7867	-0, 4667	-1, 52089	0, 618844	0, 217778
	7, 0	-0, 3867	-0, 0667	0, 180444	0, 149511	0, 004444
	10, 8	3, 4133		-0, 22756	11, 65084
Итог			9, 813333	65, 3173	54, 0533

С помощью итоговых сумм подсчитаем величину коэффициента автокорреляции первого порядка:

Это значение свидетельствует о слабой зависимости текущих уровней ряда от непосредственно им предшествующих. Однако из графика очевидно наличие возрастающей тенденции уровней ряда, на которую накладываются циклические колебания.

Продолжая аналогичные расчеты для второго, третьего и т.д. порядков, получим автокорреляционную функцию, значения которой сведем в таблицу и построим по ней коррелограмму:

Лаг
	0, 16515	0, 56687	0, 11355	0, 98302	0, 11871	0, 72204	0, 00336	0, 97384

Из коррелограммы видно, что наиболее высокий коэффициент корреляции наблюдается при значении лага, равном четырем, следовательно, ряд имеет циклические колебания периодичностью в четыре квартала. Это подтверждается и графическим анализом структуры ряда.

В случае, если при анализе структуры временного ряда обнаружена только тенденция и отсутствуют циклические колебания (случайная составляющая присутствует всегда), следует приступать к моделированию тенденции. Если же во временном ряде имеют место и циклические колебания, прежде всего следует исключить именно циклическую составляющую, и лишь затем приступать к моделированию тенденции. Выявление тенденции состоит в построении аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда.

Зависимость от времени может принимать разные формы, поэтому для её формализации используют различные виды функций:

- линейный тренд: ;

- гипербола: ;

- экспоненциальный тренд: (или );

- степенной тренд: ;

- параболический тренд второго и более высоких порядков:

Параметры каждого из трендов можно определить обычным МНК, используя в качестве независимой переменной время , а в качестве зависимой переменной – фактические уровни временного ряда y_t (или уровни за вычетом циклической составляющей, если таковая была обнаружена). Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.

Существует несколько способов определения типа тенденции. Чаще всего используют качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни y_t и y_t_-1 тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.

Выбор наилучшего уравнения в случае, если ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации и выбора уравнения тренда с максимальным значением этого коэффициента. Реализация этого метода относительно проста при компьютерной обработке данных.

При анализе временных рядов, содержащих сезонные или циклические колебания, наиболее простым подходом является расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временнó го ряда в форме (1) или (2).

Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель (1), в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель (2), которая ставит уровни ряда в зависимость от значений сезонной компоненты.

Построение модели (1) или (2) сводится к расчету значений Т, S или Е для каждого уровня ряда. Процесс построения модели включает в себя следующие шаги:

1. Выравнивание исходного ряда методом скользящей средней.

2. Расчет значений сезонной компоненты S.

3. Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных (Т+Е) в аддитивной или (Т·Е) в мультипликативной модели.

4. Аналитическое выравнивание уровней (Т+Е) или (Т·Е) и расчет значений Т с использованием полученного уравнения тренда.

5. Расчет полученных по модели значений (Т+S) или (Т·S)

6. Расчет абсолютных и относительных ошибок.

Пример. Построение аддитивной модели временного ряда. Рассмотрим данные об объёме потребления электроэнергии жителями района из ранее приведенного примера. Из анализа автокорреляционной функции было показано, что данный временнó й ряд содержит сезонные колебания периодичностью в 4 квартала. Объёмы потребления электроэнергии в осенне – зимний период (I и IV кварталы) выше, чем весной и летом (II и III кварталы). По графику этого ряда можно установить наличие приблизительно равной амплитуды колебаний. Это говорит о возможном наличии аддитивной модели. Рассчитаем её компоненты.

Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней.

Поскольку циклические колебания имеют периодичность в 4 квартала, просуммируем уровни ряда последовательно за каждые 4 квартала со сдвигом на один момент времени и определим условные годовые объёмы потребления электроэнергии (колонка 3 в таблице 1).

Разделив полученные суммы на 4, найдем скользящие средние (колонка 4 таблицы 1). Полученные таким образом выровненные значения уже не содержат сезонной компоненты.

Поскольку скользящие средние получены осреднением четырех соседних уровней ряда, т.е. четного числа значений, они соответствуют серединам подынтервалов, состоящих из четверок чисел, т.е. должны располагаться между третьим и четвертым значениями четверок исходного ряда. Для того, чтобы скользящие средние располагались на одних временных отметках с исходным рядом, пары соседних скользящих средних ещё раз усредняются и получаются центрированные скользящие средние (колонка 5 таблицы 1). При этом теряются первые две и последние две отметки временного ряда, что связано с осреднением по четырем точкам.

Таблица 1

№ квартала	Потребление электроэнергии y_t	Итого за четыре квартала	Скользящая средняя за четыре квартала	Центрированная скользящая средняя	Оценка сезонной компоненты

	6, 0
	4, 4
	5, 0	24, 4	6, 10	6, 25	-1, 250
	9, 0	25, 6	6, 40	6, 45	2, 550
	7, 2	26, 0	6, 50	6, 625	0, 575
	4, 8	27, 0	6, 75	6, 875	-2, 075
	6, 0	28, 0	7, 00	7, 1	-1, 100
	10, 0	28, 8	7, 20	7, 3	2, 700
	8, 0	29, 6	7, 40	7, 45	0, 550
	5, 6	30, 0	7, 50	7, 625	-2, 025
	6, 4	31, 0	7, 75	7, 875	-1, 475
	11, 0	32, 0	8, 00	8, 125	2, 875
	9, 0	33, 0	8, 25	8, 325	0, 675
	6, 6	33, 6	8, 40	8, 375	-1, 775
	7, 0	33, 4	8, 35
	10, 8

Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда (колонка 2 таблицы 1) и центрированными скользящими средними (колонка 5). Эти значения помещаем в колонку 6 таблицы 1 и используем для расчета значений сезонной компоненты (таблица 2), которые представляют собой средние за каждый квартал (по всем годам) оценки сезонной компоненты S_i. В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период (в данном случае – за год) взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем точкам (здесь – по четырем кварталам) должна быть равна нулю.

Таблица 2

Показатели	Год	№ квартала, i
I	II	III	IV
		-	-	-1, 250	2, 550
	0, 575	-2, 075	-1, 100	2, 700
	0, 550	-2, 025	-1, 475	2, 875
	0, 675	-1, 775	-	-
Итого за I-й квартал (за все годы)		1, 800	-5, 875	-3, 825	8, 125
Средняя оценка сезонной компоненты для I-го квартала,		0, 600	-1, 958	-1, 275	2, 708
Скорректированная сезонная компонента,		0, 581	-1, 977	-1, 294	2, 690

Для данной модели сумма средних оценок сезонной компоненты равна:

0, 6-1, 958-1, 275+2, 708=0, 075.

Эта сумма оказалась не равной нулю, поэтому каждую оценку уменьшим на величину поправки, равной одной четверти полученного значения:

Δ =0, 075/4=0, 01875.

Рассчитаем скорректированные значения сезонной компоненты (они записаны в последней строке таблицы 2):

(8)

Эти значения при суммировании уже равны нулю:

0, 581-1, 977-1, 294+2, 69=0.

Шаг 3. Исключаем влияние сезонной компоненты, вычитая её значения из каждого уровня исходного временного ряда. Получаем величины:

T+E=Y-S (9)

Эти значения рассчитываются в каждый момент времени и содержат только тенденцию и случайную компоненту (колонка 4 следующей таблицы):

Таблица 3

t				T	T+S		E²

	6, 0	0, 581	5, 419	5, 902	6, 483	-0, 483	0, 2332
	4, 4	-1, 977	6, 377	6, 088	4, 111	0, 289	0, 0833
	5, 0	-1, 294	6, 294	6, 275	4, 981	0, 019	0, 0004
	9, 0	2, 69	6, 310	6, 461	9, 151	-0, 151	0, 0228
	7, 2	0, 581	6, 619	6, 648	7, 229	-0, 029	0, 0008
	4, 8	-1, 977	6, 777	6, 834	4, 857	-0, 057	0, 0032
	6, 0	-1, 294	7, 294	7, 020	5, 726	0, 274	0, 0749
	10, 0	2, 69	7, 310	7, 207	9, 897	0, 103	0, 0107
	8, 0	0, 581	7, 419	7, 393	7, 974	0, 026	0, 0007
	5, 6	-1, 977	7, 577	7, 580	5, 603	-0, 003	0, 0000
	6, 4	-1, 294	7, 694	7, 766	6, 472	-0, 072	0, 0052
	11, 0	2, 69	8, 310	7, 952	10, 642	0, 358	0, 1278
	9, 0	0, 581	8, 419	8, 139	8, 720	0, 280	0, 0785
	6, 6	-1, 977	8, 577	8, 325	6, 348	0, 252	0, 0634
	7, 0	-1, 294	8, 294	8, 512	7, 218	-0, 218	0, 0474
	10, 8	2, 69	8, 110	8, 698	11, 388	-0, 588	0, 3458

Шаг 4. Определим трендовую компоненту данной модели. Для этого проведем выравнивание ряда (Т+Е) с помощью линейного тренда:

Подставляя в это уравнение значения , найдем уровни Т для каждого момента времени (колонка 5 таблицы 3).

Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням Т значения сезонной компоненты для соответствующих кварталов, т.е. к значениям в колонке 5 таблицы 3 прибавим значения в колонке 3. Результаты операции представлены в колонке 6 таблицы 3.

Шаг 6. В соответствии с методикой построения аддитивной модели расчет ошибки производим по формуле:

(10)

Это абсолютная ошибка. Численные значения абсолютных ошибок приведены в колонке 7 таблицы 3.

По аналогии с моделью регрессии для оценки качества построения модели или для выбора наилучшей модели можно применять сумму квадратов полученных абсолютных ошибок. Для данной аддитивной модели сумма квадратов абсолютных ошибок равна 1, 10. По отношению к общей сумме квадратов отклонений уровней ряда от его среднего уровня, равной 71, 59, эта величина составляет чуть более 1, 5%. Следовательно, можно сказать, что аддитивная модель объясняет 98, 5% общей вариации уровней временного ряда потребления электроэнергии за последние 16 кварталов.

Пример. Построение мультипликативной модели временного ряда. Пусть имеются поквартальные данные о прибыли компании за последние четыре года:

Таблица 4

Квартал Год	I	II	II	IV

График временного ряда свидетельствует о наличии сезонных колебаний периодичностью 4 квартала и общей убывающей тенденции уровней ряда:

Прибыль компании в весенне-летний период выше, чем в осенне-зимний период. Поскольку амплитуда сезонных колебаний уменьшается, можно предположить существование мультипликативной модели. Определим её компоненты.

Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Методика, применяемая на этом шаге, полностью совпадает с методикой аддитивной модели. Результаты расчетов оценок сезонной компоненты представлены в таблице:

Таблица 5

№ квартала	Прибыль компании	Итого за четыре квартала	Скользящая средняя за четыре квартала	Центрированная скользящая средняя	Оценка сезонной компоненты



			81, 500	81, 250	1, 108
			81, 000	80, 000	0, 800
			79, 000	77, 750	0, 900
			76, 500	75, 750	1, 215
			75, 000	74, 000	1, 081
			73, 000	71, 500	0, 811
			70, 000	68, 500	0, 905
			67, 000	65, 750	1, 217
			64, 500	63, 250	1, 075
			62, 000	59, 500	0, 807
			57, 000	54, 750	0, 950
			52, 500	50, 250	1, 194
			48, 000

Шаг 2. Найдем оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (колонка 6 таблицы). Используем эти оценки для расчета значений сезонной компоненты S. Для этого найдем средние за каждый квартал оценки сезонной компоненты S_i. Взаимопогашаемость сезонных воздействий в мультипликативной модели выражается в том, что сумма значений сезонной компоненты по всем кварталам должна равняться числу периодов в цикле. В нашем случае число периодов одного цикла (год) равно четырем кварталам. Результаты расчетов сведем в таблицу:

Таблица 6

Показатели	Год	№ квартала, i
I	II	III	IV
		-	-	1, 108	0, 800
	0, 900	1, 215	1, 081	0, 817
	0, 905	1, 217	1, 075	0, 807
	0, 950	1, 194	-	-
Итого за I-й квартал (за все годы)		2, 755	3, 626	3, 264	2, 424
Средняя оценка сезонной компоненты для I-го квартала,		0, 918	1, 209	1, 088	0, 808
Скорректированная сезонная компонента,		0, 913	1, 202	1, 082	0, 803

Здесь сумма средних оценок сезонных компонент по всем четырем кварталам

не равна четырем. Чтобы эта сумма равнялась четырем, умножим каждое слагаемое на поправочный коэффициент

т.е.

. (11)

Значения скорректированных сезонных компонент записаны в последней строке таблицы 6. Теперь их сумма равна четырем. Занесем эти значения в новую таблицу (колонка 3 таблицы 7):

Таблица 7

t	y_t	S_i		T	T·S

		0, 913	78, 86	87, 80	80, 16	0, 898	-8, 165	66, 66
		1, 202	83, 19	85, 03	102, 20	0, 978	-2, 204	4, 86
		1, 082	83, 18	82, 25	89, 00	1, 011	1, 002	1, 00
		0, 803	79, 70	79, 48	63, 82	1, 003	0, 179	0, 03
		0, 913	76, 67	76, 70	70, 03	1, 000	-0, 030	0, 00
		1, 202	76, 54	73, 93	88, 86	1, 035	3, 139	9, 85
		1, 082	73, 94	71, 15	76, 99	1, 039	3, 013	9, 08
		0, 803	72, 23	68, 38	54, 91	1, 056	3, 093	9, 57
		0, 913	67, 91	65, 60	59, 90	1, 035	2, 105	4, 43
		1, 202	66, 56	62, 83	75, 52	1, 059	4, 482	20, 08
		1, 082	62, 85	60, 05	64, 98	1, 047	3, 024	9, 14
		0, 803	59, 78	57, 28	45, 99	1, 044	2, 007	4, 03
		0, 913	56, 96	54, 50	49, 76	1, 045	2, 240	5, 02
		1, 202	49, 92	51, 73	62, 18	0, 965	-2, 176	4, 73
		1, 082	46, 21	48, 95	52, 97	0, 944	-2, 966	8, 79
		0, 803	37, 36	46, 18	37, 08	0, 809	-7, 080	50, 12

Шаг 3. Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. Тем самым мы получим величины

, (12)

которые содержат только тенденцию и случайную компоненту (колонка 4).

Шаг 4. Определим трендовую компоненту в мультипликативной модели. Для этого рассчитаем параметры линейного тренда, используя уровни (Т+Е). Уравнение тренда имеет вид:

Подставляя в это уравнение значения , найдем уровни Т для каждого момента времени (колонка 5 таблицы).

Шаг 5. Найдем уровни ряда по мультипликативной модели, умножив уровни Т на значения сезонной компоненты для соответствующих кварталов (колонка 6 таблицы).

Шаг 6. Расчет ошибок в мультипликативной модели произведем по формуле:

. (13)

Численные значения ошибок приведены в колонке 7 таблицы. Для того, чтобы сравнить мультипликативную модель и другие модели временного ряда, можно по аналогии с аддитивной моделью использовать сумму квадратов абсолютных ошибок. Абсолютные ошибки в мультипликативной модели определяются как:

. (14)

В данной модели сумма квадратов абсолютных ошибок составляет 207, 4. Общая сумма квадратов отклонений фактических уровней этого ряда от среднего значения равна 5023. Таким образом, доля объясненной дисперсии уровней ряда составляет 95, 9%.

Прогнозирование по аддитивной или мультипликативной модели временного ряда сводится к расчету будущего значения временного ряда по уравнению модели без случайной составляющей в виде

(1’)

для аддитивной или

(2’)

для мультипликативной модели.

⇐ Предыдущая 2 3 4 5 6 7 8 91011 Следующая ⇒