Практическая работа №1. Решение задач эконометрики с применением парной линейной регрессии

Батасова В.С.

Практикум по основам эконометрики в среде Excel: учебное пособие по курсу «Эконометрика». – М.: Издательский дом МЭИ, 2009.– 68 с.

ISBN

Практикум предназначен для приобретения студентами навыков решения задач эконометрики с целью дальнейшего применения в специальных дисциплинах и практической деятельности. Включает работы по следующим темам: линейная парная регрессия, линейная множественная регрессия, временные ряды, фиктивные переменные, одновременные уравнения.

Предназначен для студентов всех направлений подготовки факультета «Экономика и управление» ГПИ МЭИ (ТУ) при изучении курса эконометрики. Может использоваться всеми студентами экономических специальностей.

ISBN © Московский энергетический институт, 2009

Введение

В настоящее время стремительно развиваются науки, связанные с применением математических методов и информационных технологий в различных областях человеческой деятельности. Эконометрика – одна из таких наук.

Эконометрика занимается разработкой и применением статистических методов для определения взаимосвязей между экономическими переменными. Основная цель таких исследований состоит в том, чтобы получить возможность по значениям одних переменных прогнозировать значения других.

Эконометрика – одна из дисциплин, составляющих базовую подготовку экономистов. Она входит в Государственные образовательные стандарты для экономических специальностей как обязательная дисциплина.

Предлагаемый практикум состоит из шести работ, материал которых приблизительно соответствует программе по эконометрике для вузов. Цель практикума – приобретение студентами навыков решения эконометрических задач для дальнейшего применения их в специальных дисциплинах и практической деятельности.

Задачи взяты из [1-10]. Некоторые задачи упрощены, учитывая небольшой объем часов практических занятий.

Для успешного прохождения практикума необходимо, чтобы студенты были знакомы с основами теории вероятностей и математической статистики в объеме [5 (гл.1, 2), 2], а также имели навыки работы в среде Microsoft Excel

Выбор табличного процессора Excel как вычислительной среды обусловлен, с одной стороны, наличием в нем достаточно мощных инструментов для эконометрических расчетов (статистические функции, пакет анализа). С другой стороны, в Excel результат можно получить разными способами, в том числе легко сделать проверочные расчеты по формулам, не используя указанные инструменты. Еще одним преимуществом Excel является доступность; несомненно, этот табличный процессор имеет большую популярность, чем любая система статистического анализа данных.

Задания пособия использовались при проведении занятий по эконометрике со студентами различных специальностей дневного и вечернего отделения факультета «Экономика и управление» ГПИ МЭИ в 2005-2008 гг.

Практическая работа №1. Решение задач эконометрики с применением парной линейной регрессии

Теоретическая часть

Понятие тесноты связи

Заметим, что сдвиг b нельзя считать объективной характеристикой зависимости Y от X, потому что его величина определяется выбором начала координат. Из соотношения (5), в частности, следует, что для МНК-оценок прямая, задаваемая уравнением (2), всегда проходит через точку ( ). Подставив (5) в (2), после несложных преобразований получим:

. (6)

Это соотношение связывает отклонения оценки отклика и фактора от их выборочных средних значений. Переход от величин к их отклонениям от среднего называется центрированием этих величин. Заметим, что значение в соотношении (6) не присутствует.

На первый взгляд кажется, что по величине коэффициента можно судить о степени зависимости Y от X: чем больше , тем сильнее зависимость. Это не совсем так, потому что на величину влияет выбор единиц измерения X и Y. Для получения более объективной, чем , характеристики зависимости X и Y, следует найти связь между их нормированными значениями. Нормировку обычно проводят делением величины X (и, соответственно, Y) на ее выборочное среднее квадратичное отклонение s_x (s_y). Разделим обе части соотношения (6) на s_y, а затем правую часть умножим и разделим на s_x. Тогда получим:

(7)

где введено обозначение:

Величина r называется выборочным коэффициентом корреляции (см. Приложение). Коэффициент r показывает, на сколько значений s_y в среднем увеличится отклик, если фактор увеличится на s_x. Говорят, что выборочный коэффициент корреляции характеризует тесноту связи между X и Y.

Известно, что |r| ≤ 1. Чем ближе |r| к 1, тем теснее связь между X и Y; чем ближе |r| к 0, тем слабее связь. При r=±1 точки наблюдений лежат на прямой, задаваемой соотношением (2). При r=0 прямая (2) параллельна оси абсцисс, и связь между X и Y отсутствует. Примеры тесной и слабой связи даны на рис.2.

Теоретическая часть

Постановка задачи

Продолжаем исследовать зависимость добычи угля на 1 рабочего (Y) от толщины угольного пласта (Х) (см. таблицу 1). Требуется:

1. Найти с надежностью γ =0, 95 интервальные оценки коэффициента регрессии m и дисперсии s² возмущений.

2. Построить 95-процентные доверительные интервалы линии регрессии и индивидуальных значений отклика.

3. Повторить п.п.1-2 для доверительной вероятности 0, 9.

2.2. Выполнение задания в среде Excel

Доверительный интервал коэффициента регрессии определяем по формуле (18). В практической работе №1 уже нашли: 1, 02, =0, 207 (см. таблицу 3); t(0, 05; 8)=2, 31 (с помощью функции СТЬЮДРАСПОБР). Подставив эти значения в формулу (18), получаем 95-процентный доверительный интервал для коэффициента m: 0, 538≤ m≤ 1, 495.

Для расчета интервальной оценки дисперсии возмущений в формулу (19) подставляем значение Q_e=8, 39 из таблицы 3. Квантили распределения хи-квадрат находим, применяя функцию ХИ2ОБР: c²(0, 025; 8)=17, 53, c²(0, 975; 8)=2, 18. Получаем 95-процентный доверительный интервал дисперсии возмущений: 0, 479≤ s²≤ 3, 85.

Расчеты доверительных границ функции регрессии и индивидуальных значений отклика приведены в таблице 5. Рассматривался немного более широкий диапазон x, чем диапазон наблюдений. Значения вычислялись по формуле (2), – по формуле (20), s_y _* – по формуле (23). Значения , , , s были взяты из таблицы 3. Через N (V) обозначена нижняя (верхняя) доверительная граница функции регрессии, через N инд (V инд) –нижняя (верхняя) доверительная граница индивидуальных значений отклика. В соответствии с соотношениями (21), (22) использовались формулы:

Графики доверительных границ, построенные по таблице 5, показаны на рис. 4.

Таблица 5. Расчеты доверительного интервала функции регрессии

x
	3, 34	4, 36	5, 38	6, 39	7, 41	8, 43	9, 44	10, 46	11, 48
	0, 78	0, 59	0, 43	0, 33	0, 35	0, 46	0, 63	0, 81	1, 01
N	1, 56	2, 99	4, 37	5, 62	6, 61	7, 36	7, 99	8, 58	9, 15
V	5, 13	5, 73	6, 38	7, 16	8, 21	9, 50	10, 89	12, 34	13, 80
s_y*	1, 28	1, 18	1, 11	1, 08	1, 08	1, 12	1, 20	1, 31	1, 44
N ind	0, 38	1, 63	2, 81	3, 91	4, 92	5, 83	6, 67	7, 44	8, 16
V ind	6, 31	7, 09	7, 94	8, 88	9, 90	11, 02	12, 21	13, 48	14, 79

Для быстрого выполнения расчетов необходимо грамотно использовать абсолютные адреса ячеек Excel. Так, например, чтобы провести вычисления для двух значений доверительной вероятности (γ =0, 95 и γ =0, 9) достаточно:

записать значение γ =0, 95 в ячейку листа Excel;
выполнить расчеты, ссылаясь на эту ячейку с абсолютным адресом;
изменить значение в ячейке с 0, 95 на 0, 9, чтобы получить результаты для γ =0, 9 (в результате автоматического пересчета по формулам).

3. Задание на самостоятельную работу.

Продолжаем исследование зависимости доли расходов на продовольственные товары в общих расходах (Y) от средней дневной заработной платы одного работающего (X) в семи территориях Уральского региона (таблица 4). Необходимо провести расчеты доверительных интервалов параметров линейной регрессии по аналогии с §2.

Теоретическая часть

О выборе линейной модели

В настоящем пособии рассматривается только линейная регрессионная модель. Такой выбор обусловлен, с одной стороны, ограниченным объемом практикума, а, с другой стороны, тем, что именно линейная модель чаще всего используется в эконометрических исследованиях.

Причины, по которым предположение о линейности связи Y(X) получило распространение, перечислены ниже (см., например, [5]):

1. Простота линейной модели.

2. Для линейной модели характерен меньший риск существенной ошибки прогноза.

3. Если двумерная случайная величина (X, Y) имеет нормальное распределение, то уравнение регрессии Y(X) является линейным (также как и уравнение регрессии X(Y)). Предположение о нормальном распределении часто является вполне обоснованным.

4. Многие традиционно используемые в эконометрике зависимости Y от X можно свести к линейной модели заменой переменных (например, для экспоненциальной зависимости достаточно вместо Y рассмотреть lnY).

5. Большинство «гладких» нелинейных зависимостей можно привести к линейным (DY»f′ DX при малом DX).

Насколько хорошо линейная (и любая другая) модель соответствует реальному объекту можно судить лишь продолжая наблюдения над объектом и сравнивая прогнозируемые значения величин с реальными. Математические аспекты анализа качества линейной модели рассматривались в §1.5.

Таблица 11. Оценки коэффициентов регрессии

	Коэффи-циенты	Стандартная ошибка	t-стати стика	P-значе ние(a_min)	Нижние 95%	Верхние 95%
Y-пересечение	b₀=-3, 54	=1, 91	T₀=-1, 86	0, 106	-8, 05	0, 969
толщина пласта (м)-х₁	b₁=0, 854	=0, 221	T₁=3, 87	0, 006	0, 333	1, 375
уровень механизации работ (%) – х₂	b₂=0, 367	=0, 243	T₂=1, 51	0, 175	-0, 207	0, 942

Поясним смысл столбца «Значимость F» таблицы 10. В нем приведено минимальное значение a_min, такое что при a³ a_min выполняется неравенство (35), и, следовательно, гипотеза о незначимости регрессии отвергается. Аналогично в столбце «P-значение» таблицы 11 даны значения a_min, такие что при a³ a_min справедливо неравенство (37), с помощью которого определяется значимость коэффициентов регрессии.

Читателю предлагается убедиться, что с помощью функции ЛИНЕЙН и окна Регрессия пакета анализа получились одинаковые результаты. Заметим, что пакет анализа использует функцию ЛИНЕЙН.

3. Задание на самостоятельную работу*

Предприниматель намерен использовать множественный регрессионный анализ для оценки стоимости офисного здания в заданном районе, используя данные таблицы 12. Для этого предлагается выполнить следующую работу:

1. Определить уравнение регрессии и его характеристики.

2. Проанализировать значения коэффициентов детерминации (стандартного и адаптированного). Можно ли говорить о сильной зависимости между объясняющими переменными и стоимостью здания?

3. Проверить значимость уравнения регрессии по критерию Фишера при уровне значимости 0, 05.

4. Построить доверительные интервалы для коэффициентов уравнения регрессии.

5. Проверить значимость коэффициентов уравнения регрессии при уровне значимости 0, 05. Все ли факторы полезны при оценке стоимости здания?

Таблица 12. Данные по стоимости офисных зданий

№	Общая площадь (кв.м) X₁	Количество офисов X₂	Количество входов X₃	Срок эксплуатации (год) X₄	Стоимость (млн. у. е.), Y
1.	2 310
2.	2 333
3.	2 356		1, 5**
4.	2 379
5.	2 402
6.	2 425
7.	2 448		1, 5**
8.	2 471				142, 9
9.	2 494
10.	2 517
11.	2 540

Теоретическая часть

Метод скользящего среднего

Метод скользящего среднего (МСС) состоит в замене каждых k последовательных уровней ряда их средним значением. Величина k называется окном усреднения (сглаживания).

Если k нечетно (k=2l+1, где l-целое положительное число), то скользящее среднее u_t задается формулой:

Таким образом, среднее, вычисленное по k уровням ряда, приписывается к срединному моменту времени окна сглаживания. В приведенной выше формуле t=l+1, …, n-l. Следовательно, скользящее среднее не определено для l начальных и l конечных моментов времени.

Переход от наблюдений Y к скользящему среднему позволяет «сгладить» ряд и получить значения, более близкие к тренду. Действительно, если разброс значений y_t около тренда характеризуется дисперсией s², то разброс среднего по k уровням ряда будет характеризоваться существенно меньшей дисперсией (s²/k – при независимости случайных величин Y(t)). Если ряд содержит циклическую составляющую, то следует брать k равным ее периоду, чтобы отрицательные и положительные отклонения от тренда гасили друг друга.

Рассмотрим случай четного k (k=2l). Предположим, что вычислили среднее значение для 2l моментов времени, начиная с t₀: t₀, t₀+1, …, t₀+l-1, t₀+l, …, t₀+2l-1.Середина такого интервала находится между t₀+l-1 и t₀+l; поэтому непонятно, к какому моменту привязать значение скользящего среднего. Выход состоит в следующем: приписываем среднее любому из этих моментов, например, меньшему – t₀+l-1, а затем полученный ряд еще раз сглаживаем с окном k₁=2, так чтобы скользящее среднее было правильно привязано к центру окна. Эта процедура поясняется также на примере (см. §2.3.4).

Сравним два метода оценивания тренда: аналитический (см. §1.3) и МСС. Первое преимущество МСС состоит в том, что он не требует никаких предположений о характере зависимости T(t); вторым его достоинством является простота вычислений. Очевидный недостаток МСС состоит в отсутствии оценок тренда для первых и последних наблюдений. Кроме того, МСС дает только оценки тренда для моментов наблюдений, и не дает формулу зависимости T(t).

Если ряд имеет циклическую компоненту, то ее значения можно вычислить после определения тренда. Пренебрегая случайными возмущениями, для аддитивной модели ряда из формулы (40) получаем:

S»Y-T, (43)

для мультипликативной модели из формулы (41) получаем:

S»Y/T. (44)

Полученные приближенные значения циклической составляющей далее обрабатываются следующим образом:

усредняются по периодам (так как в идеале значения циклической составляющей от периода к периоду должны повторяться);
выравниваются таким образом, чтобы среднее значение за цикл для аддитивной модели было равно 0, а для мультипликативной модели – 1.

Задание

Для временного ряда, представленного таблицей 13 «Динамика выпуска продукции Финляндии»* выполнить следующие исследования:

1. С помощью мастера диаграмм получить уравнение, график и значение коэффициента детерминации R² для следующих трендов: линейного, логарифмического, степенного, полиномиального третьей и шестой степени, экспоненциального.

2. Выбрать из полученных трендов наиболее соответствующий наблюдениям и логике задачи.

3. Исследовать показательный тренд с помощью функции ЛГРФПРИБЛ.

Таблица 13. Динамика выпуска продукции Финляндии

Год	Выпуск продукции (млн.долл.)	Год	Выпуск продукции (млн.долл.)
1961.		1979.
1962.		1980.
1963.		1981.
1964.		1982.
1965.		1983.
1966.		1984.
1967.		1985.
1968.		1986.
1969.		1987.
1970.		1988.
1971.		1989.
1972.		1990.
1973.		1991.
1974.		1992.
1975.		1993.
1976.		1994.
1977.		1995.
1978.		1996.

Выполнение

Перед построением диаграмм необходимо преобразовать таблицу 13. Во-первых, надо перейти от четырех к двум столбцам (t – год, y – выпуск продукции). Во-вторых, рекомендуется нумеровать рассматриваемые годы, начиная с единицы (сдвинуть начало отсчета времени в точку t=1960); если оставить исходную нумерацию годов, то некоторые коэффициенты уравнений (например, сдвиг в линейном тренде) будут иметь очень большие значения (~10⁶).

Уровни ряда показываем на координатной плоскости (t, y). Для этого выделяем преобразованную таблицу, вызываем мастер диаграмм и выбираем точечную диаграмму без соединительных линий (см. рис. 6).

Для построения тренда достаточно щелчком мыши выделить точки наблюдений, правой кнопкой мыши вызвать контекстное меню, в котором выбрать пункт Добавить линию тренда. В полученном окне Линия тренда на вкладке Тип надо выбрать вид тренда (линейный, логарифмический и т. п.), а на вкладке Параметры поставить флажки Показывать уравнение на диаграмме и Поместить на диаграмму величину R². Результаты для линейного и экспоненциального трендов приведены на рис. 6 и 7. Значения коэффициента детерминации для всех рассмотренных трендов представлены в таблице 14.

Наибольшее значение R² имеет полиномиальный тренд 6-й степени. Однако использование полиномиального тренда обычно приводит к большому риску существенной ошибки прогноза. Поэтому выбираем экспоненциальный тренд, который имеет лишь на 0, 008 меньшее значение R².

Заметим, что линейный тренд, который также имеет достаточно большое значение R², использовать не стоит, так как для начальных значений t он дает отрицательные оценки выпуска продукции y.

Для анализа показательного тренда (y=bm^t) можно использовать функцию ЛГРФПРИБЛ. Эта функция работает так же, как функция ЛИНЕЙН для линейного тренда. Результаты функции расположены, как показано в таблице 2. В таблице 15 приведены результаты применения ЛГРФПРИБЛ к исследуемым данным. Учитывая, что показательный и экспоненциальный тренды однозначно связаны друг с другом, можно сравнить значения параметров тренда из таблицы 15 и рисунка 7: =e^{0, 1106}=1, 12, b=b0=901, 45. Проверим значимость показательного тренда по критерию Фишера. Из таблицы 15 возьмем значение F-статистики: F= 929, 99; определим пороговое значение F-статистики с помощью функции FРАСПОБР: при a=0, 05 и n=36 f(a; 1; n-2)=4, 13. Так как неравенство (14) выполняется, то тренд значим.

Таблица 14. Значения R²

Тренд	R²
Линейный	0, 884
Логарифмический	0, 589
Степенной	0, 847
Полиномиальный 3-й степени	0, 963
Полиномиальный 6-й степени	0, 973
Экспоненциальный	0, 965

Задание 1

В таблице 18 представлены данные об объеме y потребления энергии за четыре года (время t измеряется в кварталах). Сгладить временной ряд методом скользящего среднего, самостоятельно подобрав размер k окна сглаживания.

2.4.2. Выполнение задания 1

Из графика зависимости y(t) (см. рис. 9) видно, что временной ряд содержит циклическую компоненту с периодом T_п=4. Рассчитав с помощью функции КОРРЕЛ выборочный коэффициент автокорреляции r(1, t) (см. таблицу 19) и построив коррелограмму (с помощью мастера диаграмм – см. рис.10), получаем, что максимум коэффициента автокорреляции имеет место при значениях t, кратных четырем; это подтверждает (см. §1.2), что T_п=4. Окно сглаживания следует выбрать равным (см. §1.5) периоду циклической составляющей: k=T_п=4. Тогда результатом сглаживания будет являться приближенный тренд (за период положительные и отрицательные значения циклической составляющей будут компенсировать друг друга).

В третьем столбце таблицы 18 приведены результаты расчета скользящего среднего u₁(t) для k=4. Средняя точка t_ср окна сглаживания находится между вторым и третьим моментом времени окна. Так, например, для первого окна (содержащего моменты времени t=1, 2, 3, 4) t_ср=2, 5; такого момента времени в наших данных нет, и мы приписываем среднее значение наблюдений по окну моменту t=2. Для второго окна t_ср=3, 5, и среднее значение наблюдений по второму окну будет приписано моменту t=3. Аналогично, среднее значение наблюдений для каждого следующего скользящего окна мы будем приписывать второму моменту времени этого окна.

Для установки соответствия между средним значением наблюдений по окну и серединой окна t_ср необходимо применить к u₁(t) метод скользящего среднего с окном сглаживания, равным двум: u₂(t)=[u₁(t-1)+u₁(t)]/2. Результаты расчета приведены в таблице 18 (четвертый столбец). Напомним (см. также §1.5), что расчет u₂ нужен только в случае четного k. Для нечетного k средняя точка окна сглаживания t_ср совпадает с одним из имеющихся в таблице моментов времени.

Таблица 18. Расчет тренда и циклической составляющей

t	y	u₁	u₂	S₁=y-u₂	S₂	S₃	S	T+E=Y-S	T	E
							0, 581	5, 419	5, 902	-0, 483
	4, 4	6, 100					-1, 977	6, 377	6, 088	0, 289
		6, 400	6, 250	-1, 250	-1, 275	-1, 294	-1, 294	6, 294	6, 275	0, 019
		6, 500	6, 450	2, 550	2, 708	2, 690	2, 690	6, 310	6, 461	-0, 151
	7, 2	6, 750	6, 625	0, 575	0, 600	0, 581	0, 581	6, 619	6, 648	-0, 029
	4, 8	7, 000	6, 875	-2, 075	-1, 958	-1, 977	-1, 977	6, 777	6, 834	-0, 057
		7, 200	7, 100	-1, 100			-1, 294	7, 294	7, 020	0, 273
		7, 400	7, 300	2, 700			2, 690	7, 310	7, 207	0, 104
		7, 500	7, 450	0, 550			0, 581	7, 419	7, 393	0, 026
	5, 6	7, 750	7, 625	-2, 025			-1, 977	7, 577	7, 580	-0, 003
	6, 4	8, 000	7, 875	-1, 475			-1, 294	7, 694	7, 766	-0, 072
		8, 250	8, 125	2, 875			2, 690	8, 310	7, 952	0, 358
		8, 400	8, 325	0, 675			0, 581	8, 419	8, 139	0, 280
	6, 6	8, 350	8, 375	-1, 775			-1, 977	8, 577	8, 325	0, 252
				Сумма	0, 075	0, 000	-1, 294	8, 294	8, 512	-0, 218
	10, 8			Среднее	0, 019	0, 000	2, 690	8, 110	8, 698	-0, 588

Таблица 19. Коэффициент автокорреляции.

τ	r(τ )

	0, 17
	0, 57
	0, 11
	0, 98
	0, 12
	0, 72

	0, 97

Задание 2

Вычислить значения циклической компоненты временного ряда по данным таблицы 18. Результаты записать в эту же таблицу.

2.4.4. Выполнение задания 2

Рассматриваемый временной ряд описывается аддитивной моделью, так как амплитуда колебаний уровней ряда практически не зависит от времени (см. рис. 9). По формуле (43) (учитывая, что T»u₂) рассчитываем S₁ – первое приближение циклической компоненты ряда.

Значения S₂ получены усреднением S₁ по периодам. Так как среднее значение циклической компоненты за период для аддитивной модели ряда должно равняться нулю, то выравниваем значения S₂: S₃= S₂-S_{2 ср}, где через S_{2 ср} обозначено среднее значение S₂. Значения циклической компоненты S получены копированием S₃ по всем периодам.

Получив циклическую компоненту, вычислим следующее приближение тренда в предположении, что тренд линеен. Рассчитаем зашумленные значения тренда: T+E=Y-S (см. формулу (40)). Применив к этим значениям МНК (с помощью функции ЛИНЕЙН), получим следующую формулу: T(t)=0, 186t+5, 72. По этой формуле вычислим значения тренда, а затем, учитывая, что E=Y-T-S, – значения случайной компоненты E.

На рис. 9 компоненты ряда показаны графически. Так как случайная компонента существенно меньше остальных компонент ряда, можно считать, что полученные оценки тренда и циклической составляющей вполне приемлемы.

Задание 3

В первых двух столбцах таблицы 20 приведены поквартальные данные о прибыли компании (в усл. ед.) за последние четыре года. Определить трендовую, циклическую и случайную компоненты временного ряда.

2.4.6. Выполнение задания 3

Из графика зависимости y(t) (см. рис. 11, а) видно, что временной ряд содержит циклическую компоненту с периодом T_п=4. Построив коррелограмму (которая здесь не приводится), можно удостовериться, что максимум коэффициента автокорреляции имеет место при значениях t, кратных четырем; это подтверждает, что T_п=4. Окно сглаживания выбираем равным (см. §1.5) периоду циклической составляющей: k=T_п=4.

В третьем и четвертом столбце таблицы 20 приведены результаты расчета приближений тренда u₁(t) и u₂(t), полученные так же, как в таблице 18.

Для рассматриваемого временного ряда следует выбрать мультипликативную модель, так как амплитуда колебаний уровней ряда изменяется пропорционально тренду (см. рис. 11, а). По формуле (44) (учитывая, что T»u₂) рассчитываем S₁ – первое приближение циклической компоненты ряда.

Значения S₂ получены усреднением S₁ по периодам. Так как среднее значение циклической компоненты за период для мультипликативной модели должно равняться единице, то от S₂ переходим к следующему приближению циклической компоненты: S₃= S₂/S_{2 ср}, где S_{2 ср} – среднее значение S₂. Значения циклической компоненты S получены копированием S₃ по всем периодам.

Далее вычислим следующее приближение тренда в предположении, что тренд линеен. Рассчитаем зашумленные значения тренда: TE=Y/S (см. формулу (41)). Применив к этим значениям МНК (с помощью функции ЛИНЕЙН), получим формулу для тренда: T(t)=-2, 77t+90, 57. По этой формуле вычислим значения тренда, а затем – значения случайной компоненты E (E=Y/(TS)). Абсолютная погрешность модели рассчитывается по формуле: Eabs=Y-TS.

На рис. 11 компоненты ряда показаны графически. Заметим, что абсолютная погрешность существенно меньше уровней ряда и тренда. Кроме того, случайная компонента практически для всех значений t близка к единице. Поэтому оценки тренда и циклической составляющей вполне приемлемы.

Таблица 20. Данные о прибыли компании

t	y	u₁	u₂	S₁	S₂	S₃	S	T*E=Y/S	T	E	Eabs
							0, 914	78, 804	87, 792	0, 898	-8, 212
		81, 5					1, 202	83, 182	85, 019	0, 978	-2, 208
			81, 25	1, 108	1, 088	1, 082	1, 082	83, 153	82, 245	1, 011	0, 982
				0, 800	0, 806	0, 802	0, 802	79, 819	79, 472	1, 004	0, 278
		76, 5	77, 75	0, 900	0, 918	0, 914	0, 914	76, 615	76, 699	0, 999	-0, 077
			75, 75	1, 215	1, 208	1, 202	1, 202	76, 527	73, 926	1, 035	3, 127
				1, 081			1, 082	73, 914	71, 152	1, 039	2, 989
			71, 5	0, 811			0, 802	72, 336	68, 379	1, 058	3, 173
			68, 5	0, 905			0, 914	67, 859	65, 606	1, 034	2, 059
		64, 5	65, 75	1, 217			1, 202	66, 545	62, 833	1, 059	4, 463
			63, 25	1, 075			1, 082	62, 827	60, 059	1, 046	2, 995
			59, 5	0, 807			0, 802	59, 865	57, 286	1, 045	2, 067
		52, 5	54, 75	0, 950			0, 914	56, 914	54, 513	1, 044	2, 194
			50, 25	1, 194			1, 202	49, 909	51, 740	0, 965	-2, 201
				Сумма	4, 021		1, 082	46, 196	48, 966	0, 943	-2, 998
				Среднее	1, 005		0, 802	37, 415	46, 193	0, 810	-7, 038

3. Задание на самостоятельную работу

1. В таблице 21* представлены данные о производительности труда Y для некоторого предприятия с 1987 по 1996 г. Получить уравнения и графики трендов: линейного, логарифмического, степенного, полиномиального, экспоненциального. Выбрать из них тренд, наиболее соответствующий наблюдениям (сравнивая значение R²). Для выбранного тренда проверить гипотезу независимости остатков по критерию Дарбина-Уотсона (при n=10 d_н=0, 88 d_в=1, 32). Зачем надо проверять эту гипотезу?

2. В таблице 22** приведено среднее число y яиц на несушку на каждый месяц по США с 1938 по 1940 г. Требуется:

1) построить график y(t) и коррелограмму. Анализируя их, ответить на вопросы: содержит ли ряд линейный тренд? Содержит ли ряд циклическую составляющую? Чему равен период циклической составляющей Тц? Какая модель подходит для описания ряда – аддитивная или мультипликативная?

2) определить компоненты ряда.

Таблица 22. Среднее число y яиц на несушку

Год	Январь	Февраль	Март	Апрель	Май	Июнь
	7, 9	9, 9	15, 4	17, 5	17, 3	14, 9
		9, 7	14, 9			14, 6
	7, 2		14, 4	16, 5		14, 8
Год	Июль	Август	Сентябрь	Октябрь	Ноябрь	Декабрь
	13, 6	11, 8	9, 4	7, 5	5, 9	6, 4
	13, 2	11, 7	9, 3	7, 4		6, 8
	13, 4	11, 8	9, 7	7, 9	6, 2	6, 2

3. В таблице 23 даны уровни некоторого ряда, время t измеряется в кварталах. Провести для этих данных исследования, аналогичные п.2.

Таблица 23. Уровни ряда

Практическая работа №5. Использование фиктивных
переменных при решении задач эконометрики

Теоретическая часть

Выполнение

Предыдущая12 3 4 5 6 7 8 9 10 11 Следующая