|
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Характеристики и критерии качества эконометрических моделей
Выявление лучшего варианта эконометрической модели обычно осуществляется путем сравнения соответствующих им качественных характеристик, которые можно рассчитать на основе исходной статистической информации, содержащейся в векторе у, матрице Х, и новой расчетной информации, появляющейся после построении каждого из вариантов модели. Логика в решении этого вопроса достаточно простая: лучшему варианту модели в общем случае должны соответствовать и лучшие значения характеристик его качества. Здесь следует отметить, что основным условием высокого “качества” модели является обоснованность “математической формы функционала f( a, x t ), как по составу включенных в него независимых переменных, так и по виду их взаимосвязей с зависимой переменной уt, в совокупности определяющих причины ее изменчивости. В этой связи, новая информация, появившаяся после построения функционала f( a, x t), позволяет установить, насколько удалось реализовать это условие на практике. Отметим основные подходы к оценке “качества” эконометрических моделей. Ведущая роль при определении характеристик качества эконометрической модели принадлежит ряду ее “выборочной” ошибки еt, t =1, 2,..., Т, который формируется с использованием найденных оценок ее параметров как
где
В этой связи отметим, что для каждого набора оценок параметров a0, a1, a2,... того или иного варианта модели, описывающей рассматриваемый процесс, рассчитывается “свой” ряд ошибки et, t=1, 2,..., Т, который можно интерпретировать как ряд оценок ее истинных, но неизвестных значений et (см. (1.1)). На первый взгляд, соответствие модели свойствам процесса и точность его аппроксимации малоразличимые между собой понятия. Вместе с тем, в их основе лежат различные представления о мерах адекватности модели и процесса. С использованием методов построения многочленов, например, проходящих через заданные точки (задача интерполяции), можно подобрать такое уравнение f( a, x t ), что его значения в точках t=1, 2,..., Т в точности совпадут с наблюдаемыми значениями зависимой переменной уt. Все значения ошибок в этом случае будут равны нулю еt=0, t=1, 2,..., Т. Однако это уравнение практически никогда не будет выражать общую тенденцию развития переменной уt, сформировавшуюся под влиянием независимых факторов хi, i=1, 2,..., n; ни в промежутках между их зафиксированными в моменты t=1, 2,..., Т значениями, ни тем более в прошедшие и будущие периоды времени (см. рис. 1.3). Уравнение f ( a, x t ) в этом случае будет выражать тенденцию интерполирующего многочлена, а не реального процесса уt. Выражая уравнением f ( a, x t) общие закономерности процесса уt, практически невозможно добиться совпадения его значений и наблюдаемых уровней зависимой переменной уt в п-мерной точке x t, вследствие того что, как было отмечено ранее, этот функционал не учитывает второстепенные причины изменчивости переменной у, исходная информация не точно отражает рассматриваемые явления и т. п. Однако, если вид функционала f( a, x t) в целом соответствует общим закономерностям изменчивости переменной уt, на интервале t=(1, Т), то можно надеяться, что это соответствие имело место и в прошлом (т. е. при t£ 0), и на интервалах (t, t+1) и, что более важно, сохранится и в будущем (при t³ Т+1). Это является “определенной гарантией” того, что использование функционала f( a, x t) в решении задач управления и прогнозирования процесса уt не приведет к серьезным ошибкам. уt
сывающему общую тенденцию переменной уt
кривая, соответствующая интерполирующему функционалу f ( a, x t ),
xt Рис. 1.3. Различие между интерполирующим и описывающим общую тенденцию переменной уt вариантами функционала f ( a, x t )
Вместе с тем очевидно, что среди нескольких различных вариантов функционала f( a, x t), примерно одинаково отражающих общие тенденции процесса уt, более предпочтительным является тот из них, который обеспечивает и лучшую аппроксимацию (в математическом понимании этого термина). В общем случае “качество” эконометрической модели оценивается по двум группам характеристик, хотя, как это будет показано далее, предполагаемая группировка не вполне однозначна, поскольку, во-первых, характеристики каждой из групп часто имеют двойное назначение, а, во-вторых, многие из них взаимосвязаны друг с другом. В первую из групп включим показатели, критерии, выражающие “степень” соответствия построенной модели основным закономерностям описываемого ею процесса. Во вторую – показатели и критерии, в большей степени оценивающие точность ее аппроксимации наблюдаемых значений процесса уt . В этой связи следует отметить, что к критериям первой группы могут быть отнесен и критерий Стьюдента, используемый для оценки значимости влияния каждого из факторов хi, i=1, 2,..., n, на зависимую переменную уt (см. раздел 1.3). Соответствие эконометрической модели описываемому ею процессу уt в значительной степени может быть установлено на основе анализа свойств рассчитанного ряда ошибки et, t=1, 2,..., Т*. Если вариант модели “верно” отражает основные тенденции процесса уt , то можно ожидать, что значения ошибки в определенной степени случайны, их свойства близки к свойствам процесса “белого шума”. Если же тенденция, закономерности процесса уt учитываются моделью не в полной мере (в модель не включены какие-либо существенные с содержательной точки зрения факторы, выбрана форма функционала f( a, x t), не адекватная характеру взаимосвязей между рассматриваемыми переменными и т. п.), то в ряду ошибки обычно появляется некоторая закономерность, свидетельствующая об утрате свойства ее “случайности”. Заметим, что “неслучайный” характер фактической ошибки модели et может быть предопределен и неверно выбранным методом оценки параметров модели. Забегая вперед, отметим, что среди методов оценки параметров линейных эконометрических моделей наибольшее распространение получили метод максимального правдоподобия, метод наименьших квадратов и метод моментов. Каждый из них используется при вполне определенных исходных предпосылках относительно свойств ошибки модели et. Например, классические варианты этих методов используются в предположении, что ошибки совпадают со свойствами процесса “белого шума” (нулевое среднее, конечная дисперсия, отсутствие автокорреляционных связей). При этом “метод максимального правдоподобия” предполагает известным закон распределения ошибки. Чаще всего используется предположение о “нормальности” ее распределения. В этой связи построенная с использованием метода максимального правдоподобия модель будет считаться адекватной рассматриваемому процессу, если свойства фактической ошибки et, определенной согласно выражению (1.27), будут не слишком сильно отличаться от предполагаемых свойств ошибки et (“белого шума” с нормальным распределением). Метод наименьших квадратов не выдвигает столь жестких требований к закону распределения ошибки. Согласно ему оценки параметров моделей определяются исходя из критерия минимума суммы квадратов ошибки. В такой ситуации модель, построенная с использованием данного метода, будет считаться адекватной рассматриваемым процессам, если ее ошибка по своим свойствам идентична “белому шуму”. Если в отношении ошибки эконометрической модели et выдвигаются предположения, что ее свойства отличны от свойств “белого шума”, то для оценки параметров модели обычно используются так называемые обобщенные модификации данных методов. Отличие ошибки модели от “белого шума” может выражаться, например, непостоянством ее дисперсии на различных участках интервала t=1, 2,..., Т; наличием взаимосвязи между ее соседними значениями, выражаемыми, например, уравнением следующего вида et =b× et–1+xt, где xt – новая ошибка, по своим свойствам близкая к процессу “белого шума” и т. п. Однако на практике для моделей многих типов такие свойства ошибки модели априорно предвидеть обычно не представляется возможным. Их можно установить, только анализируя свойства фактической ошибки et, полученной для моделей, оценки коэффициентов которых определены с использованием “классических” методов оценивания. Таким образом, наличие или отсутствие свойства “случайности” в ряду выборочной ошибки модели et, t =1, 2,..., Т; в определенной мереуказывает на “соответствие” или “несоответствие” модели описываемому ею процессу у. В том случае, когда ошибка модели “неслучайна”, может быть рекомендовано уточнить рассматриваемый вариант модели, выбрать более подходящий для данной ситуации метод оценки ее параметров. Как было отмечено выше, “неслучайность” ошибки может иметь различный характер. Наиболее часто она выражается наличием автокорреляционной связи между соседними ее значениями, тенденциями, характеризующими изменения их квадратов, т. е. тенденциями в ряду et2, t=1, 2,..., Т и других ее производных. Для выявления “неслучайности” в ряду ошибки модели обычно используют специфические тесты, многие из которых будут рассмотрены в последующих главах учебника применительно к моделям соответствующих типов. Здесь же в качестве примера опишем особенности использования для этих целей достаточно универсального теста (критерия) Дарбина-Уотсона. Он наиболее широко применяется в эконометрических исследованиях вследствие своей простоты, хотя и не обладает существенной эффективностью (достоверностью). Тест Дарбина-Уотсона обычно используется для установления факта наличия автокорреляционной зависимости первого порядка в ряду ошибки et, т. е. между соседними ее значениями, et и et+1, t=1, 2,..., Т. Обычно соседние значения ошибки связаны более сильной зависимостью, чем значения et и et+2, et и et+3 и т. д. Вследствие этого отсутствие автокорреляционной связи между рядами значений выборочной ошибки et и et–1, t=1, 2,..., Т–1; позволяет с большой степенью уверенности утверждать, что в ряду истинной ошибки модели et отсутствуют вообще какие-либо автокорреляционные взаимосвязи. Значение критерия Дарбина-Уотсона рассчитывается по следующей формуле
Раскрывая квадрат в числители выражения (1.29), получим:
где r1– коэффициент автокорреляции первого порядка ошибки et, т. е. корреляции между рядами et и et+1. Из выражения (1.30) непосредственно вытекает, что
0 £ d £ 4. (1.31)
Значение d=0 соответствует случаю, когда между рядами et и et+1существует строгая положительная линейная зависимость, т. е. r1=+1, и значение d=4 соответствует строгой отрицательной связи, r1=–1. Если ряды et и et +1независимы, то r1=0 и d=2. Точки d=0; 2; 4 и определяют границы критерия Дарбина-Уотсона, в пределах которых гипотеза о наличии автокорреляции первого порядка в последовательности ошибок либо принимается (в областях близких к 0 или 4), либо отвергается (в области d=2), либо решение по данному критерию остается неопределенным (в промежутках между отмеченными областями). Иными словами, на отрезке [0, 4] выделяются четыре промежуточные точки, таким образом, что 0£ d1£ d2£ 2£ d3£ d4£ 4. Если расчетное значение критерия Дарбина-Уотсона находится на отрезках [0, d1], [d4, 4], то гипотеза о наличии автокорреляции первого порядка в ряду ошибок модели принимается, если расчетное значение d находится в интервале [d2, d3], – то отвергается. Значения d, приходящиеся на полуинтервалы [d1, d2] и [d3, d4], не позволяют сделать однозначного суждения по данной гипотезе. В последнем случае необходимо проводить более глубокий анализ зависимостей между значениями ошибки et, t=1, 2,..., Т. Другую группу критериев, в большей степени направленных на выявление степени точности аппроксимации функционалом f( a, x t ) наблюдаемых значений зависимой переменной уt, образуют широко используемые в статистике и эконометрике коэффициент множественной корреляции R, коэффициент детерминации D, критерий Фишера F. Здесь следует отметить, что общепринятой в статистике мерой точности “аппроксимации” является дисперсия (в нашем случае дисперсия модели). Ее значение на практике обычно определяется на основании следующей формулы:
где Однако значение дисперсии не отражает многих существенных аспектов качества модели и, кроме того, оно не очень пригодно для целей содержательного анализа. Несложно заметить, что величина ошибки тесно связана с уровнем зависимой переменной у, и в этой связи она имеет “абсолютное” содержание. В то же время “точность” в большей степени относительна. Поэтому меньшее значение дисперсии еще не свидетельствует о более высоком “качестве” модели, ее аппроксимирующих возможностях. Большая дисперсия может выражать лишь более высокие уровни независимой переменной, а не ухудшение точности ее аппроксимации построенной моделью. Здесь следует отметить, что и “относительность” ошибки может рассматриваться в двух аспектах. Во-первых, по отношению к уровню переменной у, а, во-вторых, – к некоторому уже установленному “эталону” точности. Как раз эти аспекты в большей степени и учитывают указанные критерии и коэффициенты. Коэффициент множественной корреляции показывает степень приближения расчетных (по построенной модели) значений зависимой переменной Значения коэффициента детерминации также находятся на отрезке [0, 1], 0£ D£ 1. Его конкретная величина показывает долю изменчивости переменной у, объясняемую включенными в модель факторами хi, i=1, 2,..., n. Например, если D=0, 81, то это означает, что включенные в модель переменные объясняют 81% изменчивости переменной уt, а остальная ее изменчивость объясняется неучтенными в модели причинами. Значения коэффициентов множественной корреляции и детерминации рассчитываются на основании следующего выражения*:
Обоснование целесообразности использования коэффициента детерминации при определении качества построенной эконометрической модели заключается в следующем. “Удачная“ модель должна “объяснять” основные закономерности изменчивости зависимой переменной уt. Количественной мерой этой изменчивости в статистике принято считать показатель, рассчитываемый на основании следующей формулы:
Заметим, что разница
Первое из слагаемых правой части выражения (1.35) представляет собой расчетное значение ошибки модели в момент t, т. е.
Как будет показано во II главе, ошибка et обладает рядом свойств
При этом первая из них
выражает сумму квадратов ошибки модели, т. е. часть изменчивости переменной уt, необъясненную построенной моделью, а второе слагаемое Разделив левую и правую части выражения (1.36) на
Из последнего выражения непосредственно следует (1.33), т. е.
Таким образом, если модель абсолютно точно соответствует исходному ряду зависимой переменной уt, т. е. расчетные значения В тех случаях, когда модель не может ни в какой мере объяснить изменчивость переменной уt, имеем R=D=0. При линейной форме зависимости f( a, x t) это происходит, например, в тех случаях, когда значения уt равномерно распределяются вокруг линии параллельной оси Х (см. рис. 1.4 (а, б)), что влечет за собой равенство Из изложенного выше следует, что высокие значения переменных D и R ассоциируются с хорошей степенью аппроксимации построенной эконометрической моделью
Рис. 1.4(а, б). Примеры распределения переменной уt , при которых линейная эконометрическая модель )
Так, например, если для переменной уt, фактические значения которой обозначены прерывистой линией на рис. 1.4(а) в качестве эконометрической модели использовать уравнение эллипса Критерий Фишера (F-критерий) также используется для определения надежности всей модели путем сопоставления ее меры ошибки с величиной меры рассеяния переменной уt относительно
Целесообразность использования критерия Фишера можно обосновать, заменив в выражении (1.39) показатель R2 на его модификацию – скорректированный квадрат коэффициента множественной детерминации
При этом На основании (1.33) и (1.40) взаимосвязь между квадратами коэффициентов множественной корреляции R2 и
Скорректированный коэффициент Здесь необходимо отметить, что критерий Фишера может рассматриваться и в качестве “меры” обоснованности включения в эконометрическую модель всей совокупности независимых переменных. В этом случае его можно отнести и к критериям первой группы, характеризующим степень соответствия построенной модели исследуемому процессу уt. Критерий Фишера в такой ситуации рассматривается как своего рода тест при проверке гипотезы, что ни один из независимых факторов не играет никакой роли в объяснении изменчивости переменной уt или, что то же самое, все коэффициенты при независимых факторах модели равны нулю (a1=0, a2=0,..., aп =0) (см. раздел (2.2)). В соответствии с этим отношение R2/п в выражении (1.39) представляет собой среднюю долю объясненной изменчивости переменной уt, приходящуюся на один независимый фактор, а (1–R2)/(Т–п–1) – среднюю долю необъясненной изменчивости переменной уt, в расчете на одну степень свободы. При слабом влиянии независимых факторов на переменную уt (т. е. при ai ®0, i=1, 2,..., n) значение R2, как и величина критерия F стремится к нулю, и, наоборот, с увеличением R2 численное значение F также возрастает. Заметим, что показатель F является случайной величиной, представляющей собой отношение двух дисперсий. Эта величина распределена по закону Фишера с п и Т–п–1 степенями свободы (F(п, Т–п–1)). Вследствие этого на практике проверка значимости коэффициентов модели с использованием критерия Фишера состоит в сопоставлении его расчетного значения, определенного для построенного варианта модели по формуле (1.34), с табличным значением F*(п, Т–п–1), соответствующим заданному уровню доверительной вероятности р* (вероятности ошибки первого рода 1–р*) и известным степеням свободы п и Т–п–1. Если оказывается, что F< F*(п, Т–п–1),
то гипотезу о незначимости совокупного влияния независимых факторов на переменную уt целесообразно принять (вероятность ее осуществления равна р*). В противном случае роль факторов в объяснении изменчивости переменной уt следует признать существенной. С ростом F эта роль признается все более значимой. Критерий Фишера можно использовать и при сравнении качества (точности описания исходного процесса уt) двух различных альтернативных вариантов модели. В данном случае его величина рассчитывается по формуле
где Критерий (1.42) является двухсторонним. Особенности его использования состоят в следующем. Если выполняется соотношение
то рассматриваемые альтернативные варианты модели признаются равнозначными с точки зрения точности описания процесса уt. Если
то выбор следует сделать в пользу первого варианта модели, а если
то – в пользу второго. F*(n1, n2) – табличное значение критерия Фишера, выбранное для заданного уровня доверительной вероятности р* и числе степеней свободы n1=Т–n1–1 и n2=Т–n2–1. В заключение данного раздела еще раз обратим внимание на определенные содержательные и количественные взаимосвязи между критериями и показателями качества эконометрической модели различных групп. Например, отметим, что появление автокорреляционных взаимосвязей у значений ошибки, вообще говоря, делает приведенные выше выражения критериев Фишера, коэффициента детерминации, множественных коэффициентов корреляции и т. п. некорректными. Это обусловлено тем, что используемая при расчете их значений сумма квадратов ошибки Таким образом, этапы формирования модели (обоснование формы функционала, состава независимых переменных) и оценки ее качества в значительной степени взаимосвязаны между собой. Для них, как правило, нельзя установить жесткую очередность. Часто информация, полученная на “более поздних этапах” заставляет пересматривать итоги предыдущих. Заметим также, что важную роль на всех этих этапах играет содержательная сторона проблемы. Не подкрепленные результатами содержательного анализа и основанные только на “хороших” количественных критериях варианты эконометрических моделей часто являются с практической точки зрения бесполезными, бессодержательными “аппроксимациями”. Вместе с тем качество модели в значительной степени зависит от того, насколько “удачны” оценки коэффициентов модели ai , i=0, 1,... п. Они играют, пожалуй, основную роль при обосновании ее “качества”, поскольку на основе их значений непосредственно определяется одна из важнейших составляющих модели, характеризующих ее качество, – выборочная ошибка. Основные подходы к обоснованию “качества” оценок параметров эконометрической модели рассмотрены в следующем параграфе учебника. Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 1672; Нарушение авторского права страницы