Особенности обоснования формы эконометрической модели

⇐ ПредыдущаяСтр 2 из 17Следующая ⇒

Основные подходы к решению проблем первого этапа исследования в значительной степени базируются на методах содержательного анализа закономерностей рассматриваемых процессов, подкрепляемых по мере необходимости методами общей и математической статистики.

Дело в том, что в практических исследованиях на предварительном этапе вид функционала эконометрической модели (1.1) и точный состав включенных в нее факторов могут быть априорно не известны. Часто имеются несколько альтернативных их вариантов, среди которых необходимо выбрать наиболее “приемлемый”. При этом “приемлемость” может отражать как требования экономической теории, так и необходимые ограничения по точности аппроксимации функционалом f( a, x _t) исходного ряда зависимой переменной y_t, t =1, 2,..., Т.

В этой связи прежде чем подойти к решению задач первого этапа, необходимо сформировать хотя бы предварительные исходные предпосылки относительно конкретного состава независимых переменных х_i, вида функционала, связывающего их с зависимой переменной у. При этом исследователь может использовать различного рода “теоретические гипотезы”, как экономического, так и математического содержания в отношении вида функционала, свойств процессов y_t, х_itи e_t.

Состав переменных х_i и форма функционала f могут отражать либо экономическую концепцию, лежащую в основе взаимосвязи между зависимой и независимыми переменными, либо эмпирические (т. е. выявленные в ходе конкретных исследований) взаимосвязи между ними.

Исходными данными, необходимыми для построения эконометрической модели, являются известные наборы (массивы) значений зависимой переменной у и независимых факторов х_i. При этом могут использоваться два принципиально различных типа исходных информационных массивов – статический и динамический. Статический массив представляет собой значения результирующей (зависимой, объясняемой и т.п.) переменной у и влияющих на нее факторов (независимых, объясняющих переменных) х_i, имевших место у объектов однородной совокупности в определенный период времени. Примером таких объектов являются однотипные промышленные предприятия (заводы одной отраслевой направленности). В качестве у в практических исследованиях часто рассматриваются показатели производительности труда, объемов выпускаемой продукции и некоторые другие. В качестве х_i – влияющие на уровень этих показателей факторы – объемы используемых фондов, численность и квалификация рабочей силы и т.п.

Приведем другой пример статической информации, характерной для социальных исследований. В качестве у рассматриваются показатели заболеваемости (смертности) населения в регионах страны. Их уровень в каждом из регионов определяют значения независимых факторов, отражающих достигнутый материальный уровень жизни, климатические условия, состояние окружающей среды и т. п. В этом случае необходимая для построения эконометрической модели информация собирается по совокупности регионов страны за фиксированный промежуток времени (год).

В общем случае будем считать, что необходимая для построения эконометрической модели базового типа (1.1) статическая информация выражается следующими массивами взаимосоответствующих наборов данных:

y₁« х₁₁х₂₁... х_i₁... х_n₁;

y₂« х₁₂х₂₂... х_i₂... х_n₂;

— — — — — — — — —

y_j« х_1jх_2j... х_ij... х_nj;

— — — — — — — — —

y_N« х_1Nх_2N... х_iN... х_nN,

где y_j– уровень зависимой переменной на j-м объекте совокупности; х_ij– уровень фактора i-го фактора на j-м объекте совокупности; i=1, 2,..., n; j=1, 2,..., N.

В общем случае эконометрическая модель, использующая динамическую информацию, связывает значения некоторой зависимой переменной y_tв моменты времени t cо значениями независимых переменных (факторов) х_it, рассматриваемых в те же моменты времени (или в предшествующие)*, t=1, 2,..., Т. Такая информация может отражать, например, уровни производительности труда на одном из заводов и определяющих их значения факторов в последовательные периоды времени.

Исходная информация для построения эконометрических моделей может быть и смешанного типа. Например, она выражает уровни интересующих переменных по группе заводов за ряд лет.

Несложно заметить, что принципиального различия между статическим, динамическим и смешанным массивами не существует. Индекс t, в частности, может обозначать единицу совокупности (объект), так что набор y₁, y₂,..., y_Tможет рассматриваться как выборка из Т заводов (регионов) и наоборот, индекс j=1, 2,..., N может обозначать время. Это же относится и к независимым переменным х_ij и х_it. Вследствие этого в дальнейшем при изложении материала (если это не оговорено специально) для определенности будем использовать динамические индексы.

При формировании исходной информации для эконометрической модели чрезвычайно важной проблемой является выбор показателей, адекватных сущности исследуемых явлений. И здесь следует обратить внимание на определенную подмену понятий, которая обычно происходит на первом этапе построения модели при переходе от содержательного анализа явлений к формированию отражающих их уровни количественных характеристик (показателей).

В ходе содержательного анализа явление часто рассматривается на качественном уровне. При этом специалисты оперируют достаточно обобщенными понятиями, например, заболеваемость, уровень медицинского обслуживания, качество и уровень жизни, климат, качество рабочей силы и т. п. В этой связи, заметим, что часто эконометрическая модель строится именно для выражения закономерности, существующей между явлениями. Однако при построении модели используется исходная информация, наборы показателей, которые выражают эти явления, их свойства, тенденции в виде количественных характеристик. Вследствие этого желательно, чтобы такое «выражение» было в некотором смысле как можно более “точным”.

Для традиционных направлений исследований проблема обоснования состава показателей обычно считается решенной. Например, в исследованиях производительности труда, макроэкономическом анализе обычно рассматриваются уже устоявшиеся наборы показателей, значения которых публикуются в статистических сборниках, научных отчетах и т. п. Их примером являются выработка на одного работающего как показатель, выражающий явление “производительность труда”, объемы ВВП (показатель результативности экономики), объем основных фондов (показатель уровня материальной обеспеченности производственного процесса, экономики) и т.д.

Вместе с тем, в ряде областей эконометрических исследований такие системы показателей не могут быть сформированы столь однозначно. Часто одно и то же явление может быть выражено альтернативными вариантами показателей. Например, общий показатель заболеваемости в регионе за год может быть выражен суммарным числом заболеваний населения в течение этого периода времени. С другой стороны, в качестве меры заболеваемости может выступать и показатель, выраженный в виде суммарного количества дней продолжительности болезней.

Однако в обоих этих случаях не учитывается степень тяжести болезни. Попытка такого учета приводит к необходимости расчета средневзвешенного показателя заболеваемости, но здесь сразу возникает проблема обоснования адекватных “весов”. Тяжесть болезни может определяться, например, по степени ее опасности, рассчитываемой как доля обусловленных ею смертных случаев в общем их количестве; на основании субъективного показателя “дискомфортности” состояния больного и т. п.

Аналогичные проблемы должны быть решены при обосновании показателей климата. Для этих целей обычно используются средняя температура воздуха, влажность, число солнечных дней в году и т. п., а также построенные на их основе некоторые комплексные характеристики.

Заметим, что в отсутствие объективных данных в эконометрических исследованиях допускается замена одного показателя другим, косвенно отражающим то же явление. Например, среднедушевой доход как показатель материального уровня жизни может быть заменен на среднегодовой товарооборот на одного жителя региона и т. п.

Неправильный выбор показателя, представляющего рассматриваемое явление в модели, может существенно повлиять на ее качество. В этой связи к проблеме обоснования состава показателей (переменных) эконометрической модели на практике следует относиться с предельным вниманием.

Предположим, что общее число независимых факторов, которые целесообразно включить в модель, равно n, i=1, 2,..., n, и на основе измеренных значений всех переменных в моменты времени t=1, 2,..., T был сформирован массив исходных данных, который будет рассматриваться в качестве информационной основы для построения эконометрической модели.

Данный массив образован вектором-столбцом значений зависимой переменной y =(y₁, y₂, ..., y_T)¢ ** и матрицей значений независимых переменных

Х =

размерностью T´ n, таким образом, что каждому элементу y_t вектора y соответствует строка матрицы Х.

Рассматривая проблему выбора конкретного вида функционала f( a, x _t) из выражения (1.1) заметим, что в практике эконометрических исследований используется достаточно широкий круг функциональных зависимостей между переменными. Приведем некоторые, наиболее часто используемые, их виды:

1) линейная

y_t=a₀+a₁х_1t+...+a_n х_nt+e_t, (1.2)

2) правая полулогарифмическая

y_t=a₀+a₁lnx₁_t +...+a_n lnх_nt +e_t, (1.3)

3) степенная

4) гиперболическая

y_t=a₀+a₁/х_1t+...+a_n /х_nt+e_t, (1.5)

5) логарифмическая гиперболическая

lny_t =a₀+a₁/х₁_t +...+a_n /х_nt+e_t, (1.6)

6) обратная линейная (функция Торнквиста)

1/y_t=a₀+a₁/х_1t+...+a_n /х_nt+e_t, (1.7)

7) функция с постоянной эластичностью замены

где l и r – также параметры функции.

8) экспоненциальная функция

где b₁,..., b_n – также параметры функции.

На практике могут встретиться и комбинации рассмотренных выше зависимостей. Например,

и т. п.

Здесь необходимо отметить, что большинство функций f( a, x _t) с помощью определенного набора преобразований могут быть приведены к линейной форме (1.2). Например, если у и х_iсвязаны зависимостью у~1/х_i(выражение (1.5)), то, введя переменные u_i=1/х_i, получим выражение (1.2) с точностью до преобразования исходных факторов.

В практических исследованиях часто, используя преобразование u_i=lnх_iи z=lny, степенную модель (1.4) преобразуют к линейному виду, связывающему логарифмы переменных у и х_i. Однако заметим, что в данном случае с точки зрения математики такое преобразование не совсем корректно из-за “аддитивности” ошибки в выражении (1.4). Вследствие этого значения коэффициентов линейной относительно логарифмов переменных модели нельзя в общем случае полагать равными соответствующим значениям степенного аналога.

На примере линейной эконометрической модели покажем еще одну возможную форму представления моделей такого типа – моделей, в которых отсутствует свободный коэффициент a₀. В общем случае такая модель представляется в следующем виде:

Найдем взаимосвязи между переменными y_tи , х_itи и определим, чему равен коэффициент a₀. Для этого просуммируем по индексу t правую и левую части модели (1.2). Получим

Поскольку что отражает свойство равенства нулю математического ожидания ошибки (M[e_t]= ), то, разделив правые и левые части этого выражения на Т, получим

откуда следует, что

Вычтем a₀ из уравнения (1.2). Получим для всех t

Из (1.12) непосредственно вытекает, что

Операция (1.13) определяет так называемые центрированные переменные и называется операцией центрирования. Отметим, что для центрированных переменных справедливы следующие очевидные соотношения:

Использование центрированных переменных иногда значительно упрощает процедуры получения некоторых результатов, делает более наглядной их интерпретацию.

При этом следует помнить, что исходная информация для такой модели (вектор и матрица ) получается путем вычитания из каждого элемента каждого столбца соответствующего среднего (по столбцу) значения.

Как было отмечено выше, конкретный вид функциональной зависимости f( a, x _t) может выражать какую-либо содержательную концепцию, отражающую предполагаемый характер взаимосвязей между процессами y_tи х_it, i=1, 2,..., n.

В основе использования степенной функции (1.4), например, обычно лежит концептуальное допущение о постоянстве частной эластичности выпуска у по каждому ресурсу (фактору) х_i. Напомним, что частная эластичность в точке t показывает, на сколько процентов изменится зависимая переменная у_tпри изменении фактора х_ti на 1% при условии постоянства значений остальных факторов в этой точке. Частная эластичность определяется следующим выражением:

Подставим вместо у_tв правую часть выражения (1.15) функцию . Учитывая, что получим

Э_i = a_i. (1.16)

Таким образом, коэффициент модели (1.4) a_iсразу определяет значение эластичности у по фактору х_i на всем интервале (1, Т).

Удобство экономической интерпретации параметров модели (1.4), относительная простота ее записи и послужили причиной ее широкого использования особенно в макроэкономических исследованиях.

Особую известность получили различные модификации двухфакторной функции Кобба-Дугласа

которые обычно применяется в макроэкономических исследованиях при анализе взаимосвязи между объемом полученного валового внутреннего продукта (y) и используемыми ресурсами (х₁– основные фонды и х₂– затраты живого труда). Между собой эти модификации, в основном, различаются ограничениями, накладываемыми на значения коэффициентов a₁ и a₂, а также способом выражения и содержательной интерпретацией коэффициента a₀. Например, “классический” вариант функции (1.17) предполагает, что значения a₁ и a₂ удовлетворяют следующим ограничениям: a₁+a₂=1; a₁, a₂³ 0. В других вариантах этой функции дополнительно вводят сомножитель е^r^t, выражающий влияние на валовый продукт временного фактора, характеризующего научно-технический прогресс и т. п.

Функция (1.8) обычно используется в предположении о постоянстве эластичности замещения одного фактора другим. Например, если речь идет о замене фактора “труд”(L) фактором “капитал” (K), то значение коэффициента эластичности замещения показывает, на сколько процентов измениться капиталовооруженность (K/L) при изменении предельной нормы замещения труда капиталом (N_KL =–dK /dL) на 1% при условии, что зависимая переменная не изменится. Значения всех других факторов при этом предполагаются также неизменными. В общем случае, эластичность замещения i-го фактора j-м определяется выражением:

Предельная норма замещения i-го фактора j-м N_ji показывает количество j-го фактора, которое требуется для замены одной единицы i-го фактора при сохранении постоянных уровня зависимой переменной и значений остальных независимых переменных.

Проводя расчеты по формуле (1.18) для функции (1.8), получим, что для всех i и j и для всех значений t=1, 2,..., Т эластичность замещения прироста одного фактора соответствующим изменением другого является постоянной:

Во многих практических исследованиях столь строгие теоретические концепции, предварительные допущения о содержательных сторонах взаимодействия между явлениями отступают на второй план. Для них главным является построение уравнения, достаточно точно выражающего взаимосвязи, адекватные тенденциям изменений переменных у и х_i, i=1, 2,..., n; на временном интервале (1, Т). Более того, часто именно “удачная” форма уравнения эконометрической модели кладется в основу разрабатываемой теоретической концепции, которая затем находит свое применение в последующем анализе. Очевидно, что наиболее “подходящая” форма обеспечивает наилучшее приближение теоретических (расчетных) значений = f( a, x _t) к действительным значениям у_t.

Обычно выбор такой формы осуществляется на основе графического анализа тенденций развития соответствующих процессов. Например, если переменная y и переменная х_i изменялись во времени согласно графикам, представленным на рис. 1.1, то логично предположить, что у~1/х_it.

Для графиков, представленных на рис. 1.2, характерной является логарифмическая зависимость у_t ~lnх_it.

В этих и во многих других случаях, как правило, в качестве функции f( a, x _t), выражающей взаимосвязи между включенными в модель независимыми переменными х_i, i=1, 2,..., n, выбирается либо линейная форма (1.2), либо степенная (1.4). Заметим, что значение частной эластичности y по фактору х_i, рассчитанное на основе выражения (1.15) для функции (1.2) равно:

и, таким образом, этот показатель изменяется во времени в соответствии с изменениями переменных у и х_i.

y х_i

t t

Рис. 1.1

y х_i

t t

Рис. 1.2

Аналогично можно показать, что предельная норма замещения факторов i и j для функции (1.17) также является переменной величиной

и ее значение также зависит от соотношения уровней рассматриваемых факторов в каждый момент времени.

Методы отбора факторов

“Оптимальный” состав факторов, включаемых в эконометрическую модель, является одним из основных условий ее “хорошего” качества, понимаемого и как соответствие формы модели теоретической концепции, выражающей содержание взаимосвязей между рассматриваемыми переменными, и как точность предсказания на рассматриваемом интервале времени t=1, 2,..., Т наблюдаемых значений переменной у_t уравнением f( a, x _t).

Проблема выбора “оптимальных” факторов обычно решается на основе содержательного и количественного (статистического) анализа тенденций рассматриваемых процессов.

На этапе содержательного анализа решается вопрос о целесообразности включения в модель тех или иных факторов, исходя из “здравого” смысла. В макроэкономических исследованиях состав факторов, как правило, определяется на основании допущений экономической теории. Пример – двухфакторные производственные функции типа Кобба-Дугласа, постоянной эластичности замены, которые строятся в предположении, что объем выпуска (производства) экономической системы в основном зависит от размеров используемых основных фондов и количества затраченного труда. Далее, как это было отмечено в разделе 1.2, производственная функция типа Кобба-Дугласа учитывает предположение о постоянной эластичности выпуска по каждому из факторов, а функция постоянной эластичности замены – свойство постоянства замещения изменения одного из этих факторов изменением другого.

Здесь следует иметь в виду, что на этапе содержательного анализа обычно решается проблема установления самого факта наличия взаимосвязей между явлениями. Однако, как было отмечено в разделе 1.2, каждое из явлений может быть выражено разными факторами и даже их комбинациями. Поэтому в ряде исследований на основании содержательного анализа однозначно состав независимых переменных модели определить практически невозможно. Могут существовать их альтернативные наборы. Например, для исследования закономерностей динамики производительности труда на заводе могут быть отобраны, исходя из содержательной целесообразности, следующие факторы: объем основных фондов, электровооруженность труда, фондовооруженность труда, численность рабочей силы, ее квалификация. При этом квалификация как явление может выражаться разными показателями, например, средним уровнем образования работников, их усредненным квалификационным разрядом и т. п. Кроме того, можно ожидать, что показатели электровооруженности, фондовооруженности труда, объема основных фондов характеризуют одно и то же явление – изменение материально-технической оснащенности производственного процесса. Таким образом, некоторые из рассматриваемых в таком исследовании показателей, выражающих количественные характеристики независимых переменных, относятся к сходным явлениям.

Аналогично, в исследованиях заболеваемости населения каждая из определяющих это явление причин может быть количественно отображена разными факторами. Например, уровень жизни – среднедушевым доходом, обеспеченностью жильем, розничным товарооборотом в расчете на одного жителя и т. п.; климатические условия – среднегодовой температурой, числом солнечных дней в году, влажностью и рядом других показателей; качество окружающей среды – среднегодовыми объемами выбросов и сбросов загрязняющих веществ, среднегодовыми уровнями их концентрации в воздухе, воде и почве и т. д., уровень медицинского обслуживания – количеством медицинских работников в расчете на одного жителя; числом койко-мест в лечебных заведениях на одного жителя и другими показателями.

Несложно заметить, что факторы, выражающие одну и ту же причину, могут быть тесно взаимосвязаны между собой. Так, например, уровень розничного товарооборота в основном зависит от среднедушевого дохода; концентрация загрязняющих веществ – от объемов их выбросов; наблюдается взаимосвязь между обеспеченностью населения медицинским персоналом и койко-местами в лечебных учреждениях и т. д. Вследствие этого, одновременное включение таких факторов в модель вряд ли целесообразно, поскольку таким образом одна и та же причина будет учтена дважды.

В результате в общем случае на этапе обоснования эконометрической модели исследователи могут столкнуться с проблемой выбора наиболее предпочтительного состава независимых факторов среди ряда альтернативных вариантов. Можно выделить два основных подхода к решению этой проблемы. Первый из них предполагает априорное (до построения модели) исследование характера и силы взаимосвязей между рассматриваемыми переменными, по результатам которого в модель включаются факторы, наиболее значимые по своему “непосредственному” влиянию на зависимую переменную у_t. И, наоборот, из модели исключаются факторы, которые, либо малозначимы с точки зрения силы своего влияния на переменную у_t, либо их сильное влияние на нее можно трактовать как индуцированное взаимосвязями с другими экзогенными переменными.

Второй подход к отбору независимых факторов можно назвать апостериорным. Он предполагает первоначально включить в модель все отобранные на этапе содержательного анализа факторы. Уточнение их состава в этом случае производится на основе анализа характеристик качества построенной модели, одной из групп которых являются и показатели, выражающие силу влияния каждого из факторов на зависимую переменную у_t.

Рассмотрим особенности процедуры отбора факторов на основе использования каждого из этих подходов более подробно.

В основе “априорного” подхода лежат следующие предположения.

1. Сильное влияние фактора на зависимую переменную должно подтверждаться и определенными количественными характеристиками, важнейшей из которых является их парный линейный коэффициент корреляции, выборочное значение которого рассчитывается на основании имеющейся информации по формуле:

где – средние значения соответствующих переменных, а – их среднеквадратические отклонения.

Логика использования коэффициента парной корреляции при отборе значимых факторов на практике состоит в следующем. Если значение достаточно велико, т. е. > r₁, где r₁ – некоторый эмпирический рубеж (на практике r₁»0, 5-0, 6), то можно говорить о наличии существенной линейной связи между переменными у и х_iили о достаточно сильном влиянии х_i на у. Чем больше абсолютное значение , тем сильнее это влияние (положительное или отрицательное, в зависимости от знака r).

Здесь следует иметь в виду, что значение должно рассчитываться с учетом формы преобразования у и х_iв модели. Например, если у~1/х_i, то и коэффициент корреляции определяется между у и u_i =1/х_iи т.п.

2. Если два и более факторов выражают одно и то же явление (см. рассмотренные выше примеры), то, как правило, между ними также должна существовать достаточно сильная взаимосвязь. На это может указать выборочное значение их парного коэффициента корреляции

На практике взаимосвязь между факторами признается существенной, если > r₂, где r₂»0, 8–0, 9. В таких ситуациях один из этих факторов целесообразно исключить из модели, с тем, чтобы одна и та же причина не учитывалась дважды. Однако повторим, что такое исключение следует проводить только в тех случаях, когда факторы выражают одно и то же явление.

Отметим, что приведенные рубежные значения (в первом случае – 0, 5–0, 6; во втором – 0, 8–0, 9) достаточно условны. В каждом конкретном случае они устанавливаются индивидуально. При их выборе существенную роль играет интуиция исследователя. Обычно считается, что, если для фактора х_i < 0, 5, то при большом числе других достаточно значимых факторов, информацией, которую содержит в себе фактор х_iотносительно изменчивости переменной у, можно пренебречь. Иногда же, наоборот, если состав факторов не слишком широк, и фактор х_iвыражает существенное с точки зрения теории явление, то исследователь, стремясь не потерять информацию о закономерностях изменчивости переменной у, может оставить его в модели и при меньшем значении выборочного коэффициента корреляции ( =0, 3–0, 4).

Здесь следует еще раз подчеркнуть, что при таком отборе, основанном на эмпирике и интуиции, обычно не принимается во внимание точность оценки выборочных коэффициентов корреляции, которая растет с увеличением выборки, т. е. значения Т. При фиксированном значении Т точность оценок всех коэффициентов примерно одинакова. Логика такого отбора в большей степени ориентирована на содержательную сторону проблемы учета взаимосвязей между переменными модели.

Значительно усложняет проблему отбора факторов явление ложной корреляции, которое характеризуется достаточно высокими по абсолютной величине значениями коэффициентов парной корреляции у процессов, с содержательной точки зрения между собой никак не связанных. Иными словами, большие значения парных коэффициентов корреляции могут иметь место и в тех случаях, когда тенденции рассматриваемых процессов совпали случайно, при отсутствии между ними логически обоснованной взаимосвязи.

Примерами ложных корреляций являются совпадающие тенденции роста потребительских расходов в постоянных ценах и роста потребительских цен, роста выпуска продукции и потребления алкоголя и т. п.

Ложная корреляция может помешать при построении “правильной” модели по двум причинам. Во-первых, в модель случайно могут быть введены незначимые с содержательной точки зрения факторы, характеризующиеся значимыми величинами . Во-вторых, из модели могут быть исключены значимые с точки зрения влияния на у факторы, в отношении которых ошибочно признана гипотеза о том, что они выражают то же явление, что и другой фактор (факторы), уже включенный в эту модель.

Среди основных причин включения в модель переменных с ложной корреляцией часто называют ненадежность информации, используемой при определении значений факторов в различные моменты времени, трудности формализации факторов, имеющих качественный характер, неустойчивость тенденций изменения рассматриваемых переменных, неправильную форму взаимосвязи между ними и т. п.

Еще раз отметим, что основной путь, придерживаясь которого можно избежать ошибок, связанных с понятием “ложной корреляции”, связан с проведением качественного анализа проблемы, направленного на обоснование адекватного ей содержания и формы модели. При этом можно предложить и некоторые общие рекомендации, которых целесообразно придерживаться, следуя этим путем:

1. Число факторов, включаемых в модель, не должно быть слишком велико. Их увеличение может свести к минимуму ее практическую ценность, так как в этом случае модель начинает отражать не закономерность развития на фоне случайности, а саму случайность.

2. Простота модели в значительной степени является гарантией ее адекватности, поскольку более сложные зависимости часто априорно трудно уловимы на ограниченном временном интервале, но в то же время они допускают аппроксимацию достаточно простыми функциями. Иными словами, сложная модель может в большей степени выражать второстепенные взаимосвязи между переменными в ущерб основным.

При апостериорном подходе уточнение состава факторов эконометрической модели осуществляется на основе анализа значений ряда качественных характеристик уже построенного ее варианта. Одну из групп таких характеристик, являющихся наиболее важными при отборе факторов, образуют значения критерия Стьюдента, рассчитываемые для коэффициентов при каждом из факторов модели. С помощью этого критерия проверяется гипотеза о значимости влияния фактора на зависимую переменную у.

Здесь следует отметить, что окончательное решение о целесообразности оставления фактора или его удаления из модели принимается на основе анализа всего комплекса ее характеристик качества с учетом содержательной стороны проблемы взаимосвязей между зависимой и независимыми переменными. Вопросы их расчета и логика принятия такого решения будут изложены в разделе 1.4. Критерий Стьюдента лишь указывает на те факторы, которые с точки зрения статистики являются возможными (целесообразными) кандидатами на удаление.

Заметим, что ответ на вопрос о целесообразности включения в число факторов-кандидатов на удаление каждой из независимых переменных х_i, i=1, 2,..., n, при апостериорном подходе решается уже после того, как оценены значения коэффициентов модели и определены некоторые дополнительные характеристики точности полученных оценок. Вопросы определения этих характеристик рассмотрены в главе II.

Будем считать, что с помощью какого-либо из методов, рассмотренных в главе II, например, метода наименьших квадратов, найдены численные значения оценок параметров a₀, a₁,..., a_nлинейной эконометрической модели (1.2)*. Как будет показано в главе II, эти оценки являются выборочными (определенными по наблюдаемой выборке исходных данных). Согласно этому они рассматриваются как случайные величины, распределенные «приблизительно» по нормальному закону с соответствующими математическими ожиданиями и дисперсиями (среднеквадратическими отклонениями). Методы оценивания параметров позволяют определить и значения дисперсий полученных оценок s(a_i).

Логика использования критерия Стьюдента при выявлении факторов-кандидатов на удаление из уже построенного варианта модели основывается на следующих его свойствах. Напомним, что случайная величина t, определенная согласно выражению

распределена по закону Стьюдента с k степенями свободы, k – объем выборки; – выборочное среднее некоторой случайной величины z<

⇐ Предыдущая 123 4 5 6 7 8 9 10 Следующая ⇒