Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Модели с дискретными зависимыми переменными
Как следует из рассмотренного в предыдущих разделах материалов, в эконометрических исследованиях обычно предполагается, что результирующий показатель yt, является количественной величиной, которая в принципе может принимать любые значения на множестве действительных чисел. Однако в экономических и социальных исследованиях часто приходится сталкиваться с разного рода ограничениями на значения зависимой переменной. В частности, зависимая переменная может принимать только целочисленные значения: 0, 1, 2,... Примерами таких зависимых переменных являются: 1а. Семейное положение, которое выражается следующими категориями (и соответствующими целыми числами): – холост (1); – женат (2); – вдовец (3); – разведен (4). 1б. Альтернативные товары, между которыми выбирает покупатель, и которые представляются следующими числами: – марка А(1); – марка Б(2); – марка В(3); – марка Г(4); – прочие марки(5). Очевидно, что в обоих случаях числа служат только для разграничения понятий. Расстояние между двумя числами не имеет никакого значения. 2а. Оценки, полученные на экзамене: – отлично(5); – хорошо(4); – удовлетворительно(3); – неудовлетворительно(2). 2б. Классы гостиниц: – пять звезд(1); – четыре звезды(2); – три звезды(3); – две звезды(4) и т. д. В случаях 2а и 2б (в отличие от 1а и 1б) понятия естественным образом упорядочены, и характеризующие их числа отражают этот порядок. Но различия между 1 и 2 понятиями не обязательно столь же сильные, как между 2 и 3 и т. д. 3. Число предприятий, обанкротившихся в текущем году (0, 1, 2...). Так называемые счетные данные (count data). При представлении значений зависимой переменной в целочисленном виде эконометрическая модель, связывающая эти значения с соответствующим набором независимых факторов, имеет специфическое содержание. Обычно такая модель определяет вероятность осуществления события, заключающегося в том, что при известных уровнях независимых факторов зависимая переменная примет конкретное значение j из заданного набора значений j=0, 1, 2,.... Содержательное уравнение такой модели выглядит следующим образом:
Вероятность(событие j произойдет)= =Вероятность(Y=j)=F(параметры, факторы). (10.40)
Модели с дискретными зависимыми переменными могут быть классифицированы в зависимости от: а) типа переменных; б) выбранного закона распределения. В свою очередь, внутри выделенных групп может быть развернута более подробная классификация в зависимости от более детальных свойств классификационных признаков. Эти детальные группировки будут рассмотрены по ходу дальнейшего изложения материала. В научной литературе в зависимости от типа переменных модели с дискретными зависимыми переменными разделяются на модели выбора среди конечного числа альтернативных вариантов (примеры 1а, 1б, 2а, 2б) и модели счетных данных (пример 3). В зависимости от числа вариантов, среди которых осуществляется выбор, различают модели бинарного выбора и модели множественного выбора. В отличие от моделей множественного выбора в моделях бинарного выбора результирующий показатель может принимать только два значения: 0 и 1. К моделям множественного выбора относятся модели с неупорядоченными (примеры 1а, 1б) и упорядоченными (примеры 2а, 2б) альтернативными вариантами. Рассмотрим особенности формализованного представления эконометрических моделей с различными видами дискретных зависимых переменных более подробно. Модели бинарного выбора Модели бинарного выбора широко используются в экономических и социальных исследованиях, особенно в экономике труда, при проведении анализа на микро-уровне. Покажем их специфические свойства на примере модели трудовой активности населения, исходные предпосылки которой состоят в следующем. Индивидуум в определенный период времени может работать или искать работу (y=1) или не делать этого (y=0). Предположим, что состояние “работать” или “не работать” определяется набором факторов (возраст, семейное положение, образование, опыт работы и т. д.), и соответствующие вероятности можно представить в следующем виде:
P(y=1)= F( a ¢ x ); P(y=0)=1–F( a ¢ x ). (10.41)
Вектор коэффициентов a отражает влияние факторов, например, характеризующих положение индивидуума в обществе, на рассматриваемую вероятность. Одной из основных проблем при построении моделей бинарного выбора является обоснование функционала F( a ¢ x ). Например, предположим, как и в случае “классических” эконометрических моделей, что вероятности соответствующих событий могут быть представлены в виде линейной функции от значений рассматриваемых факторов: F( a ¢ x )= a ¢ x =a0+a1x1+...+anxn, (10.42)
где a0, a1,..., an – параметры модели; x1,..., xn – значения независимых факторов. Тогда, приняв M[yt| x t]=F( a ¢ x t), соответствующую эконометрическую модель можно представить в следующем виде:
yt =M[yt | x t]+(yt –M[yt | x t])= a ¢ x t +e t. (10.43)
где M[yt| x t]= – условное математическое ожидание переменной yt при условии, что вектор независимых переменных равен x t. Линейная форма модели представляет определенное удобство для раскрытия содержания, входящих в нее слагаемых. Прежде всего заметим, что между их значениями выполняется следующие соотношения (см. табл. 10.1). Таблица 10.1
Из табл. 10.1. следует, что ошибки et модели (10.43) имеют следующие характеристики:
M[et]= a ¢ x t(1– a ¢ x t)+ (1– a ¢ x t)( – a ¢ x t)=0; D[et| x t]= a ¢ x t(1– a ¢ x t)2+(1– a ¢ x t)(– a ¢ x t) 2= a ¢ x t(1– a ¢ x t)(1– a ¢ x t+ a ¢ x t)= = a ¢ x t(1– a ¢ x t). (10.44)
где D[et| x t] – условная дисперсия ошибки et при условии, что вектор независимых переменных равен x t.
Рассмотрим в качестве критерия выбора оценок параметров модели (10.43) минимум суммы дисперсий ее ошибок et:
a ¢ x t)2+ a ¢ x t) 2= x t(1– a ¢ x t)2+ 1– a ¢ x t)(– a ¢ x t)2= = x t(1– a ¢ x t)= min. (10.45)
Используя МНК для оценки параметров модели (10.43) при критерии (10.45), получим следующую систему “нормальных” уравнений, относительно неизвестных оценок а0, а1,..., аn:
Выполнив дифференцирование с учетом попарной независимости коэффициентов между собой и со значениями факторов хit, i=1, 2,..., T, эту систему можно представить в следующем виде:
В свою очередь, последняя система может быть представлена в векторно-матричном виде следующим образом:
или в компактной форме записи как
X × a = z, (10.47)
где матрица и вектор-столбец . Из выражения (10.47) непосредственно вытекает, что неизвестные оценки параметров бинарной модели линейного типа могут быть получены на основании следующего выражения:
a = X –1× z, (10.47)
Однако линейная интерпретация (10.42) закона распределения вероятностей достаточно “неудобна” по своим “эконометрическим следствиям”. Во-первых, заметим, что из выражения (10.44) вытекает, что ошибка e гетероскедастична, поскольку дисперсия ошибки зависит от вектора x. В таких условиях оценки параметров a модели (10.43), полученные на основе выражения (10.48), являются неэффективными. Для получения эффективных оценок ее параметров, необходимо использовать обобщенный МНК. Во-вторых, любой метод оценки параметров линейных моделей бинарного выбора не дает гарантий, что результат произведения a ¢ x может принимать значения только на интервале [0, 1]. С учетом выражения (10.44) несложно заметить, что при отрицательных значениях этого произведениях и значениях больших единицы будет иметь место и другой абсурдный результат – отрицательная дисперсия остатков. Это обстоятельство существенно ограничивает область применения линейной модели бинарного выбора. На практике она используется только для предварительной обработки данных и для сопоставления с результатами, полученными более тонкими методами. Из приведенных рассуждений вытекает, что модель бинарного выбора должна удовлетворять двум условиям:
и
где a ¢ x ®+¥ – область значений x, при которых P(y=1)=1, а a ¢ x ®–¥ – область значений x, при которых P(y=1)=0. При этом между значениями составных частей регрессионного уравнения должно выполняться следующее соответствие (см. табл. 10.2). Таблица 10.2
Условиям (10.49) отвечает, например, функция F( a ¢ x ), близкая к закону нормального распределения, график которой представлен на рис. 10.2. Ее использование позволяет снять рассмотренные выше ограничения моделей бинарного выбора. Модели с функционалом, обладающим свойством “нормального закона“, в литературе получили название probit-моделей:
P(Y=1)=ò ( a ¢ x ). (10.50)
где Ф(.) – функция стандартного нормального распределения, зависящая от значений факторов x и параметров a, j(u)– функция плотности распределения стандартной нормальной переменной u. В предположении о независимости и гомоскедастичности ошибок et функцию j(u) можем записать в следующем виде: j( a ¢ x t)=
Заметим, что s2в выражении (10.51) является неизвестным параметром, который должен быть оценен, как и вектор параметров a.
Рис.10.2 График функции закона распределения, близкого к нормальному.
Из выражения (10.51) вытекает, что между значениями независимой переменной уt и j( a ¢ x t) выполняется следующее соотношение (см. табл. 10.3). Таблица 10.3
Не менее широко в моделях бинарного выбора используется и логистическое распределение:
P(Y=1)= L( a ¢ x ). (10.52)
где L(.) представляет собой интегральную функцию логистического распределения. Модели, построенные на его основе, называются logit-моделями. Несложно заметить, что в данном случае между составными частями регрессионного уравнения выполняется следующее соотношение (см. табл. 10.4). Таблица 10.4
Вопрос о том, какое из вышеназванных распределений более подходит для практических исследований, остается открытым. На участке a ¢ x Î [–1, 2; 1, 2] оба они ведут себя практически одинаково. Однако вне этого участка, т. е. на хвостах распределения, значения функционалов Ф( a ¢ x ) и L( a ¢ x ) имеют некоторые отличия. В частности, логистическое распределение имеет более “тяжелый хвост”, чем нормальное. Практика показывает, что при отсутствии существенного преобладания одной альтернативы над другой, а также для выборок с небольшим разбросом переменных, выводы, полученные на основе probit- и logit-моделей, как правило, совпадают. В общем случае из выражения (10.41) для модели бинарного выбора вытекает, что условное математическое ожидание зависимой переменной при заданном наборе факторов может быть определено следующим выражением:
M[yt| x t]=0× [1–F( a ¢ x t)]+1× F( a ¢ x t)=F( a ¢ x t). (10.53)
Одно из направлений использования результата (10.53) в анализе рассматриваемых явлений связано с оценками так называемого маржинального эффекта факторов, входящих в модель. Маржинальный эффект фактора xit, i=1, 2,..., n; t=1, 2,.., T показывает изменение функции F( a ¢ x t) (характеризующей вероятность того, что у=1) при изменении фактора xit на единицу. Маржинальные эффекты факторов x t для модели бинарного выбора оцениваются на основе следующего выражения:
¶M[yt| x t]/¶ x t={¶ F( a ¢ x t)/ ¶( a ¢ x t)}× a =f( a ¢ x t)× a, (10.54)
где f(.) – плотность безусловного распределения, соответствующая интегральному распределению F(.) и дифференцирование осуществляется по вектору x t. В частности, для нормального распределения маржинальный эффект рассчитывается по формуле
¶M[yt| x t]/¶ x t=f( a ¢ x t)× a, (10.55)
где f(.) – плотность стандартного нормального распределения. Для логистического распределения производная функции этого закона по факторам x t функция f( a ¢ x t) имеет следующий вид:
¶L[ a ¢ x t]/¶ x t=e a ¢ x /(1+ e a ¢ x )2 =L( a ¢ x t)× [1–L( a ¢ x t)]. (10.56)
Соответственно в logit-модели маржинальные эффекты определяются как
¶M[yt| x t]/¶ x t=L( a ¢ x t)× [1–L( a ¢ x t)]× a, (10.57)
Из выражений (10.54)–(10.57) вытекает, что величина маржинального эффекта для probit- и logit-моделей зависит от значений независимых факторов x. В связи с этим полезно будет определить так называемый “средний маржинальный эффект” в области существования значений независимых факторов. На практике возможны два подхода к его оценке. Первый основан на усреднении значений независимых факторов, т. е. сначала рассчитываются выборочные средние всех факторов , i=1, 2,..., п, а затем для оценки среднего эффекта определяется f( a ¢ )× a. В соответствии со вторым подходом маржинальные эффекты оцениваются для каждого наблюдения, затем по полученным оценкам этих индивидуальных маржинальных эффектов определяется его среднее значение. Поскольку функция (10.51) у рассматриваемых моделей непрерывна, то в соответствии с теоремой Слуцкого* на больших выборках оба подхода будут давать один и тот же набор средних маржинальных эффектов. Но это неверно для малых выборок. Практика показывает, что в этом случае лучшие результаты дает второй подход, основанный на усреднение индивидуальных маржинальных эффектов. Заметим, что средний маржинальный эффект бинарной независимой переменной (например, с) можно определить как следующую разность: P[y=1| , с=1]–P[y=1| , с=0], где – вектор выборочных средних значений остальных независимых переменных х. Обратим внимание на то, что результаты моделей бинарного выбора могут иметь разнообразное содержание. В частности, их можно проинтерпретировать в терминах выгоды или ущерба. Рассмотрим такую интерпретацию на примере модели крупной покупки. Исходными данными (наблюдаемыми переменными) в этом случае являются сведения о покупке (1 – покупка сделана, 0 – в противном случае) и факторы, характеризующие субъекта, потребителя (доход, пол, возраст и т. д.). Далее предполагается, что покупка имеет место, если она приносит выгоду потребителю, и покупка отсутствует, если такой выгоды нет, и даже возможен “ущерб” (например, покупка бесполезна). Ненаблюдаемую (латентную) выгоду, получаемую t-м потребителем от покупки, будем моделировать как переменную yt*, определяемую следующим выражением:
yt*= a ¢ x t+et, (10.58)
где a ¢ x t в данном случае называется индексной функцией (index funktion); et– ошибка модели, в отношении которой делается предположение, что она имеет стандартное нормальное распределение с нулевым математическим ожиданием и единичной дисперсией. Вероятность получения t-м потребителем выгоды от покупки может быть определена следующим образом:
P(yt*> 0)=P( a ¢ x t+et> 0)=P(et> – a ¢ x t). (10.59)
Если распределение симметрично (каковыми являются нормальное и логистическое), то выражение (10.59), можно представить в следующем виде:
P(yt*> 0)=P(e< a ¢ x t)=F( a ¢ x t). (10.60) В качестве примера модели типа (10.58)–(10.60) рассмотрим модель миграции, разработанную Нейкостином и Циммером (Nakosteen, Zimmer, 1980). В ее основе лежит предположение о том, что индивидуум принимает решение о переезде, если это приносит ему определенную выгоду, которая оценивается на основе сопоставления доходов в настоящем и “новом” месте его проживания, затрат на переезд. Доход yp*, который индивидуум может получить в данной местности настоящего проживания за год, определяется как
yp*= a ¢ x p+ep, (10.61)
где a – вектор значений параметров; x p – вектор независимых переменных, характеризующих индивидуума, например, возраст, образование, опыт работы, и т. д.; ep – ошибка модели. Если индивидуум переезжает на новое место, то его доход ym* будет определяться согласно следующему выражению:
ym*= b ¢ x m+em, (10.62)
где b – вектор значений параметров; x m – вектор независимых переменных, состав которых может как совпадать, так и не совпадать с составом компонент вектора x p (включать, например, возможность получения более престижной должности); em – ошибка модели. Переезд связан с определенными затратами C*, которые могут быть связаны линейной зависимостью со статусом индивидуума (предприниматель, наемный работник, семейный или несемейный и т. д.):
C*= g ¢ z +u, (10.63)
где z – вектор независимых переменных, характеризующих статус индивидуума; u – ошибка модели. С учетом вышеперечисленного выгода от переезда может быть представлена в следующем виде:
N*=ym*– yp*– C*= b ¢ x m – a ¢ x p – g ¢ z +(em –ep– u)= d ¢ w +e, (10.64)
где w – вектор независимых переменных, характеризующих индивидуума, условия его жизнедеятельности в местах его жительства и т. п., которые влияют на уровень доходов и затраты на переезд; e=em –ep– u – ошибка модели. В целом, вероятность переезда P(N=1) определяется следующим образом:
P(N*> 0)=P( d ¢ w + e > 0)=P( e > – d ¢ w ). (10.65)
Выражение (10.65) полностью соответствует выражению (10.59). Альтернативную интерпретацию данных об индивидуальных предпочтениях дает модель случайной полезности (random utility model). Согласно этой интерпретации латентные (ненаблюдаемые) переменные предыдущей задачи, т. е. ym и yp, представляют собой полезности для индивидуума двух выборов (переезжать или не переезжать). В другом примере латентные переменные могут характеризовать полезность аренды дома и полезность владения домом. Статистика индивидуальных выборов, т. е. значения yt=1 и yt=0, дают возможность оценить, какая из альтернатив имеет большую полезность при соответствующих наборах факторов, но при этом величина полезности остается неопределенной. Обозначим полезность аренды дома через Ua, а полезность владения домом – через Ub. Наблюдаемый индикатор yt равняется 1, если Ua> Ub, и равняется 0, если Ua £ Ub. Общая постановка модели случайной полезности выглядит следующим образом:
Ua= a ¢ a x +ea; Ub= a ¢ b x +eb. (10.63)
где a a и a b – различающиеся между собой вектора параметров модели; индексы а и b характеризуют варианты выбора. Тогда, вероятность выбора варианта а (наблюдаемая переменная y принимает значение 1) определяется по следующей формуле:
P(y=1| x )=P[Ua> Ub]=P[( a ¢ a x +ea – a ¢ b x –eb| x ]= = P[( a a – a b)¢ x +ea –eb> 0| x ]= P[ a ¢ x +e > 0| x ]. (10.64)
На практике по известным значениям наблюдаемой переменной yt оценивается вектор a = a a – a b. Рассмотренные выше модели использовали, так называемые индивидуальные данные. Каждое наблюдение содержало набор значений [yt, x t], характеризующих реальный выбор отдельного индивидуума и соответствующий вектор независимых факторов. Вместе с тем, часто при построении моделей бинарного выбора используются групповые данные, которые выражают результаты подсчетов или пропорций. Обозначим через kt количество индивидуумов, имеющих одинаковые значения, характеризующих их признаков (т. е. одинаковый вектор x t). Индекс t в этом случае выражает различные вектора признаков x t и соответствующие количества индивидуумов kt, обладающих ими. Пусть наблюдаемая зависимая переменная Nt выражает долю индивидуумов, у которых yt=1, в общем числе индивидуумов kt. С учетом этого информация для фиксированного индекса t выглядит как [kt, Nt, x t], t=1,..., T. Для сгруппированных таким образом данных представим зависимость доли Nt от факторов-признаков, характеризующих индивидуумов t-й группы, в следующем виде:
Nt=F( a ¢ x t)+et =pt +et, M[et]=0; D[et]=pt × (1–pt)/kt. (10.68)
где в качестве функции F( a ¢ x t) обычно используются функции законов нормального и логистического распределений; pt – оценка доли Nt; et – ошибка модели. В заключение раздела, посвященного рассмотрению моделей бинарного выбора, объясним происхождение терминов logit и probit. Из выражения (10.68) следует, что дисперсия ошибки e гетероскедастична. Поскольку функция F( a ¢ x t) предполагается нелинейной, то для оценки параметров следовало бы применить нелинейный МНК с весами, однако можно предложить менее громоздкий подход к решению данной задачи. Для этого обозначим через F(Nt) значение интегральной функции закона распределения в точке Nt. Тогда можно показать, что обратное значение этой функции F–1(Nt) допускает следующее представление*:
F–1(Nt)» a ¢ x t +et/f(pt) или F–1(Nt)=zt » a ¢ x t +ut, (10.66)
где f(pt)– значение функции плотности, соответствующей интегральной функции закона распределения F(.), в точке pt: ut=et/f(pt) – ошибка, обладающая следующими характеристиками: M[ut]=0;
Если F( a ¢ x t) является логистической функцией, т. е.
pt =exp( a ¢ x t)/[1+ exp( a ¢ x t)],
то несложно показать, что F–1(pt )=ln[pt /(1–pt)]= a ¢ x t. (10.71)
Функция типа (10.71) в научной литературе получила название logit-pt. В связи с этим модели бинарного выбора, в основе которых лежит логистическое распределение, обычно называют logit-модели. Для нормального распределения обратная функция Ф–1(pt) называется нормитом-pt. Функция Ф–1(pt) может принимать отрицательные значения, обычно не превышающие –5. Чтобы избежать работы с отрицательными числами к значению функции на практике добавляется число 5. Функция (нормит-pt +5) получила название probit-pt. Поэтому модели бинарного выбора, основанные на нормальном распределении, называются probit - модели. Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 775; Нарушение авторского права страницы