Модели цензурированных выборок

⇐ ПредыдущаяСтр 8 из 16Следующая ⇒

Напомним, что в случае цензурирования зависимой переменной y_tвместо ее значений выше (или ниже) определенного уровня рассматривается сам этот уровень.

Например, если спрос на билеты существенно превышает предложение, то за уровень спроса принимается количество проданных билетов (цензурирование сверху). В этом случае распределение случайной величины может быть представлено в виде сочетания дискретного и непрерывного распределений (см. рис. 10.9).

Рис. 10.9. Распределение, цензурированное “сверху”

Подходы к исследованию цензурированных и усеченных выборок очень похожи. Также обычно предполагают, что случайная переменная у имеет нормальное распределение.

Покажем, как изменятся математическое ожидание и дисперсия случайной переменной у, если выборка ее значений цензурируется снизу.

Введем в рассмотрение новую случайную переменную у^*, такую, что

если у^*£ b, то у=b;

если у^*> b, то у=у^*, (10.153)

где b – точка цензурирования.

Если у^*~N[m, s²], то математическое ожидание и дисперсия цензурированной случайной величины y соответственно равны*

M[y]=F× b+(1–F)× (m+s× l); (10.154)

D[y]=s²× (1–F)× [(1–d)+(b–l)²× F], (10.155)

где

F[( b–m)/s]=F(b)=P(у^*£ b)=F; (10.156)

l=j/(1–F); (10.157)

d=l²–l× b. (10.158)

Цензурированная модель (tobit-модель).

Для описания зависимости цензурированной переменной y_t от влияющих на нее факторов обычно используется так называемая tobit-модель.

Tobit - модель исходит из того, что цензурированная переменная y_tописывается следующим выражением:

y_t= a ¢ × x _t+e_t. (10.159)

где y_t– наблюдаемые значения зависимой переменной (например, либо фактические расходы на отдых за границей, либо 0); x _t– вектор независимых переменных, влияющих на зависимую переменную y_t, a – вектор параметров; e_t – ошибка модели.

Далее tobit - модель предполагает, что цензурированным значениям y_t (т. е. y_t=0; b=0 – точка цензурирования) соответствует неположительное произведение a ¢ × x _t ( a ¢ × x _t£ 0); а нецензурированным значениям y_t– положительное ( a ¢ × x _t> 0).

Из выражения (10.159) следует, что условное математическое ожидание переменной у_tпо факторам x _tопределяется как

M[у_t]= a ¢ × x _t. (10.160)

Математическое ожидание у_tс учетом цензурирования (т. е. M[у_t^цен]) для точки цензурирования b=0 определяются следующим образом (см. выражение (10.154)):

где

В соответствии с выражением (10.160) маржинальные эффекты факторов x _t для математического ожидания переменной у_t(без учета цензурирования) определяются как

В соответствии с выражением (10.161) маржинальные эффекты факторов x _t для математического ожидания переменной у_t с учетом цензурирования могут быть представлены в следующем виде:

Заметим, что tobit-модель предполагает, что изменение факторов x _t приводит к тому, что вероятность P(y_t> 0) и математическое ожидание М(y_t|y_t> 0) обязательно меняются в одинаковом направлении. Действительно, согласно выражению (10.156) вероятность того, что у_t> 0 определяется как

P(у_t> 0)=P( a ¢ × x _t > 0)=F( a ¢ × x _t /s). (10.165)

Соответственно маржинальный эффект факторов x _tдля вероятности P(у_t> 0) может быть представлен в следующем виде:

¶P(y_t> 0)/¶ х _t=j( a ¢ × x _t)× a. (10.166)

Если коэффициент a_i положителен, то согласно выражениям (10.164) и (10.166) с увеличением фактора х_it(i=1, 2,..., n; t=1, 2,..., T) увеличивается как математическое ожидание М(y_t|y_t> 0), так и вероятность P(y_t> 0), и, наоборот, при отрицательном a_i с ростом фактора х_itэти показатели уменьшаются.

Вместе с тем заметим, что эффект одновременного увеличения математического ожидания и вероятности при увеличении некоторого независимого фактора х_iна практике может и не иметь место. В частности, как показали Фин и Шмидт (Fin and Schmidt, 1984), независимая переменная х_i, увеличивающая вероятность нецензурированного наблюдения (P(y_t> 0)), не всегда увеличивает и математическое ожидание переменной (М(y_t|y_t> 0)). В качестве примера они приводят потери от пожаров в зданиях. Вероятность возникновения пожара в старом здании выше, следовательно ¶P(y_t> 0)/¶х_it> 0 (х_it – возраст t-го здания), но так как старое здание стоит дешевле, то и пожар в нем приносит меньше убытков, т. е. ¶М(y_t|y_t> 0)/¶х_it< 0. Таким образом, в данной задаче предполагается, что коэффициент a_iпри факторе “возраст здания” имеет разные знаки в функциях вероятности и математического ожидания. В рамках tobit-модели это учесть невозможно.

Для описания процессов, в рамках которых предположение об одинаковом характере маржинального эффекта математического ожидания и вероятности не выполняется, была предложена более общая модель, являющаяся сочетанием одномерной probit-модели и усеченной регрессии (для нецензурированных значений зависимой переменной).

На основе probit-модели определяется вероятность нецензурированного (или цензурированного) наблюдения при данном наборе факторов x _t.

P[у_t> 0]=F( g ¢ x _t); z_t =1,

P[у_t=0]=1–F( g ¢ x _t); z_t =0, (10.167)

где F( g ¢ x _t) – интегральная функция закона нормального распределения, определяющая вероятность нецензурированного наблюдения; g – вектор параметров модели, z_t – переменная-индикатор, принимающая значение 1 для нецензурированного наблюдения и значение 0 – для цензурированного.

Далее на основе модели усеченной регрессии определяется математическое ожидание нецензурированного наблюдения. В соответствии с выражением (10.150) математическое ожидание нецензурированной переменной может быть представлено в следующем виде:

M[у_t |z_t =1]= a ¢ x _t +s× l_t. (10.168)

Заметим, что если g = a /s, то модель (10.167)–(10.168) сводится к tobit-модели.

⇐ Предыдущая 3 4 5 6 789 10 11 12 Следующая ⇒