Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Модели цензурированных выборок
Напомним, что в случае цензурирования зависимой переменной yt вместо ее значений выше (или ниже) определенного уровня рассматривается сам этот уровень. Например, если спрос на билеты существенно превышает предложение, то за уровень спроса принимается количество проданных билетов (цензурирование сверху). В этом случае распределение случайной величины может быть представлено в виде сочетания дискретного и непрерывного распределений (см. рис. 10.9).
Рис. 10.9. Распределение, цензурированное “сверху”
Подходы к исследованию цензурированных и усеченных выборок очень похожи. Также обычно предполагают, что случайная переменная у имеет нормальное распределение. Покажем, как изменятся математическое ожидание и дисперсия случайной переменной у, если выборка ее значений цензурируется снизу. Введем в рассмотрение новую случайную переменную у*, такую, что если у*£ b, то у=b; если у*> b, то у=у*, (10.153)
где b – точка цензурирования. Если у*~N[m, s2], то математическое ожидание и дисперсия цензурированной случайной величины y соответственно равны*
M[y]=F× b+(1–F)× (m+s× l); (10.154) D[y]=s2× (1–F)× [(1–d)+(b–l)2× F], (10.155) где F[( b–m)/s]=F(b)=P(у*£ b)=F; (10.156) l=j/(1–F); (10.157) d=l2–l× b. (10.158) Цензурированная модель (tobit-модель). Для описания зависимости цензурированной переменной yt от влияющих на нее факторов обычно используется так называемая tobit-модель. Tobit - модель исходит из того, что цензурированная переменная yt описывается следующим выражением:
yt= a ¢ × x t+et. (10.159)
где yt – наблюдаемые значения зависимой переменной (например, либо фактические расходы на отдых за границей, либо 0); x t – вектор независимых переменных, влияющих на зависимую переменную yt, a – вектор параметров; et – ошибка модели. Далее tobit - модель предполагает, что цензурированным значениям yt (т. е. yt=0; b=0 – точка цензурирования) соответствует неположительное произведение a ¢ × x t ( a ¢ × x t£ 0); а нецензурированным значениям yt – положительное ( a ¢ × x t> 0). Из выражения (10.159) следует, что условное математическое ожидание переменной уt по факторам x t определяется как M[уt]= a ¢ × x t. (10.160)
Математическое ожидание уt с учетом цензурирования (т. е. M[уtцен]) для точки цензурирования b=0 определяются следующим образом (см. выражение (10.154)):
где
В соответствии с выражением (10.160) маржинальные эффекты факторов x t для математического ожидания переменной уt (без учета цензурирования) определяются как
В соответствии с выражением (10.161) маржинальные эффекты факторов x t для математического ожидания переменной уt с учетом цензурирования могут быть представлены в следующем виде:
Заметим, что tobit-модель предполагает, что изменение факторов x t приводит к тому, что вероятность P(yt> 0) и математическое ожидание М(yt|yt> 0) обязательно меняются в одинаковом направлении. Действительно, согласно выражению (10.156) вероятность того, что уt> 0 определяется как
P(уt> 0)=P( a ¢ × x t > 0)=F( a ¢ × x t /s). (10.165)
Соответственно маржинальный эффект факторов x t для вероятности P(уt> 0) может быть представлен в следующем виде:
¶P(yt> 0)/¶ х t=j( a ¢ × x t)× a. (10.166)
Если коэффициент ai положителен, то согласно выражениям (10.164) и (10.166) с увеличением фактора хit (i=1, 2,..., n; t=1, 2,..., T) увеличивается как математическое ожидание М(yt|yt> 0), так и вероятность P(yt> 0), и, наоборот, при отрицательном ai с ростом фактора хit эти показатели уменьшаются. Вместе с тем заметим, что эффект одновременного увеличения математического ожидания и вероятности при увеличении некоторого независимого фактора хi на практике может и не иметь место. В частности, как показали Фин и Шмидт (Fin and Schmidt, 1984), независимая переменная хi, увеличивающая вероятность нецензурированного наблюдения (P(yt> 0)), не всегда увеличивает и математическое ожидание переменной (М(yt|yt> 0)). В качестве примера они приводят потери от пожаров в зданиях. Вероятность возникновения пожара в старом здании выше, следовательно ¶P(yt> 0)/¶хit> 0 (хit – возраст t-го здания), но так как старое здание стоит дешевле, то и пожар в нем приносит меньше убытков, т. е. ¶М(yt|yt> 0)/¶хit< 0. Таким образом, в данной задаче предполагается, что коэффициент ai при факторе “возраст здания” имеет разные знаки в функциях вероятности и математического ожидания. В рамках tobit-модели это учесть невозможно. Для описания процессов, в рамках которых предположение об одинаковом характере маржинального эффекта математического ожидания и вероятности не выполняется, была предложена более общая модель, являющаяся сочетанием одномерной probit-модели и усеченной регрессии (для нецензурированных значений зависимой переменной). На основе probit-модели определяется вероятность нецензурированного (или цензурированного) наблюдения при данном наборе факторов x t.
P[уt> 0]=F( g ¢ x t); zt =1, P[уt=0]=1–F( g ¢ x t); zt =0, (10.167)
где F( g ¢ x t) – интегральная функция закона нормального распределения, определяющая вероятность нецензурированного наблюдения; g – вектор параметров модели, zt – переменная-индикатор, принимающая значение 1 для нецензурированного наблюдения и значение 0 – для цензурированного. Далее на основе модели усеченной регрессии определяется математическое ожидание нецензурированного наблюдения. В соответствии с выражением (10.150) математическое ожидание нецензурированной переменной может быть представлено в следующем виде: M[уt |zt =1]= a ¢ x t +s× lt. (10.168)
Заметим, что если g = a /s, то модель (10.167)–(10.168) сводится к tobit-модели. Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 1036; Нарушение авторского права страницы