Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Модели случайно усеченных выборок (selection-model)
Предположим, что переменные у и z имеют двумерное распределение с коэффициентом корреляции r. Найдем распределение у по случайной выборке (у, z) условии, что уровень переменной z превышает определенное значение (z> b). Интуиция подсказывает, что если у и z положительно коррелированы, то усечение z должно подвинуть распределение у вправо. Нахождение распределения у связано с определением, во-первых, вида функции плотности случайно усеченного распределения переменных у и z, и, во-вторых, математического ожидания и дисперсии случайно усеченной переменной у при условии, что у и z подчинены закону двумерного нормального распределения. Усеченная совместная плотность у и z согласно выражению (10.136) при любом распределении этих переменных определяется следующим выражением:
Если у и z распределены согласно двумерному нормальному закону с математическими ожиданиями my и mz и стандартными отклонениями s y и s z, а коэффициент их парной корреляции равен r, то в соответствии с выражениями (10.142)–(10.143) условные математическое ожидание и дисперсия у при усечении z определяются следующим образом:
M[y|z> b]=my+r× s y × l(b z); (10.169) D[y|z> b]=sy2× [1–r2× d(b z)], (10.170) где b z =(b–my)/s z; (10.171) l(b z)=f(b z)/[1–F(b z)]; (10.172) d(b z)=l(b z)× [l(b z)–b z]. (10.173)
Заметим, что при усечении сверху, т. е. z< b, математическое ожидание и дисперсия переменной у также определяется согласно выражениям (10.169) и (10.170) при l(b z)=–f(b z)/ F(b z). Из выражения (10.169) следует, что при усечении “снизу” условное математическое ожидание у смещается в направлении корреляции переменных у и z, если усечение проводится “сверху”, то – в направлении противоположном корреляции. Случайное усечение уменьшает дисперсию, т. к. d(b z) и r2 принадлежат интервалу (0, 1). Рассмотрим два примера, иллюстрирующих случайное усечение. Предположим, что любая женщина выходит на работу только в том случае, если ее потенциальный доход будет превышать некоторый критический уровень (для каждой женщины свой). Допустим, переменная zt представляет собой разность между потенциальным и критическим доходом, и зависимость между переменной zt и влияющими на нее факторами x t1 можно представить следующим образом:
zt= a ¢ × x t (1)+et(1), (10.174)
где x t(1) – вектор независимых факторов, влияющих на разность доходов (например, возраст, образование, количество детей и т. д.); a – вектор параметров модели; et(1) – ошибка модели. Для всех женщин, у которых zt> 0, требуется определить желательное количество рабочих часов yt. Предположим, что зависимость между переменной yt и влияющими на нее факторами хt(2) также можно описать линейной эконометрической моделью:
yt= b ¢ × x t(2)+et(2), (10.175)
где x t(2) – вектор независимых факторов, влияющих на желательное количество рабочих часов (например, семейный статус, количество детей и т. д.); b – вектор параметров модели; et(2) – ошибка модели. Заметим, что вектора x t(1) и x t(2) могут как совпадать, так и отличаться друг от друга. При формировании модели (10.175) возникает проблема усечения, поскольку данные о часах работы имеются только для работающих женщин, т. е. число часов – случайно усеченная переменная. В разделе 10.3.1 рассматривалась модель миграции, в которой переменные, влияющие на принятие решения о смене места жительства, были представлены эконометрическими моделями в зависимости от набора соответствующих факторов. В целом модель содержала три уравнения:
чистая прибыль от переезда – Nt*= g ¢ × w t +ut; (10.176) доходы при переезде – ytp = a ¢ × x tp +etp; (10.177) доходы при “непереезде” – ytm = b ¢ × x tm +etm. (10.178)
где w t, x tp и x tm – вектора независимых переменных, влияющих соответственно на чистую прибыль от переезда, и доходы в случае переезда и “непереезда”; g, a и b – вектора параметров; ut, etp и etm – ошибки модели. Предположим, что совокупность мигрантов формируется из числа лиц, желающих переехать, для которых чистая прибыль от переезда положительна. Чистая прибыль от переезда zt*, определяется согласно выражению (10.176) как
zt*= g ¢ × w t +ut.(10.179)
Для совокупности мигрантов формируется уравнение, связывающее величину их дохода на новом месте уt с некоторым набором факторов x t, характеризующих, например, опыт работы, пол, образование и т. д:
уt= a ¢ × x t +et. (10.180)
где a – вектор параметров; et – вектор ошибки. Переменная уt является случайно усеченной, так как информация о доходе мигранта может быть получена, когда переезд индивидуума на новое место жительства уже осуществился, и индивидуум приступил к работе. Поскольку доход на новом месте и чистая прибыль от переезда взаимосвязаны, ошибки et и ut моделей (10.179) и (10.180) взаимозависимы. Предположим, что они распределены согласно двумерному нормальному закону с нулевыми математическими ожиданиями и коэффициентом корреляции r. В этом случае в соответствии с выражениями (10.169)–(10.170) получим:
M[yt | yt наблюдаемый доход]=M[yt |zt*> 0]=M[yt | ut> – g ¢ × w t]= = a ¢ × x t+M[et | ut> – g ¢ × w t]= a ¢ × x t +r× se× lt (b u)= a ¢ × x t +al× lt (bu), (10.181)
где bu =– g ¢ × w t /su и l t(bu)=f( g ¢ × w t /su)/F( g ¢ × w t /su). Выражение (10.181) показывает, что условное математическое ожидание выборочной совокупности доходов мигрантов при условии zt> 0 находится в непосредственной и опосредованной зависимости от факторов x t. Непосредственная зависимость выражается слагаемым a ¢ × x t, а опосредованная, характеризующая влияние факторов x t на вероятность того, что переменная zt*положительна, определяется слагаемым r× se× lt(bu). На практике значение переменной zt* не наблюдается, она является латентной. Наблюдаемая переменная z принимает значение 1 (событие произошло) или 0 – в противном случае. В наших примерах: женщина работает или нет, индивидуум мигрирует или нет. С учетом этого представим модель (10.179)–(10.180) в виде совокупности двух следующих моделей: 1. Модели селекции, определяющие выборку мигрантов
zt*= g ¢ × w t+ut; (10.182) zt=1, если zt*> 0; (10.183) zt=0, если zt*< 0; (10.184) P(zt =1)=F( g ¢ × w t ); (10.185) P(zt =0)=1–F( g ¢ × w t ). (10.186)
2. Модели дохода мигранта
yt = a ¢ × x t +et. (10.187)
yt представляет собой значение дохода индивидуума, фактически сменившего место жительства случайную выборку мигрантов, лиц фактически сменивших место жительства, для которого zt =1. В соответствии с введенным предположнием о зависимости между ошибками et и ut моделей (10.179) и (10.180) закон их совместного распределения характеризуется характеризуется следующими свойствами:
(ut, et)~N(0, 0, 1, se, r). (10.188)
Согласно выражению (10.169) условное математическое ожидание yt при zt=1определяется согласно выражению:
M[yt |zt=1]= a ¢ × x t+r× se× l( g ¢ × w t ). (10.189) Популярное:
|
Последнее изменение этой страницы: 2016-03-25; Просмотров: 617; Нарушение авторского права страницы