Метод максимального счета (MSCORE)

⇐ ПредыдущаяСтр 10 из 16Следующая ⇒

Рассмотрим особенности метода максимального счета, применяемого наряду с методом максимального правдоподобия для оценки параметров модели бинарного выбора.

Этот метод использует критерий, представляющий собой максимум числа совпадений реальных и расчетных ответов, который критерий можно представить в следующем виде:

Max _a S_b( a )= ( a ¢ x _t)]*. (10.210)

Параметр b – это установленный квантиль; sgn( a ¢ x _t) – знак числа a ¢ x _t; z_t=2y_t –1 (z_t =–1, если y_t=0; z_t=1, если y_t=1). Если b=1, метод максимального счета выбирает оценку параметров a таким образом, чтобы максимизировать число раз, когда a ¢ x _tимеет тот же знак, что и z_t.

Метод по своей сути является полупараметрическим, поскольку он использует не параметры распределений, а их заменители.

Оценки параметров a _i (i=1, 2, …, n) определяются путем перебора возможных их сочетаний при заданном уровне точности (например, 0, 0001) с учетом ограничения

Так как метод максимального счета не предполагает вычисление функции правдоподобия, то невозможно определить и информационную матрицу для определения стандартных ошибок оценок. Чтобы получить представление об изменчивости оценок, обычно используется метод самонастройки (bootstapping). Он заключается в следующем. После вычиcления набора оценок коэффициентов a _Tиз выборки делается К случайных подвыборок, содержащих по t наблюдений. Для каждой k-й подвыборок метод максимального счета дает свои оценки a _t(k). Тогда среднеквадратические отклонения можно оценить следующим образом:

Отметим еще раз, что элементы матрицы MSD не являются ковариациями соответствующих оценок, они лишь характеризуют их взаимную изменчивость.

Преимущество полупараметрических методов оценки параметров состоит в том, что при их использовании не возникают ошибки, связанные с неправильным выбором закона распределения погрешностей модели. С другой стороны, нет никаких гарантий, что полученные на их основе оценки будут лучше, чем «параметрические». Существенным недостатком полупараметрических методов является то, что они требуют очень большого количества вычислений для получения оценок параметров. Это выдвигает определенные ограничения в отношении максимального еоличества параметров модели и объема исходной информации. Сейчас метод максимального счета не используется для оценки более чем 15 коэффициентов на основе 1500-2000 наблюдений. Еще один недостаток этого подхода обусловлен невозможностью параллельного получения вместе с оценками параметров дополнительной информации, относящейся к характеристикам качества модели, точности оценок и т. п. Для содержательного анализа влияния факторов на зависимую переменную очень важны маржинальные эффекты, а на основе полупараметрических методов оценить их также не представляется возможным.

Как развитиеметода максимального счета можно рассматривать, предложенный его авторами метод вторичного анализа результатов. Этот метод позволяет получить оценки математического ожидания переменной y_t, в зависимости от величин, влияющих на нее факторов.

Рассмотрим основные положения этого метода. Пусть

F _a (z_t )=M[y_t | a ¢ x _t=z_t] (10.212)

представляет собой гладкую функцию “отклика” y_tна x _t. Основываясь на векторе параметров оценок параметров a (полученном с помощью метода максимального счета), авторы предлагают построить F _a (z_t) с помощью так называемого kernel-метода.

Для вектора оценок параметров a и известных значений независимых переменных x _t(t=1,..., T) определим следующие значения:

z_t= a ¢ x _t, (10.213)

Для произвольного значения z^*, принадлежащего области допустимых значений произведения a ¢ x, можно определить следующий набор весов (kernel-функций) w_t(t=1,..., T):

где

(10.217)

Константа используется для стандартизации логистического распределения, которое применяется в kernel-функции; l – параметр сглаживания. Значения l должны быть досаточно велики, чтобы функция F(z^*) была гладкой, использование маленьких, близких к нулю, значений l усиливает большую колебания функции. Хорошей теоретической основы для выбора l не существует, за исключением некоторых предположений, которые можно сделать на основе описательной статистики.

Функция F(z^*) (в выражении (2.212)) определяется следующим образом:

где – наблюдаемые значения у_t, t=1,..., T.

Расчетные значения функции F(z^*) при заданном наборе факторов х _t обычно интерпретируются как математическое ожидание зависимой переменной y_t(М[y_t]).

Вопросы к главе X

1. Каковы последствия ошибок измерений зависимой переменной?

2. Каковы последствия ошибок измерений независимых переменных?

3. Каковы последствия ошибок измерений и зависимой и независимых переменных?

4. Охарактеризуйте модели с фиктивными независимыими переменными.

5. Дайте классификацию моделей с дискретными заивисимыми переменными.

6. В чем состоит суть моделей бинарного выбора?

7. Какие законы распределений наиболее часто используются в моделях бинарного выбора?

8. В чем состоят недостатки линейной модели вероятности?

9. Охарактеризуйте модель бинарного выбора, исходящую из групповых данных?

10. Что собой представляет многомерная probit-модель?

11. Что собой представляют модели множественного выбора?

12. Какие типы моделей используются для описания выбора среди неупорядоченных альтернатив?

13. Каким образом моделируется выбор среди упорядоченных альтернатив?

14. Какие законы распределений используются в моделях счетных данных?

15. Охарактеризуйте последствия построения эконометрической модели на основе усеченной выборки?

16. Как изменяются математическое ожидание и дисперсия зависимой переменной, если при оценки параметров модели используется цензурированная выборка?

17. Охарактеризуйте модели случайно усеченных выборок.

18. Каковы особенности применения метода максимального правдоподобия для оценки параметров моделей с дискретными зависимыми переменными?

19. Как выглядят необходимые условия максимизации логарифма функции правдоподобия для моделей усеченных и цензурированных выборок?

20. Что собой представляет метод максимального счета?

21. В чем суть kernel-метода?

Упражнения к главе Х

Задание 10.1

Logit-модель была применена к выборке, в которой y=1, если количество занятых в фирме выросло (y=0 – в противном случае), х₁ – доход фирмы, в млн. $; х₂=1, если фирма относится к области высоких технологий (х₂=0 – в противном случае). Получена следующая модель:

Требуется определить оценку вероятности роста занятости для фирмы высокотехнологичной фирмы А с доходом в 5 млн. $ и для фирмы Б, не относящейся к сфере высоких технологий и имеющей доход 7 млн. $.

Задание 10.2

Имеется выборка, состоящая из 528 наблюдений, в которой y=1, если заработная плата работника ниже 5$ в час (y=0 – в противном случае). Предполагается, что уровень заработной платы зависит от следующих факторов: х₁ – образование, лет; х₂– пол (1–женский, 0 – мужской); х₃– опыт работы, лет. В табл. 10.1 приведены коэффициенты, полученные при оценке линейной регрессии y от х₁, х₂ и х₃с помощью МНК, и при оценке Logit-модели с помощью нелинейного МНК.

Таблица 10.1

	Коэффициенты
	линейной регрессии	Logit-модели	Выборочные средние
	0, 94	5, 87
х₁	–0, 05	–0, 56	13, 09
х₂	0, 15	1, 26	0, 46
х₃	–0, 01	–0, 06	17, 66

Требуется:

1. Определить на основе Logit-модели, оценку вероятности для мужчины и для женщины, имеющих 12 лет образования и 15 лет опыта работы, оказаться низкооплачиваемыми работниками.

2. Определить на основе Logit-модели, изменение оценки вероятности быть низко оплачиваемым работником для мужчины с характеристиками из п. 1, если он проучится на один год больше.

3. Ответить на вопросы п. 1–2 с использованием линейной регрессионной модели.

Задание 10.3

Имеется выборка, состоящая из 528 наблюдений, в которой y=1, если работник состоит в профсоюзе (y=0 – в противном случае). Предполагается, что членство в профсоюзе зависит от следующих факторов: х₁ – образование, лет; х₂– пол (1–женский, 0 – мужской); х₃– опыт работы, лет; х₄– опыт работы в квадрате. Выборочные средние равны

На основе выборочных данных была получена следующая Probit-модель:

Требуется определить, насколько снижается вероятность быть членом профсоюза в расчете на год дополнительного образования.

Задание 10.4

Имеется набор данных, состоящий из 6 наблюдений.

y
x	–1	–2

Требуется:

1. Оценить линейную модель вероятности с помощью МНК. Рассчитать R².

2. Использовать оцененную модель для разделения индивидуумов на 2 группы. Рассчитать количество случаев правильного отнесения к соответствующей группе, применяя следующее правило классификации:

группа I (y=1), если

группа II (y=0), если

Сопоставьте долю правильного попадания и коэффициент детерминации.

Задание 10.5

Среди 48 респондентов был проведен опрос о среднемесячных затратах на табачные изделия. Полученные результаты представлены в табл. 10.2.

Таблица 10.2

Требуется:

1. Определить по цензурированным данным МНК-оценку параметра Tobit-модели где e_t ~N(0, s²), и у_t = у_t^*, если у_t^*> 0, у_t =0, если у_t^*£ 0.

2. Определить по усеченным на уровне 0 данным МНК-оценку параметра Tobit-модели.

Задание 10.6 [1]

В 1973 году в г. Трое (штат Мичиган) проводился референдум по вопросу о введении местного школьного налога. В ходе опроса были выявлялись определенные характеристики участников референдума (см. табл. 10.3).

Таблица 10.3

Название характерис-	Значение
тики

PUB1	Один ребенок посещает государственную школу	В противном случае
PUB2	Двое детей посещают государственную школу	В противном случае
PUB3	Трое детей посещают государственную школу	В противном случае
PUB4	Четверо детей посещают государственную школу	В противном случае
PUB5	Пятеро и более детей посещают государственную школу	В противном случае
PRIV	В семье есть дети (один или более), посещающие частную школу	В противном случае
SCHOOL	Респондент работает учителем (в государственной или частной школе)	В противном случае
YESVM	Респондент проголосовал «за» на референдуме по вопросу о введении местного «школьного» налога	В противном случае

Кроме того, YEARS=количество лет, прожитых в Трое; LogINC=натуральный логарифм годового дохода домашнего хозяйства, $; PTCON=натуральный логарифм суммы годовых платежей по налогу на имущество, $. Информация о 95 респондентах представлена в табл. 10.4

Таблица 10.4

№	PUB1& 2	PUB3& 4	PUB5	PRIV	YEARS	SCHOOL	Log INC	PTCON	YESVM

							09.770	7.0475
							10.021	7.0475
							10.021	7.0475
							09.4335	6.3969
							10.021	7.2792
							10.463	7.0475
							10.021	7.0475
							10.021	7.2793
							10.222	7.0475
							09.4335	7.0475
							10.021	7.0475
							09.770	6.3969
							09.770	6.7452
							10.021	7.0475
							10.820	6.7452
							09.770	6.7452
							10.222	7.0475
							10.021	7.0475
							10.222	7.0475
							10.222	6.7452
							10.463	7.0475
							10.222	7.0475
							09.770	6.7452
							10.463	7.2793
							10.021	6.7452
							10.463	7.0475
							09.770	6.7452
							09.770	7.0475

Продолжение табл. 10.4


							09.770	6.7452
							10.222	7.0475
							10.021	6.7452
							09.4335	6.7452
							08.294	7.0475
							10.463	7.0475
							10.021	7.0475
							10.222	7.2793
							10.222	7.0475
							10.222	7.4955
							10.021	7.0475
							10.222	7.0475
							10.021	7.0475
							10.820	7.4955
							10.021	7.0475
							10.021	7.0475
							10.021	6.7452
							10.021	7.0475
							09.770	6.7452
							10.222	7.4955
							09.7700	6.7452
							10.021	7.0475
							10.021	6.7452
							09.4335	6.7452
							10.463	7.2793
							09.770	7.0475
							10.021	7.0475
							09.7700	5.9915
							09.4335	7.0475
							09.770	6.3969

Продолжение табл. 10.4


							10.021	6.7452
							10.463	7.0475
							10.021	7.0475
							10.820	7.2793
							09.4335	6.7452
							09.770	5.9915
							08.9227	6.3969
							09.4335	7.4955
							09.4335	6.7452
							10.021	7.0475
							10.021	7.0475
							10.021	7.0475
							10.222	7.0475
							09.770	7.0475
							10.021	7.2793
							09.770	7.0475
							09.770	7.0475
							10.222	6.7452
							10.463	6.7452
							10.222	6.7452
							09.770	6.7452
							10.222	7.0475
							10.021	7.2793
							10.463	6.7452
							09.770	7.0475
							10.820	7.4955
							08.9227	5.9915
							09.770	7.0475

Окончание табл. 10.4


							09.4335	6.3969
							09.7700	6.7452
							10.021	7.0475
							10.021	6.7452
							10.222	7.2793
							10.021	7.0475
							10.021	7.0475
							08.9227	5.9915
							10.463	7.4955

Требуется:

1. Оценить параметры следующей модели:

Prob(YESVM=1)=F(PUB1& 2, PUB3& 4, PUB5, PRIV, YEARS, SCHOOL, LogINC, PTCON)

c использованием МНК, Probit- и Logit-процедур.

2. Рассчитать на основе модели, оцененной с помощью МНК, прогноз вероятности для каждого из респондентов проголосовать “за” введение местного школьного налога. Определить для скольких случаев прогнозное значение выходит за рамки интервала от 0 до 1.

⇐ Предыдущая 5 6 7 8 91011 12 13 14 Следующая ⇒