Оценивание параметров и свойства выборочных оценок

⇐ ПредыдущаяСтр 4 из 5Следующая ⇒

При исследовании различных параметров генеральной совокупности на основе выборки возможно лишь получение оценок этих параметров. Необходимые оценки строятся на основе ограниченного набора данных, что влечет за собой определенную вероятность погрешности в статистических выводах. Заметим, что значения оценок могут изменяться от выборки к выборке.

Процесс нахождения оценок неизвестного генерального параметра θ, от которого зависит распределение СВ Х, будем называть оцениванием. Цель любого оценивания – получение наиболее точного значения оцениваемой характеристики (наилучшей оценки). Обычно на начальном этапе эконометрических исследований берутся выборочные числовые характеристики, рассмотренные в предыдущем параграфе. Затем, исследуя соответствующую оценку, ее уточняют таким образом, чтобы она удовлетворяла основным целям оценивания. Различают два вида оценок параметров распределения генеральной совокупности – точечные и интервальные.

Точечной оценкой параметра θ называется числовое значение этого параметра, полученное по определенным правилам по выборке объема n. Например, оценками параметров нормального распределения m и σ (Х) могут быть и σ _в. Оценка является функцией выборки, отобранной для изучения, и может рассматриваться как СВ со своими числовыми характеристиками. «Наилучшая оценка» должна обладать наименьшим рассеиванием относительно оцениваемого параметра θ, т. е. должна иметь наименьшую дисперсию среди всех других оценок. Число ε такое, что называется точностью (абсолютной погрешностью) оценки.

Рассмотрим свойства, выполнимость которых желательна для того, чтобы оценка была признана удовлетворительной. Качество оценок будем характеризовать следующими основными параметрами: несмещенность, эффективность и состоятельность.

Оценка параметра θ называется несмещенной, если ее математическое ожидание равно оцениваемому параметру: М( ) = θ. Если это равенство не выполняется, то оценка является смещенной и разность М( ) - θ будет называться смещением или систематической ошибкой оценивания. Соответственно, оценка будет в среднем занижать (если М( ) - θ < 0), либо завышать (если М( ) - θ > 0) значение параметра θ.

Несмещенная оценка называется эффективной оценкой параметра θ, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок при фиксированном объеме выборки n.

Оценка называется асимптотически эффективной, если с увеличением объема выборки ее дисперсия стремится к нулю (D_n( ) ® 0, при n ® ¥ ).

Оценка параметра θ называется состоятельной, если она сходится по вероятности к оцениваемому параметру:

, (1.38)

для любого сколь угодно малого ε > 0.

Другими словами, состоятельной является такая оценка, которая, согласно закону больших чисел, дает истинное значение параметра при достаточно большом объеме выборки.

Оценки, являющиеся линейными функциями от выборочных наблюдений, называются линейными. Важную роль в эконометрике играют наилучшие линейные несмещенные оценки, которые имеют наименьшую дисперсию среди всех возможных оценок данного класса.

Наиболее известными методами нахождения точечных оценок параметров генеральной совокупности являются метод моментов, метод максимального правдоподобия, метод наименьших квадратов. Здесь мы кратко остановимся на описании метода максимального правдоподобия, поскольку метод наименьших квадратов будет рассмотрен в последующих главах как основной метод нахождения оценок параметров регрессионных эконометрических моделей.

Пусть СВ Х представлена выборкой x₁, x₂, …, x_n и имеет плотность распределения f(x, θ ), зависящую от неизвестного параметра θ. Согласно методу максимального правдоподобия, в качестве оценки параметра θ принимается такое значение , которое максимизирует функцию правдоподобия L:

, (1.39)

выражающую плотность вероятностей совместного появления результатов выборки x₁, x₂, …, x_n. В большинстве случаев более эффективно рассматривать логарифмическую функцию правдоподобия l = lnL. Необходимым условием максимума является уравнение ( ), которое называется уравнением правдоподобия. Для широкого класса задач оценки метода максимального правдоподобия являются состоятельными и асимптотически эффективными. В то же время они могут быть смещенными. Недостатком метода является необходимость знать закон распределения СВ.

Например, с помощью несложных преобразований можно показать, что оценками максимального правдоподобия для нормальной генеральной совокупности являются выборочное среднее и выборочная дисперсия . Выборочное среднее является несмещенной и состоятельной оценкой математического ожидания М(Х) генеральной совокупности. Выборочная дисперсия является смещенной оценкой дисперсии генеральной совокупности D(X) = σ ², так как доказано, что D_в = σ ² · (n - 1)/n. Иными словами, выборочная дисперсия оценивает генеральную дисперсию D(X) с недостатком. Несмещенной и состоятельной оценкой будет исправленная выборочная дисперсия

. (1.40)

Следует заметить, что при n ® ¥ и оценка D_в является асимптотически несмещенной. Различие между D_в и S² при n > 30 практически отсутствует. Поэтому при достаточно большом объеме выборки обе дисперсии можно считать несмещенными оценками.

В соответствии с S² вводится исправленное среднее квадратическое отклонение (эмпирический стандарт) S:

. (1.41)

Относительная частота является несмещенной и состоятельной оценкой вероятности Р(Х = х_i). Соответственно, эмпирическая функция распределения (накопленная относительная частота) является несмещенной и состоятельной оценкой теоретической функции распределения F(x) = P(X < x).

Наряду с точечными оценками параметров рассматривают интервальные оценки, которые позволяют получить информацию о точности и надежности оценивания неизвестного параметра, что особенно важно для выборок небольшого объема.

Интервальной оценкой параметра θ называют числовой интервал , который с заданной вероятностью γ накрывает неизвестное точное значение оцениваемого параметра. При этом указанный интервал называют доверительным интервалом, а вероятность γ – доверительной вероятностью или надежностью оценки.

Величина доверительного интервала, характеризующая точность оценки, зависит от объема выборки n (уменьшается с ростом n) и надежности γ (увеличивается с приближением γ к единице). Зачастую для определения доверительного интервала заранее выбирают число α = 1 – γ, называемое уровнем значимости, и находят два числа и , такие, что

. (1.42)

В этом случае говорят, что доверительный интервал накрывает неизвестный параметр θ с вероятностью 1 – α или в 100(1 – α )% случаев. Границы интервала обычно находятся из условия Р(θ < ) = P(θ > ) = α /2. Выбор γ (или α ) определяется необходимой надежностью оценки. Обычно используется α = 0, 1; 0, 05; 0, 01, что соответствует 90, 95 и 99%-м доверительным интервалам.

Поскольку в эконометрических задачах часто приходится находить доверительные интервалы параметров СВ, приведем примеры их построения.

Доверительный интервал для математического ожидания нормальной СВ. Из генеральной совокупности нормально распределенной СВ Х с параметрами m и σ извлекается выборка объема n. В качестве точечной оценки математического ожидания m используется выборочное среднее .

В силу свойств многомерного нормального распределения [2] величина (статистика) , где – исправленное выборочное среднее квадратическое отклонение, имеет распределение Стьюдента с n – 1 степенями свободы. Тогда, при требуемом уровне значимости α, доверительный интервал для математического ожидания, накрывающий неизвестное значение m с надежностью 1 – α, определятся из следующих соотношений:

(1.43)

. (1.44)

Доверительный интервал для дисперсии нормальной СВ. Для оценки σ ² извлекается выборка объема n. В качестве точечной оценки дисперсии σ ² = D(X) используется исправленная выборочная дисперсия S². Учитывая, что статистика имеет χ ²-распределение с n - 1 степенями свободы, доверительный интервал для неизвестного значения генеральной дисперсии σ ² на уровне значимости α определяется по формуле:

. (1.45)

Для заданного α критические точки определяются по соответствующим таблицам.

⇐ Предыдущая 1 2 345 Следующая ⇒