Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Метод наименьших квадратов (МНК).



Оценка параметров регрессии a0 и a1 производится по наблюденным значениям зависимой и объясняющей переменным (xi, yi), i=1, 2, …, n, где n – число пар наблюдений (объем выборки). Рассматриваются n уравнений уi=a0+a1хi+ei, где уклонения ei является следствием реализации случайной составляющей, и выбирают такие значения a0 и a1, которые минимизируют сумму квадратов этих уклонений, т.е. ищется минимум

Q=å iei2= å i(уi – a0 – a1хi)2 (5)

по отношению к параметрам a0 и a1. Заметим, что указанный метод наименьших квадратов (МНК)может быть применен к любой кривой регрессии f(x). “Наилучшая” по МНК прямая линия всегда существует, но даже наилучшая не всегда является достаточно хорошей. Если в действительности зависимость у= f(x) является, например, квадратичной, то ее не сможет адекватно описать никакая линейная функция, хотя среди всех линейных функций обязательно найдется “наилучшая”.

Для отыскания минимума берутся частные производные Q по искомым параметрам (в данном случае по a0 и a1) и приравниваются к нулю. После выполнения элементарных преобразований получают так называемую систему нормальных уравнений, из которой и находятся искомые параметры. Для парной линейной регрессии получаем

a1=( × )/( – ( )2), (6)

a0= –a1 × =(( ) × × )/( – ( )2),

где xiyi/n, xi/n, yi/n, хi2/n.

Коэффициент a1 называется коэффициентом регрессии и обозначается ryx. Из (2) и (6) следует, что

ryx = ryx sy /sх. (7)

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученными по данным выборки, в известной степени может быть распространено и на генеральную совокупность, т.е. можно выдвинуть гипотезу об имеющейся линейной связи во всей генеральной совокупности вида у=a0+a1х.

Свойства оценок МНК.

Оценки, сделанные с помощью МНК, обладают следующими свойствами:

– оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению. Это вытекает из того, что Мe=0, и говорит об отсутствии систематической ошибки в определении положения линии регрессии;

– оценки состоятельны, так как дисперсия оценок параметров при возрастании числа наблюдений стремится к нулю. Иначе говоря, надежность оценки при увеличении выборки растет;

– оценки эффективны, они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра (при линейной аппроксимации). В англоязычной литературе они называются BLUE (Best Linear Unbiased Estimators – наилучшие линейные несмещенные оценки).

Регрессия по эмпирическим (выборочным) данным и теоретическая регрессия.

Пример 1. Исследуем зависимость розничного товарооборота (млрд. руб.) магазинов от среднесписочного числа работников. В табл.1 во втором и третьем столбцах приведены значения соответственно объемов розничного товарооборота(у) и среднесписочного числа работников(х), а в следующих столбцах – значения необходимых расчетных величин.

Таблица 1

номер у х (х – )2 (у – )2 х2 ху ŷ ε ε 2
0, 5 0, 49 36, 5 0, 43 0, 07 0, 0049
0, 7 0, 25 59, 5 0, 661 0, 039 0, 0015
0, 9 0, 09 91, 8 0, 998 -0, 098 0, 0096
1, 1 0, 01 126, 5 1, 239 -0, 139 0, 0193
1, 4 0, 04 170, 8 1, 373 0, 027 0, 0007
1, 4 0, 04 176, 4 1, 45 -0, 05 0, 0025
1, 7 0, 25 227, 8 1, 604 0, 096 0, 0092
1, 9 0, 49 279, 3 1, 854 0, 046 0, 0021
сумма 9, 6 1, 66 1168, 6 9, 592 0, 001 0, 0479
средн. 1, 2 544, 5 0, 2075 13313, 5 146, 075 1, 199 0, 0001 0, 0060

 

В соответствии с (6)

a1=( × )/( – ( )2) =(146, 075 – 113× 1, 2)/544, 5=0, 01924;

a0=(( ) × × )/( –( )2)=(13313, 5× 1, 2–113× 146, 075)/544, 5= -0, 974.

Таким образом, получено уравнение регрессии

ŷ = – 0, 974 + 0, 01924х.

Экономическая интерпретация параметров линейного уравнения регрессии.

Коэффициент регрессии a1=0, 01924 показывает, что увеличение среднесписочной численности на одного человека приводит к увеличению объема товарооборота в среднем на 19, 24 млн. руб. Это своего рода эмпирический норматив приростной эффективности использования работников данной группы магазинов. Если увеличение численности на одного работника приводит к меньшему росту объема товарооборота, то прием его на работу необоснован.

Выборочный коэффициент корреляции можно определить, используя равенство (7).

ryx = 0, 01924√ 544, 5/0, 2075= 0, 9856,

что свидетельствует о наличии тесной линейной связи между численностью работников и розничным товарооборотом.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-05-30; Просмотров: 1354; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.014 с.)
Главная | Случайная страница | Обратная связь