![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Уравнение парной линейной регрессии
Пусть функционирование экономического объекта описывается двумя числовыми переменными: входной переменной X и выходной переменной Y. Возможно, что X может изменяться (регулироваться) исследователем, а значение Y получается как результат функционирования объекта. Предполагается, что Y зависит от X практически линейно: Y=mX+b+e, (1) где m и b – детерминированные величины, e – случайная величина. Выходная переменная Y называется зависимой переменной (или объясняемой переменной, или откликом). Входная переменная X называется независимой переменной (или объясняющей переменной, или фактором, или регрессором). Случайную величину e в эконометрике называют возмущением. Если математическое ожидание возмущения равно нулю, то функция f(x)= mx+b является условным математическим ожиданием Y при заданном значении X=x: f(x)≡ MxY. В этом случае соотношение (1) называется регрессионным уравнением. Чтобы подчеркнуть, что переменных всего две, а связь между ними линейная, говорят, что (1) – уравнение парной линейной регрессии. Функция f(x) называется регрессией (линейной) Y по X (или функцией регрессии), а величины m и b – параметрами линейной регрессии (m – коэффициентом, b – сдвигом). Пусть имеется n наблюдений величин X и Y: (x1, y1), (x2, y2), …, (xn, yn). Из соотношения (1) получаем: yi=mxi+b+ε i, где ε i – возмущение в i-ом наблюдении, i=1, …, n. Требуется по наблюдениям найти в некотором смысле наилучшие оценки
Формулу (2) можно использовать для прогноза значения отклика по интересующему исследователя значению фактора. Оценивание параметров уравнения линейной регрессии Для получения оценок Обозначим: Графически определение остатков поясняется на рис. 1. Координатная плоскость, на которой нанесены точки наблюдений, называется полем корреляции. С учетом принятых обозначений остаточная сумма является суммой квадратов остатков и задается формулой:
Ясно, что чем меньше Qe, тем лучше оценки соответствуют наблюдениям. Из необходимого условия экстремума Qe (равенства частных производных по
В формулах (4) и (5) использованы обозначения: Определения перечисленных выше выборочных характеристик приводятся в Приложении. Вывод формул (4) и (5) дается, например, в [5]. Понятие тесноты связи Заметим, что сдвиг b нельзя считать объективной характеристикой зависимости Y от X, потому что его величина определяется выбором начала координат. Из соотношения (5), в частности, следует, что для МНК-оценок
Это соотношение связывает отклонения оценки отклика и фактора от их выборочных средних значений. Переход от величин к их отклонениям от среднего называется центрированием этих величин. Заметим, что значение На первый взгляд кажется, что по величине коэффициента
где введено обозначение: Величина r называется выборочным коэффициентом корреляции (см. Приложение). Коэффициент r показывает, на сколько значений sy в среднем увеличится отклик, если фактор увеличится на sx. Говорят, что выборочный коэффициент корреляции характеризует тесноту связи между X и Y. Известно, что |r| ≤ 1. Чем ближе |r| к 1, тем теснее связь между X и Y; чем ближе |r| к 0, тем слабее связь. При r=±1 точки наблюдений лежат на прямой, задаваемой соотношением (2). При r=0 прямая (2) параллельна оси абсцисс, и связь между X и Y отсутствует. Примеры тесной и слабой связи даны на рис.2.
Популярное:
|
Последнее изменение этой страницы: 2016-08-31; Просмотров: 1010; Нарушение авторского права страницы