|
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Дисперсионный анализ лин. регрессии.
Непосредственному определению коэф дет предшествует анализ дисперсии. Основной целью дисперсионного анализа является исследование значимости различия между средними. Центральное место в дисп.анализе занимает разложение общей суммы кв.отклонений результирующего показателя у от его сред.зн-я у (с чертой) на две части: объясненную(факторную) и остаточную(необъясн).
Таким образом, условно все факторы, определяющие изменение результирующего показателя, разделены на две группы: изучаемый фактор х и прочие факторы. Если изучаемый фактор х не оказывает влияния, то линия регрессии параллельна оси Ох, т. е. уравнение регрессии будет иметь вид: ух = у=а. сумма факт=0 В этом случае влияние оказывают другие факторы, и, следовательно, вся дисперсия результативного признака обусловлена другими факторами. Если другие факторы не оказывают влияние на результат у, то он связан с фактором х функционально, и сумма квадратов остатков будет равна нулю. Тогда если ввести отнош суммы кв факторной к сумме кВ общей как коэф детерминации то он будет изменяться от 0 до 1. При чем если r=0 то связь отсутствует, если =1 то связь тесная функциональная. r=∑ (yxi-y-)^2/∑ (yi-y-)^2=S2yфакт/S2yобщ. Через остаточную сумму: =1- S2yост/ S2yобщ Замечание 1. Можно показать что для лин ф-и регр сущ связь r=rxy2 т.е. квадрат коэф корр есть коэф детерминации. Замечание 2. Коэф корр хар-т тесноту лин ф-ции регр, а детерм для любой. В случае рассмотрения нелин ф-и регр находят коэф дет и зняю связь между коэ-ми вводят индекс корреляции. Rxy=r^1/2 Замечание 3. Между коэ кор, регрессии b и коэф дет для лин ф-ции регр сущ связь
44. анализ тесноты свф-и регр с пом кр фишера в целом оценка знач-ти Осущ-ся с помощью F-критерия Фишера, котор. сопоставляет факторную(объясненную) и остаточную дисперсии в расчете на одну степень свободы.Для вычисления F- критерия Фишера используется разложение общей суммы квадратов отклонений Сравнение 2-х сумм квадратов отклонения позвол.вып-ть оценку значимости ур-я рег-ии. Устан-м число степеней своб. для кажд. суммы квадратов отклонений При этом число степеней свободы-число единиц совокупности выборки и число определяемых констант. Для общей суммы
- факторная и остат дисперсии. Приведен. соотнош. дают возмож. исп-ть их для оценки стат. значим-ти ур-я рег-ии., кот. вкл. след. этапы: (для оцен. знач. выдвиг. след. гипотезы) 1) 40.Оценка существ-ти пар-ров лен. рег-ии. Пар-ры лин. рег. (коэф. b и своб член а)явл. случ. вел-ми, т.к. вычисл. с помощью Эл-в выборки.Надеж-ть оценок a и b завис. от дисперсии случ-х отклон-й ε Доказ., что
где Sa bSb-стандарт. отклон.b-мера наклона линии рег-и.Чем > разброс знач. результир. показ. y вокруг лин. рег., тем > ошибка в опр. наклона лин.Выборочная дисперсия своб. члена а пропорц. диспер. коэф. b.След-но, чем > ошибка в опр-ии b, тем > разброс а.Стат. знач b м.б. опр-на с пом. анализа его отнош. к своему стандарт. отклонению.Эта вел. имеет t-распред-е Стьюдента с (n-2)степ. своб.Назыв. t-статистики: t=b/Sb.Примен. для проверки существенности b.Для t-стат. провер-ся гипотеза Hо о рав-ве 0 статистики.t=0, сл-но b=0.Опр-ся фактич. значение t-критерия Стьюдента, кот. сравнив. с таблич знач.Процедура проверки коэф. рег. и своб. члена ур-я рег. аналогична пров-ке значимости ур-я рег.
МНК для лин ф-и регр вид: ух=а+bx. Хар-ет семейства прямых, каждое из которых характеризуется конкретными значениями коэффициентов а и Ь, Наилучшей из всего множества прямых для рассматриваемой выборки является та прямая, которая на плоскости хОу расположена " ближе" всего, в определенном смысле, к опытным точкам. В качестве меры близости прямой и некоторой точки на плоскости можно выбрать расстояние между ними. При этом под расстоянием следует понимать модуль разности между опытным (наблюдаемым) значением результирующей величины и теоретическим. В качестве критерия близости между прямой и множеством точек на плоскости целесообразно выбрать минимум суммы квадратов этих расстояний. Е=∑ (yi-a-bxi)^2-> min. Здесь считается, что yt и xi - известные статистические данные; а и Ъ — неизвестные параметры (коэффициенты) функции регрессии. Поскольку функция Е непрерывна, выпукла и ограничена снизу нулем, то она имеет минимум. Изложенная идея минимизации суммы квадратов отклонений (на плоскости расстояний) опытных от теоретических значений объясняемой переменной положена в основу метода наименьших квадратов. Для нахождения коэф a и b лин регр, минимизирующих ф-ю, необходимо продифференцировать ее по а и Ъ и приравнять производные нулю: После преобразований окончательно будем иметь В рез-те решения будем иметь
Популярное:
|
Последнее изменение этой страницы: 2016-09-01; Просмотров: 699; Нарушение авторского права страницы