|
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Регрессионный метод и анализ ковариаций ANCOVA
Изучение зависимости случайной величины от ряда неслучайных и случайных величин приводят к моделям регрессии и регрессионному анализу на базе выборочных данных. Здесь соответствующий математический инструментарий в отличии от дисперсионного анализа не ставит своей целью установление причинной связи. Хотя, важно отметить, что гипотеза о причинной связи привносится из других теорий и дает возможность содержательно объяснить изучаемые явления. Для одномерной (парной или множественной) регрессии одна случайная величина (зависимая переменная
Примером регрессионной зависимости может служить зависимость между урожайностью определенной сельскохозяйственной культуры и влияющими на нее природными и экономическими факторами. Здесь из внестатистических соображений известно, что дожди влияют на урожай, а не наоборот. Следовательно, необходимо изучать зависимость урожайности от дождей и других природно-экономических факторов.
Исходным пунктом приложений регрессионного анализа является ситуация, которую можно описать следующим образом: 1. Объект исследования, как и прежде, представляется наблюдаемыми величинами (признаками) 2. Между ними предполагается наличие объективной связи. На основе процедур анализа ковариаций (ANCOVA) может быть установлено, что связь между наблюдаемой величиной 3. В простейшем случае, очевидно, не особенно рассчитывая на высокую степень адекватности, предполагается, что в принципе эту связь между зависимой величиной Очевидно, что, если такая функциональная зависимость в принципе действительно существует в природе, то ее точное аналитическое выражение узнать невозможно, а наблюдаемые эмпирические значения ее параметров можно только аппроксимировать. Тогда, по объективным причинам наблюдаемые данные в любом случае будут отклоняться от этой функции. Для простоты рассуждений будем рассматривать простейшую зависимость в виде линейной функции. Отклонения включаются в модель, причем предполагается, что линейная функциональная связь между наблюдаемыми величинами Таким образом, линейное уравнение функциональных связей, называемое регрессионным уравнением, имеет следующий вид
Значения наблюдаемых величин при оценке параметров модели Основная цель регрессионного анализа – теоретически обоснованный и статистически надежный точечный и интервальный прогнозы зависимой переменной Классическая процедура одношагового метода наименьших квадратов (1МНК). Имеющиеся ряды наблюдений по
Случайность возмущений Ряды данных (наблюдений) длиной Далее введем обозначения:
и (1.14) можно записать в векторном виде: Далее к обеим частям соотношения (1.12) применим оператор математического ожидания и получим:
Величину, которую можно прогнозировать с помощью регрессионного уравнения. При оценке параметров регрессионной функции применяется принцип минимума суммы квадратов ошибок (отклонений). Алгоритм вычислений. 1. Формирование целевой функции. Вычисляются: Ошибка или отклонение: Квадрат ошибки: Здесь Сумма квадратов ошибок:
Это и есть целевая функция. Представим ее в виде:
Далее, следуя необходимому условию экстремума функции многих переменных, вычислим частную производную целевой функции и приравняем ее нулю.
Необходимый признак:
или
В матричном виде:
Здесь неизвестным (искомым) является вектор
Подставляя найденные значения
С учетом того, что эмпирическая функция регрессии линейная, то дифференцирование ее по каждому из признаков (по переменным
В качестве иллюстрации рассмотрим пример, где одношаговый метод наименьших квадратов в экспресс-режиме дает возможность получить результат в виде (1.12). Пример 1.2. Проведена оценка процессоров 10-ти рабочих станций локальной сети, построенной на базе машин приблизительно одного типа, но разных производителей (что предполагает некоторые отклонения параметров работы машин от базовой модели). Для тестирования работы процессоров использована смесь типа ICOMP 2.0 в основу, которой положены два основных теста: 1. 125.turb3D – тест моделирования турбулентности в кубическом объеме (прикладное ПО); 2. NortonSI32 – инженерная программа типа AutoCaD. Вместе со смесью был применен вспомогательный тест для нормирования времени обработки данных SPECint_base95. Оценка процессоров производилась по взвешенному времени выполнения смеси, нормированному по эффективности базового процессора, в соответствии с формулой
где
Если выражение (1.15) логарифмировать, то получим:
и после переобозначения переменных:
Здесь:
По данным измерений, приведенным в таблице, построить регрессионную (эмпирическую) функцию, оценить коэффициенты регрессии и проверить модель на адекватность (вычислить ковариационную матрицу, коэффициенты парной корреляции, коэффициент детерминации). В таблице 1.3 приведены результаты в масштабе единиц общего выделенного признака
Таблица 1.3 – Результаты замеров в масштабе единиц первого признака
Очевидно, будем иметь для указанных данных в соответствии с алгоритмом:
Вектор правой части системы нормальных уравнений Гаусса определяется следующим образом (в матричной форме):
Численные значения компонентов вектора регрессионных коэффициентов, оцененные методом наименьших квадратов:
Сама эмпирическая двухфакторная регрессия будет иметь вид:
Она приводит к следующим прогнозным (расчетным) значениям регрессанда:
Далее рассчитываем компоненты вектора отклонений
и математическое ожидание вектора ошибок:
Близость его значения к нулю свидетельствует о том, что расчеты выполнены верно. Как уже было указано, оценки По определению, характеристикой взаимосвязи двух случайных величин является их ковариация. Известно, что ковариацией случайных величин
Согласно этому определению ковариации, для совокупной характеристики оценок
Ковариационная матрица по эмпирическим данным может быть получена Она неизвестна и может быть лишь оценена.
Оцененная матрица: Возвращаясь к примеру, укажем, что
и рассчитаем величину
Тогда:
Об уровне связи между оцененными параметрами можно говорить более конкретно, если рассчитать коэффициенты парной корреляции
Их значения по абсолютной величине близки к единице. Это свидетельствует о том, что между параметрами существует достаточно тесная связь.
Важно заметить, что более существенная роль ковариационному анализу отводится при исследованиях авторегрессионных процессов. Известно, что автокорреляция возмущений означает, что Определение: Возмущение
Здесь ковариационная матрица, которая имеет следующий вид:
(
|
Последнее изменение этой страницы: 2017-04-12; Просмотров: 522; Нарушение авторского права страницы