Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Статистический анализ регрессионной модели



Планирование эксперимента исходит из статистического характера зависимостей, поэтому полученные уравнения подвергаются тщательному статистическому анализу с целью извлечь из результатов эксперимента максимум информации и убедиться в достоверности полученной зависимости и ее точности.

Точность получаемой модели обязательно должна быть сопоставлена с интенсивностью случайной помехи, воздействующей на результат измерения отклика Y. При прочих равных условиях, чем меньше уровень помехи, тем более точной (и, как правило, сложной) должна быть модель; чем выше уровень помехи, тем в большей степени можно ожидать, что более простая (необычно менее точная) модель окажется работоспособной. Фактически здесь можно провести известную аналогию с задачами теории измерений, ясно, например, что подключение прибора высокого класса точности для измерения переменной, отягощенной большой случайной ошибкой есть расточительность.

Например, для однофакторной ситуации приведенной на рис. 5.5, теоретическая функция отклика весьма сложной формы, и кроме того имеет место значительная случайная помеха. В данном случае для предсказания Y по Х нецелесообразно использовать сложную модель, поскольку все равно точность предсказания будет определяться в основном шумовой составляющей.

Рис. 5.5. К принципу сопоставления с шумом:

1 – теоретическая функция отклика; 2 – линейная модель

 

На примере рис. 5.5 можно проиллюстрировать понятие «корреляционной связи», которое широко используется при обработке экспериментальных данных. Если две переменные зависят друг от друга так, что каждому значению Х соответствует значение Y, то между ними существует функциональная связь. Однако часто между переменными Х и Y существует связь, но не вполне определенная. Одному значению X соответствует несколько значений (совокупность) Y. В этом случае связь называют корреляционной. Чтобы предварительно определить наличие корреляционной связи между Х и Y, наносят точки на график и строят так называемое корреляционное поле. По тесноте группирования точек вокруг прямой или кривой линии, по наклону линии можно визуально судить о наличии корреляционной связи. Так, из рис. 5.5 видно, что экспериментальные данные имеют определенную связь между Х и Y. По форме поля можно ориентировочно судить о форме графика, характеризующей прямолинейную или криволинейную зависимости. Поскольку многие реальные объекты характеризуются высоким уровнем помех, при их описании получили наибольшее распространение регрессионные модели первого и второго порядков.

После вычисления коэффициентов уравнения следует, прежде всего, проверить его пригодность или адекватность.

Для оценки адекватности регрессионной модели применяют критерий Фишера. Установление адекватности – это определение ошибки аппроксимации опытных данных. Для этого необходимо рассчитать экспериментальное (опытное) значение критерия Фишера – kфэ и сравнить его с теоретическим (табличным) – kфт, принимаемым при требуемой доверительной вероятности (обычно 0,95). Если kфэ < kфт – модель адекватна; если kфэ  kфт – модель неадекватна.

Опытный критерий Фишера вычисляют по формуле ,

где – дисперсия адекватности;  – средняя дисперсия всего эксперимента, определяющиеся как

;        

Здесь – расчетное значение функции (отклика) в j-ой точке;  – среднее экспериментальное значение функции в каждом опыте; m – количество серий измерений (число повторных или параллельных измерений в каждом из опытов); N – количество опытов.

Значение kфт принимается по справочным таблицам для определенной доверительной вероятности и числа степеней свободы , .

В случае проведения вычислительного эксперимента на модели результаты параллельных опытов совпадают и таким образом, дисперсия воспроизводимости и дисперсия опыта равны 0. В связи с этим приведенные статистические оценки аппроксимирующей зависимости могут быть применены только в том случае, если погрешность опыта известна заранее. Если погрешность не может быть определена заранее, то для оценки удовлетворительности аппроксимации можно прибегнуть к другим критериям, например, к абсолютным и относительным погрешностям. Для этого достаточно оценить отклонение выходной величины Yjр, предсказанной уравнением регрессии, от результатов эксперимента Yj в различных точках. Просматривая значения этих отклонений, исследователь может легко понять, какова погрешность предсказания в точках, где проводились опыты, устраивают его или нет подобные ошибки. Таким образом, путем сопоставления фактических значений отклика с предсказанными по уравнению регрессии можно получить достаточно надежное свидетельство о точностных характеристиках модели.

В результате определения уравнения регрессии может получиться так, что один (или несколько) коэффициентов не очень большие и окажутся незначимыми. Факторы, имеющие коэффициенты, незначимо отличающиеся от нуля, могут быть выведены из состава уравнения, так как их влияние на параметры отклика будет отнесено к ошибке эксперимента. Проверка значимости оценок коэффициентов регрессии проводится для того, чтобы установить статистическую значимость или незначимость отличия от 0 коэффициентов регрессии, т.е. выясняется, обусловлено ли отличие bi от 0 чисто случайными обстоятельствами, влиянием помехи или же это отличие не случайно. Такую оценку проводят отдельно для каждого коэффициента с помощью критерия Стьюдента:

, h = 0, 1, 2,….d;

где h – число коэффициентов регрессии; – среднеквадратическое отклонение оценки .

Полученное значение  должно быть сопоставлено с табличным значением t для определенной доверительной вероятности и числа степеней свободы.

Если  t, коэффициент  считается незначимым (т.е. можно принять = 0) и соответствующее слагаемое исключается из уравнения регрессии.

С помощью анализа работоспособности регрессионной модели выясняют практическую возможность ее использования для решения какой-либо задачи. Это анализ проводится путем вычисления коэффициента детерминации R2 (квадрата корреляционного отношения), который является удобным числовым показателем, интегрально характеризующим точностные свойства уравнения регрессии.

,

где  – общее среднее значение функции отклика

Величина R2 может изменяться в пределах от 0 до 1. Если R2 больше 1, то уравнение регрессии выбрано неверно или сделана ошибка при расчете его параметров. Если R2 = 1, регрессионная кривая проходит через все экспериментальные точки. Малое значение R2 всегда свидетельствует о низкой точности уравнения регрессии. Если  уравнение регрессии, как правило, считают работоспособным.

Анализ результатов эксперимента завершается интерпретацией статистической модели в терминах объекта исследования. Прежде всего, выясняется, в какой мере каждый из факторов влияет на функцию отклика.

В процессе анализа результатов эксперимента помимо выявления соотношений между функцией отклика и факторами возможно определение условий, при которых функция отклика оптимальна (достигает экстремума).

 

Планирование эксперимента при поиске оптимума

Важное место в теории планирования эксперимента занимают вопросы оптимизации исследуемых объектов и процессов. Качество процесса или объекта обычно характеризуется несколькими функциями отклика. Как правило, нельзя найти такое сочетание влияющих факторов, при котором одновременно достигается экстремум всех функций отклика. Например, максимальный крутящий момент двигателя и минимальный расход топлива достигаются при различных режимах работы. Критерием оптимальности может быть лишь одна из функций отклика, характеризующих процесс. Проблема оптимизации сводится к отысканию таких значений факторов, при которых отклик достигает экстремума (минимума или максимума).

Оптимизацию обычно осуществляют в условиях ограничений на влияющие факторы и исследуемые функции отклика, поскольку как факторы, так и функции могут изменяться только в определенных границах.

Среди наиболее распространенных методов оптимизации можно выделить: метод поразрядного приближения, градиентный метод, метод дихотомии (половинного деления), метод координатного спуска, метод квадратичной интерполяции-экстраполяции и др.

 

Таким образом, планирование эксперимента включает следующие основные этапы:

– выбирается цель исследования и ее количественная характеристика (функция отклика);

– выбираются из действующих в системе факторов наиболее важные X1, X2, ….Xk;

– устанавливаются пределы изменений факторов  и , вычисляются основной уровень  и интервал (шаг) варьирования , заменяются переменные Xi на кодированные xi ;

– разрабатывается методика измерения выбранных факторов, определяется погрешность и число повторений в каждой из выбранных комбинаций факторов;

– выбирается регрессионная модель процесса. В случае недостатка информации вначале принимается линейная модель;

– составляется или выбирается по справочным таблицам план эксперимента;

– проводится эксперимент;

– вычисляются коэффициенты регрессии изучаемой зависимости и проверяется адекватность полученной модели. Если линейная модель не согласуется с экспериментом, то проводятся дополнительные опыты для построения более сложных зависимостей.

– проводится анализ полученного в итоге уравнения регрессии и делаются соответствующие выводы.

 

В настоящее время методы планирования эксперимента заложены в специализированных пакетах, широко представленных на рынке программных продуктов, например: StatGrapfics, Statistica, SPSS, SYSTAT и др.

 


* Таблицы планов эксперимента для факторных и полиномиальных моделей. М.: Металлургия, 1982. С. 752.


Поделиться:



Последнее изменение этой страницы: 2019-04-19; Просмотров: 324; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.017 с.)
Главная | Случайная страница | Обратная связь