Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
II. Cтруктурно-параметрический синтез регрессионных моделей
Как выбирать структуру модели? Постановка задачи структурного синтеза ё Заданы, как обычно, матрица наблюдений Х (n*m), вектор отклика Y (n*1) предполагается задание А) перечня аргументов Х1….ХM, с избытком для синтеза модели: , M> m (лин. случай). Необходимо найти наилучшую модель или Б) предполагается синтез наилучшей нелинейной модели тогда количество обобщенных аргументов φ j( x ), j=1,..., m,...неисчерпаемо. Очевидный вариант, - давайте усложнять структуру модели до тех пор, пока не получим «нулевую ошибку» (то есть догоняем структуру до m= n ) - не проходит, так как любая структура удовлетворит такой «0-й ошибке», в том числе связывающая скорость ракеты с поговьем волков в Тамбовской области. В идеальных условиях, без шума и корреляции входных аргументов, возможно применить (не всегда –только при достаточно больших n, чтобы рассматривались модели при m< n) подход в лоб 5 ============================= Моделирование по полному списку аргументов Применим исключительно при отсутствии шумов и независимости случайных входных признаков. Производим расчет полной модели и по уровню значимости коэффициентов оставляем только значимые аргументы. Затем для контроля рассчитываем стандартизованную модель ( это модель с нормированными переменными. такими, что В такой модели коэффициенты при аргументах имеют смысл коэффициентов корреляции аргумента с выходом модели ) Мы отбрасываем аргументы из полной модели, которые вошли в стандартизованную модель с незначимыми крэффициентами. Факт отбор или выбраковки аргументов в модель производится по уровню значимости соответствующих коэффициентов модели.. С точностью до переобозначения получаем модель Очевидно что при выполнении условий независимости переменных и отсутствия помех лишние аргументы войдут в модель на незначимом уровне определенном по сути вычислительным шумом. Но обозначенные идеальные условия – иллюзия - …шум вычислений всегда присутствует, - практически всегда присутсттвует коррелированность аргументов, даже порожденных ГСЧ (корреляция до 0.05-0.07), - не говоря о постановке Б), где коррелированность заложена в постановке задачи (корреляция –некоторая лин. зависимости есть и в нелинейных базисах …. ) Проблемы нарушения условий применения МНК приводят к различным отклонениям в 1.оценках параметров (состоятельности, несмещенности, эффективности) и 2. включению фиктивных аргументовв модель вместо истинных Как мы уже знаем наращивать точность до 0-й ошибки - плохая стратегия. Модели должны быть более простые, чем досигающие 0-й ошибки при m= n. В этой ситуации любая структура дасть 0-й ошибку. А какой механизм выбрать для получения более простых (с ненулевой ошибкой) структур, которые наболее соответствовали нашим ожиданиям? – минимальной ошибке на новых точках? (имеено эта сверхзадача обычно стоит за любой задачей моделирования). Решение проблемы проводится по 2-м направлениям 1. Отбор наилучших структур осуществляется за счет применения штрафов за сложность модели в явном виде и 2. Отбор наилучших структур осуществляется за счет применения штрафа за сложность в неявном виде. Данный механизм обеспечивает решение сверхзадачи – минимизацию ошибки модели на новых выборках. - 1.Первый путь (явный штраф засложность) частично реализуется в классических ШАМР и принципе отбора моделей по критериям Акаике, Шварца и Меллоуза - 2. Второй путь (неявный штраф за сложность) основан на различных принципах нахождения новых, свежих выборок и отбор осуществляется тех структур моделей, которые обеспечивают минимум ошибки моделей на этих свежих данных. Методы, которые предлагают свой ответ на вопрос как сформировать новые выборки данных - это А) будстреп, Б) метод складного ножа (джек найф), и В) МГУА В МГУА предложены и другие варианты внешнего критерия которые обеспечивают модели оптимальной сложности для различных содержательных задач (аппроксимация, прогноз, дискриминация) и различных условий синтеза моделей. |
Последнее изменение этой страницы: 2017-04-12; Просмотров: 425; Нарушение авторского права страницы