Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


II. Cтруктурно-параметрический синтез регрессионных моделей



Как выбирать структуру модели?

Постановка задачи структурного синтеза ё

Заданы, как обычно, матрица наблюдений Х (n*m), вектор отклика Y (n*1)

предполагается задание

А) перечня аргументов Х1….ХM, с избытком для синтеза модели: , M> m (лин. случай). Необходимо найти наилучшую модель или

Б) предполагается синтез наилучшей нелинейной модели тогда количество обобщенных аргументов φ j( x ), j=1,..., m,...неисчерпаемо.

Очевидный вариант, - давайте усложнять структуру модели до тех пор, пока не получим «нулевую ошибку» (то есть догоняем структуру до m= n ) - не проходит,

так как любая структура удовлетворит такой «0-й ошибке», в том числе связывающая скорость ракеты с поговьем волков в Тамбовской области.

В идеальных условиях, без шума и корреляции входных аргументов, возможно применить (не всегда –только при достаточно больших n, чтобы рассматривались модели при m< n) подход в лоб

5 =============================

Моделирование по полному списку аргументов

Применим исключительно при отсутствии шумов и независимости случайных входных признаков.

Производим расчет полной модели и по уровню значимости коэффициентов оставляем только значимые аргументы. Затем для контроля рассчитываем стандартизованную модель ( это модель с нормированными переменными. такими, что

В такой модели коэффициенты при аргументах имеют смысл коэффициентов корреляции аргумента с выходом модели )

Мы отбрасываем аргументы из полной модели, которые вошли в стандартизованную модель с незначимыми крэффициентами.

Факт отбор или выбраковки аргументов в модель производится по уровню значимости соответствующих коэффициентов модели..

С точностью до переобозначения получаем модель

Очевидно что при выполнении условий независимости переменных и отсутствия помех лишние аргументы войдут в модель на незначимом уровне определенном по сути вычислительным шумом. Но обозначенные идеальные условия – иллюзия

- …шум вычислений всегда присутствует,

- практически всегда присутсттвует коррелированность аргументов, даже порожденных ГСЧ (корреляция до 0.05-0.07),

- не говоря о постановке Б), где коррелированность заложена в постановке задачи (корреляция –некоторая лин. зависимости есть и в нелинейных базисах …. )

Проблемы нарушения условий применения МНК приводят к различным отклонениям в

1.оценках параметров (состоятельности, несмещенности, эффективности) и

2. включению фиктивных аргументовв модель вместо истинных

Как мы уже знаем наращивать точность до 0-й ошибки - плохая стратегия. Модели должны быть более простые, чем досигающие 0-й ошибки при m= n. В этой ситуации любая структура дасть 0-й ошибку.

А какой механизм выбрать для получения более простых (с ненулевой ошибкой) структур, которые наболее соответствовали нашим ожиданиям?

минимальной ошибке на новых точках?

(имеено эта сверхзадача обычно стоит за любой задачей моделирования).

Решение проблемы проводится по 2-м направлениям

1. Отбор наилучших структур осуществляется за счет применения штрафов за сложность модели в явном виде и

2. Отбор наилучших структур осуществляется за счет применения штрафа за сложность в неявном виде. Данный механизм обеспечивает решение сверхзадачи – минимизацию ошибки модели на новых выборках.

- 1.Первый путь (явный штраф засложность) частично реализуется в классических ШАМР и принципе отбора моделей по критериям Акаике, Шварца и Меллоуза

- 2. Второй путь (неявный штраф за сложность) основан на различных принципах нахождения новых, свежих выборок и отбор осуществляется тех структур моделей, которые обеспечивают минимум ошибки моделей на этих свежих данных.

Методы, которые предлагают свой ответ на вопрос как сформировать новые выборки данных - это

А) будстреп, Б) метод складного ножа (джек найф), и В) МГУА

В МГУА предложены и другие варианты внешнего критерия которые обеспечивают модели оптимальной сложности для различных содержательных задач (аппроксимация, прогноз, дискриминация) и различных условий синтеза моделей.


Поделиться:



Последнее изменение этой страницы: 2017-04-12; Просмотров: 392; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.013 с.)
Главная | Случайная страница | Обратная связь