II. Cтруктурно-параметрический синтез регрессионных моделей

Как выбирать структуру модели?

Постановка задачи структурного синтеза ё

Заданы, как обычно, матрица наблюдений Х (n*m), вектор отклика Y (n*1)

предполагается задание

А) перечня аргументов Х₁….Х_M_,с избытком для синтеза модели: _,M> m (лин. случай). Необходимо найти наилучшую модель или

Б) предполагается синтез наилучшей нелинейной модели тогда количество обобщенных аргументов φ _j( x ), j=1,..., m,...неисчерпаемо.

Очевидный вариант, - давайте усложнять структуру модели до тех пор, пока не получим «нулевую ошибку» (то есть догоняем структуру до m= n ) - не проходит,

так как любая структура удовлетворит такой «0-й ошибке», в том числе связывающая скорость ракеты с поговьем волков в Тамбовской области.

В идеальных условиях, без шума и корреляции входных аргументов, возможно применить (не всегда –только при достаточно больших n, чтобы рассматривались модели при m< n) подход в лоб

5 =============================

Моделирование по полному списку аргументов

Применим исключительно при отсутствии шумов и независимости случайных входных признаков.

Производим расчет полной модели и по уровню значимости коэффициентов оставляем только значимые аргументы. Затем для контроля рассчитываем стандартизованную модель ( это модель с нормированными переменными. такими, что

В такой модели коэффициенты при аргументах имеют смысл коэффициентов корреляции аргумента с выходом модели )

Мы отбрасываем аргументы из полной модели, которые вошли в стандартизованную модель с незначимыми крэффициентами.

Факт отбор или выбраковки аргументов в модель производится по уровню значимости соответствующих коэффициентов модели..

С точностью до переобозначения получаем модель

Очевидно что при выполнении условий независимости переменных и отсутствия помех лишние аргументы войдут в модель на незначимом уровне определенном по сути вычислительным шумом. Но обозначенные идеальные условия – иллюзия

- …шум вычислений всегда присутствует,

- практически всегда присутсттвует коррелированность аргументов, даже порожденных ГСЧ (корреляция до 0.05-0.07),

- не говоря о постановке Б), где коррелированность заложена в постановке задачи (корреляция –некоторая лин. зависимости есть и в нелинейных базисах …. )

Проблемы нарушения условий применения МНК приводят к различным отклонениям в

1.оценках параметров (состоятельности, несмещенности, эффективности) и

2. включению фиктивных аргументовв модель вместо истинных

Как мы уже знаем наращивать точность до 0-й ошибки - плохая стратегия. Модели должны быть более простые, чем досигающие 0-й ошибки при m= n. В этой ситуации любая структура дасть 0-й ошибку.

А какой механизм выбрать для получения более простых (с ненулевой ошибкой) структур, которые наболее соответствовали нашим ожиданиям?

– минимальной ошибке на новых точках?

(имеено эта сверхзадача обычно стоит за любой задачей моделирования).

Решение проблемы проводится по 2-м направлениям

1. Отбор наилучших структур осуществляется за счет применения штрафов за сложность модели в явном виде и

2. Отбор наилучших структур осуществляется за счет применения штрафа за сложность в неявном виде. Данный механизм обеспечивает решение сверхзадачи – минимизацию ошибки модели на новых выборках.

- 1.Первый путь (явный штраф засложность) частично реализуется в классических ШАМР и принципе отбора моделей по критериям Акаике, Шварца и Меллоуза

- 2. Второй путь (неявный штраф за сложность) основан на различных принципах нахождения новых, свежих выборок и отбор осуществляется тех структур моделей, которые обеспечивают минимум ошибки моделей на этих свежих данных.

Методы, которые предлагают свой ответ на вопрос как сформировать новые выборки данных - это

А) будстреп, Б) метод складного ножа (джек найф), и В) МГУА

В МГУА предложены и другие варианты внешнего критерия которые обеспечивают модели оптимальной сложности для различных содержательных задач (аппроксимация, прогноз, дискриминация) и различных условий синтеза моделей.

⇐ Предыдущая 1 2 3 4 567 8 9 10 Следующая ⇒

Последнее изменение этой страницы: 2017-04-12; Просмотров: 392; Нарушение авторского права страницы