Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Проблемы методов структурной идентификации



Обратим внимание на множитель ( ) в формуле МST и попадающий в числитель в статистике Фишера (*)

Чем сложнее модель тем более корректируется расчетное значение критерия в сторону уменьшения (то есть ухудшения) препятствуя включению аргумента в модель. Таким образом мы видим что даже классичский ШАМР уже использовал определенную форму штрафа за сложность модели. Правда его влияние при больших n незначительно и практически не влияет на структуру модели.

Другие проблемы ШАМР

1. Для конкретных условий шума в данных (в Х и У) соотношение и - свое " с точки зрения наиболее точного прогноза на свежих точках или более общо - с точки зрения " внешнего критерия " который мы определяем как " истина для нас " - в то время как сам алгоритм ШР опирается лишь на точность текущей обуч выборки и значение и предлагает выбирать нам.

2. известный недостаток теории стат. гипотез:

только результат по введению аргумента (не принятию H0 ) в ней считается достоверным. Результаты по принятию H0 в обще-то ничего не гарантирует. Применяется такая хитрозделанная формулировка – принятие гипотезы H0 не противоречит исходным данным.

= это приблизительно так как если бы у вас во дворе се8одня ночью убили дворника и обвинили в этом меня только на том основаниии что я спал дома один и некому подтвердить мое алиби. Так ведь еще в эту ночь 200 тыс киевлян спали одни – однако от этого вывод не меняется – гипотеза об обвинении в убичтве принимается на том основании что она не притиворечит исходны. данным. – Так накопайте другие данные – или лучше смените алгоритм - но как часто бвыает в жизни – лень и пользуются тем что имеют .

3. Кроме того, уменьшая (увелич порог качества аргумента) мы не тоько увеличиваем вероятность правильного отвержения ложного аргумента 1- но и очевидно увеличиваем вероятность отвержения вместе с ним и истинного аргумента увеличиваем ошибку второго рода - истинный аргумент тоже может не проскочить слишком высокий порог ФИШЕРА.

И магическое число =0, 05 совсем не магическое и в разных задачах при разных шумах и разных корреляциях истинных и ложных аргументов с выходом (в некоторых случаях корреляция ложного будет выше корреляции истинного с выходом - зависит от коэффициента при соответствующем аргументе в модели) это число имеет свое опт значение - а какое???? - проблема проблема

Мы с вер =0.05 (это вер ош 1-го рода ) отвергаем правильное утверждение Н0 сост в том что на входе - ложный аргумент(цель - ложн аргумент -не пропустить его)

то есть в этом случае с этой вероятностью мы пропускаем его в качестве истинного -то есть принимаем ложн аргумент за истинный. 0.95 - с этой вероятностью мы собъем ложный аргумент. Но проблема в том что повышая порог Ф - уменьш мы тем самым косвенно увеличиваем ошибку второго рода и сбиваем истинный аргумент заодно с ложным на всякий случай - модели упрощаются, ошибка ее растет.

Воообще оптимальное сочетание и (Fвкл и Fискл) -ключевой нерешенный вопрос АШР от которого и зависит окончательная структура получаемой модели.

Критерии с явным штрафом за сложность модели (продолжение)

 

И так постулируем следующие части алгоритма структурно-параметрического синтеза.

1.Генератор структур -(он может быть более или менее удачным, то есть более или менее удачно решить выбор пути неполного перебора структур (если перебор полный то это самый простой алгоритм генерации)

2. Механизм расчета параметров (МНК, ЗЛП, град. Процедуры)

3. Критерии выбора структуры (внешние критерии)

Будем сейчас вести речь о самом интересном – критериях отбора структур.

1 Пусть известна дисперсия шума

Наиболее подходящий критерий для выбора структуры оптимальной сложности при условии известности дисперсии шума есть

Критерий Маллоуза

Критерий Маллоуза оказываеся дает при этом несмещенную оценку ошибки прогнозирования

, где RSS – квадрат нормы невязки у, - дисперсия шума, - сложность модели (для лин модели -количество расч параметров).

Но надо знать дисп шума , тогда этот критерий позволяет отобрать структуру с наилучшей оценкой прогноза,

2. Пусть известно распределение шума

Когда известно распределение шума можно построить функцию распределения модели у с учетом этого распределения шума ,

Для нахождения параметров предполагаетсяч использование метода наибольшего правдоподобия. Как известно, для этого надо найти такие которые доставляют максимум ф-ции правдоподобия при каждом варианте структуры в известных точках . Тогда для поиска оптимальной структуры используется информационный критерий Акаике (AIC):

где - максимизированное значение функции правдоподобия модели.

В частном случае нормального шума он принимает вид критерия Маллоуза. При этом на практике он применяется в упрощенном виде

Этот вариант формулы называют критерием Акаике-Маллоуза

Данный критерий существенно ограничивает рост сложности модели наличием аддитивного члена 2s. Однако проблема применения состоит в том, что в практических задачах функция распределения шума да часто и его дисперсия неизвестны.

А что тогда делать? Используют тогда менее обонованные но практически неплохо работающие критерии

3. Байесовский информационный критерий (критерий Шварца):

4. Также популярен критерий финальнрй ошибки предсказания Акаикеприменяемійпри неизвестном характнрн шума и ккорректирующий остаточную сумму квадратов ошибки


Поделиться:



Последнее изменение этой страницы: 2017-04-12; Просмотров: 413; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.015 с.)
Главная | Случайная страница | Обратная связь