Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Особенность рекурсивных вычислений оценки



Рекурсивные процедуры вычислений известны давно, со времен И.Ньютона, однако окончательно удалось их формализовать и оптимизировать уже в эру кибернетики. Наибольший вклад в изучение рекурсивных методов оценки внесли Р. Калман и Э. Бьюси. Кроме того, с рекурсивными процедурами стохастической аппроксимации связывают имена Качмажа, Роббинса, Монро и др.

Суть рекурсивных процедур в том, что по полученному на -м шаге значению вычисляется последующее значение на -м шаге. Далее значение на -м шаге вычисляется по полученным на -м шаге. То есть последующие значения вычисляются по предыдущим, но с учетом новых, очередных результатов наблюдения. Рекурсивная оценка – это процедура вычисления условного среднего , где - наблюдение.

Первой особенностью рекурсивных процедур является то, что они обладают ограниченной памятью, «забывают» дальнее и даже недалекое прошлое. Представим общий вид дискретной рекурсивной процедуры:

 

, (8.2)

 

где - масштабирующий весовой коэффициент, обычно ; - добавка к оценке на предыдущем шаге , невязка, учитывающая изменение текущего значения наблюдения .

Из уравнения (8.2) следует, что добавка к значению оценки на шаге как бы корректирует предыдущее значение оценки по результату наблюдения на данном шаге дискретизации. Коэффициентом устанавливается уровень влияния добавки , а, соответственно, и скорости сходимости оценки к установившемуся состоянию. Следует иметь в виду, что при больших значениях , близких к единице, отмечаются большие ошибки в установившемся состоянии, при маленьких , =1, 2, …, 10 скорость сходимости уменьшается, «удлиняется» память, при этом точность оценки возрастает.

Вторая особенность и отличие от выборочной оценки среднего , где в результате вычисления получают конкретное число – математическое ожидание, - значение рекурсивной оценки (8.2) может изменяться и корректироваться в процессе наблюдения, и если процесс приобретает ту или иную тенденцию (тренд) нестационарности, то получаемые значения рекурсивной оценки отобразят данную тенденцию (оценка будет корректироваться в соответствии с новыми наблюдениями).

Третья особенность в том, что процедура вычисления оценки продолжается до тех пор, пока поступают в реальном времени результаты наблюдений . Эту оценку можно остановить в любой момент времени или использовать на любом шаге дискретизации.

Рекурсивным свойством обладают марковские процессы:

 

, (8.3)

 

где - называется вероятностью перехода из состояния в состояние .

Это важное свойство марковских процессов дает возможность:

- формализовать математическую модель процесса в виде уравнения состояния для непрерывного процесса

 

, (8.4)

 

или для дискретного

 

, (8.5)

 

- находить рекурсивную оценку, используя в виде вероятности перехода прогнозную функцию

 

, (8.6)

 

где - коэффициент состояния в выражении (8.6), а - величина шага дискретизации, интервала, на который дается прогноз.

 

8.3. Формализованная процедура оценки случайного процесса (фильтр Калмана-Бьюси ─ ФКБ)

 

Данная процедура может иметь как аналоговый, так и дискретный вид в зависимости от того, каким образом представлен процесс . Как в том, так и в ином случае для оценки используют три (триаду) уравнения, достаточных для синтеза алгоритма оценки этого процесса. Три уравнения: наблюдения, состояния и оценки в классическом ФКБ представлены линейными уравнениями и имеют замкнутый, завершенный вид. Однако во многих случаях уравнения наблюдения или состояния этого процесса могут оказаться нелинейными, включать в себя тригонометрические функции, квадраты состояний или иные нелинейные выражения. Задача оценки при наличии нелинейности усложняется, решения находятся через процедуры упрощения, линеаризации или другие приемы, приводящие к тем или иным приближениям. Теория, посвященная синтезу таких нелинейных алгоритмов, носит название теории марковской нелинейной фильтрации.

В данной дисциплине рассматриваются только линейные процедуры, к которым, в основном, и удается свести практические задачи, возникающие в ТКС.

Аналоговые алгоритмы ФКБ

Триада уравнений для алгоритма оценки случайного процесса :

1. Уравнение наблюдения:

. (8.7)

2. Уравнение состояния:

. (8.8)

3. Уравнение оценки, удовлетворяющей критерию МСКО:

, (8.9)

 

где - (8.10)

 

дифференциальное уравнение Риккати для апостериорной дисперсии ошибки оценки.

- спектральные плотности мощности соответственно шума генерации в модели состояния и шума наблюдения в уравнении наблюдения. Если первый шум - носит виртуальный характер, он определяет уровень процесса , то - отображает реальный шум в канале наблюдения.

Все уравнения (8.7) - (8.10) представлены в виде многомерных функций с коэффициентами матричного вида, содержащих транспонирование, обозначаемое (Т) и обратные матрицы со степенями (-1).

Из сопоставления уравнений состояния (8.8) и оценки (8.9) видно, что левые части и первые слагаемые правых частей уравнений совпадают. Второе слагаемое правой части в квадратных скобках носит название невязки: . Очевидно, если оценка и оцениваемый случайный процесс совпадают , то невязка близка к нулю (это бывает при малых значениях шума наблюдения ), при этом корректировать оценку - не надо. Если же имеет место отклонение от оцениваемого значения того или иного знака , то, соответственно, невязка возрастает, и является корректирующим сигналом для получения новой оценки.

Из уравнения оценки (8.9) видно, что невязка умножается на величину, обратную спектральной плотности мощности шума наблюдения . Очевидно, при больших уровнях этого шума величина (его спектральная плотность мощности) будет пропорциональна не только отклонению оценки от истинного значения, но и значению шума наблюдения. Поэтому умножение на обратную величину (при большом уровне шума наблюдения) как бы снижает доверие к невязке, и таким образом доля вклада второго слагаемого в (8.9) уменьшается. При этом можно утверждать, что при качественных измерениях, когда шум , основной вклад в формирование оценки дает 2-е слагаемое, при некачественных – первое.

Важную роль также играет умножение невязки на функцию , определяющую изменение апостериорной дисперсии ошибки оценки. Анализ показывает, что сразу после включения ФКБ значения вначале относительно велики, затем постепенно уменьшаются до определенного уровня . Значение можно вычислить из уравнения (8.10), приравняв к нулю , то есть определить апостериорную дисперсию в установившемся состоянии фильтра, или, что тоже самое: определить точность оценки в этом установившемся состоянии.

При из (8.10) получаем обыкновенное квадратное уравнение, одно из решений которого позволяет определить искомую дисперсию. Так, полагая, что , - мощность шума, - спектральная плотность мощности чисто случайного полезного оцениваемого сигнала, из (6.9) получаем:

 

, (8.11)

 

где - отношение мощности полезного сигнала к мощности шума в полосе приема этого сигнала . График функции (8.11) представлен на рис.8.1. Отношение апостериорной дисперсии к априорной всегда < 1, если процедура ФКБ – устойчива.

 

Рис.8.1. График изменения абсолютного и относительного значения апостериорной дисперсии от -уровня сигнал/шум

 

Из рис.8.1. следует, что значение относительной апостериорной дисперсии монотонно уменьшается (соответственно относительная точность оценки возрастает) по мере увеличения отношения сигнал/шум. В тоже время из (8.11) также следует, что абсолютное значение апостериорной дисперсии растет пропорционально оцениваемому сигналу (см. рис.8.1). Поэтому утверждение о том, что при увеличении уровня оцениваемого сигнала точность его оценки возрастает, не верна. Верно то, что увеличивается относительная точность, но не абсолютная.

Функция в ФКБ, показывающая точность оценки, играет также другую важную роль, обеспечивая устойчивость процедуры оценки. Кроме того, из уравнения (8.11) следует, что не зависит от текущих значений оцениваемого сигнала . Таким образом, точность оценки теоретически можно вычислить априори. Однако на практике точность оценки зависит также и от того, насколько точно заданы параметры в уравнениях состояния, наблюдения и насколько удачно выбран шаг квантования в дискретных процедурах. Об этом информация – ниже.

Структурная схема модели наблюдения и ФКБ представлена на рис.8.2.

 

 

Рис.8.2. Структурная схема ФКБ. Точка над означает производную

 

Невязка формируется на выходе . На выходе имеем производную оценки . После интегратора получаем искомую оценку .

Аналоговые ФКБ легко реализуются на сосредоточенных элементах аналоговой электронной техники и по-сути представляют собой фильтр нижних частот или полосовой фильтр. Однако из-за разброса параметров они не нашли применения на практике.

 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-04-11; Просмотров: 594; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.024 с.)
Главная | Случайная страница | Обратная связь