Особенность рекурсивных вычислений оценки
Рекурсивные процедуры вычислений известны давно, со времен И.Ньютона, однако окончательно удалось их формализовать и оптимизировать уже в эру кибернетики. Наибольший вклад в изучение рекурсивных методов оценки внесли Р. Калман и Э. Бьюси. Кроме того, с рекурсивными процедурами стохастической аппроксимации связывают имена Качмажа, Роббинса, Монро и др.
Суть рекурсивных процедур в том, что по полученному на
-м шаге значению
вычисляется последующее значение на
-м шаге. Далее значение на
-м шаге вычисляется по полученным на
-м шаге. То есть последующие значения вычисляются по предыдущим, но с учетом новых, очередных результатов наблюдения. Рекурсивная оценка – это процедура вычисления условного среднего
, где
- наблюдение.
Первой особенностью рекурсивных процедур является то, что они обладают ограниченной памятью, «забывают» дальнее и даже недалекое прошлое. Представим общий вид дискретной рекурсивной процедуры:
, (8.2)
где
- масштабирующий весовой коэффициент, обычно
;
- добавка к оценке на предыдущем шаге
, невязка, учитывающая изменение текущего значения наблюдения
.
Из уравнения (8.2) следует, что добавка
к значению оценки на
шаге как бы корректирует предыдущее значение оценки по результату наблюдения на данном шаге дискретизации. Коэффициентом
устанавливается уровень влияния добавки
, а, соответственно, и скорости сходимости оценки
к установившемуся состоянию. Следует иметь в виду, что при больших значениях
, близких к единице, отмечаются большие ошибки в установившемся состоянии, при маленьких
,
=1, 2, …, 10 скорость сходимости уменьшается, «удлиняется» память, при этом точность оценки возрастает.
Вторая особенность и отличие от выборочной оценки среднего
, где в результате вычисления получают конкретное число – математическое ожидание,
- значение рекурсивной оценки (8.2) может изменяться и корректироваться в процессе наблюдения, и если процесс
приобретает ту или иную тенденцию (тренд) нестационарности, то получаемые значения рекурсивной оценки отобразят данную тенденцию (оценка будет корректироваться в соответствии с новыми наблюдениями).
Третья особенность в том, что процедура вычисления оценки продолжается до тех пор, пока поступают в реальном времени результаты наблюдений
. Эту оценку можно остановить в любой момент времени или использовать на любом шаге дискретизации.
Рекурсивным свойством обладают марковские процессы:
, (8.3)
где
- называется вероятностью перехода из состояния
в состояние
.
Это важное свойство марковских процессов дает возможность:
- формализовать математическую модель процесса в виде уравнения состояния для непрерывного процесса
, (8.4)
или для дискретного
, (8.5)
- находить рекурсивную оценку, используя в виде вероятности перехода прогнозную функцию
, (8.6)
где
- коэффициент состояния в выражении (8.6), а
- величина шага дискретизации, интервала, на который дается прогноз.
8.3. Формализованная процедура оценки случайного процесса (фильтр Калмана-Бьюси ─ ФКБ)
Данная процедура может иметь как аналоговый, так и дискретный вид в зависимости от того, каким образом представлен процесс
. Как в том, так и в ином случае для оценки используют три (триаду) уравнения, достаточных для синтеза алгоритма оценки этого процесса. Три уравнения: наблюдения, состояния и оценки в классическом ФКБ представлены линейными уравнениями и имеют замкнутый, завершенный вид. Однако во многих случаях уравнения наблюдения или состояния этого процесса могут оказаться нелинейными, включать в себя тригонометрические функции, квадраты состояний или иные нелинейные выражения. Задача оценки при наличии нелинейности усложняется, решения находятся через процедуры упрощения, линеаризации или другие приемы, приводящие к тем или иным приближениям. Теория, посвященная синтезу таких нелинейных алгоритмов, носит название теории марковской нелинейной фильтрации.
В данной дисциплине рассматриваются только линейные процедуры, к которым, в основном, и удается свести практические задачи, возникающие в ТКС.
Аналоговые алгоритмы ФКБ
Триада уравнений для алгоритма оценки случайного процесса
:
1. Уравнение наблюдения:
. (8.7)
2. Уравнение состояния:
. (8.8)
3. Уравнение оценки, удовлетворяющей критерию МСКО:
, (8.9)
где
- (8.10)
дифференциальное уравнение Риккати для апостериорной дисперсии ошибки оценки.
- спектральные плотности мощности соответственно шума генерации в модели состояния и шума наблюдения в уравнении наблюдения. Если первый шум
- носит виртуальный характер, он определяет уровень процесса
, то
- отображает реальный шум в канале наблюдения.
Все уравнения (8.7) - (8.10) представлены в виде многомерных функций с коэффициентами матричного вида, содержащих транспонирование, обозначаемое (Т) и обратные матрицы со степенями (-1).
Из сопоставления уравнений состояния (8.8) и оценки (8.9) видно, что левые части и первые слагаемые правых частей уравнений совпадают. Второе слагаемое правой части в квадратных скобках носит название невязки:
. Очевидно, если оценка
и оцениваемый случайный процесс
совпадают
, то невязка
близка к нулю (это бывает при малых значениях шума наблюдения
), при этом корректировать оценку
- не надо. Если же имеет место отклонение от оцениваемого значения того или иного знака
, то, соответственно, невязка возрастает,
и является корректирующим сигналом для получения новой оценки.
Из уравнения оценки (8.9) видно, что невязка умножается на величину, обратную спектральной плотности мощности шума наблюдения
. Очевидно, при больших уровнях этого шума величина
(его спектральная плотность мощности) будет пропорциональна не только отклонению оценки от истинного значения, но и значению шума наблюдения. Поэтому умножение на обратную величину
(при большом уровне шума наблюдения) как бы снижает доверие к невязке, и таким образом доля вклада второго слагаемого в (8.9) уменьшается. При этом можно утверждать, что при качественных измерениях, когда шум
, основной вклад в формирование оценки дает 2-е слагаемое, при некачественных – первое.
Важную роль также играет умножение невязки на функцию
, определяющую изменение апостериорной дисперсии ошибки оценки. Анализ показывает, что сразу после включения ФКБ значения
вначале относительно велики, затем постепенно уменьшаются до определенного уровня
. Значение
можно вычислить из уравнения (8.10), приравняв к нулю
, то есть определить апостериорную дисперсию в установившемся состоянии фильтра, или, что тоже самое: определить точность оценки
в этом установившемся состоянии.
При
из (8.10) получаем обыкновенное квадратное уравнение, одно из решений которого позволяет определить искомую дисперсию. Так, полагая, что
,
- мощность шума,
- спектральная плотность мощности чисто случайного
полезного оцениваемого сигнала, из (6.9) получаем:
, (8.11)
где
- отношение мощности полезного сигнала к мощности шума в полосе приема этого сигнала
. График функции (8.11) представлен на рис.8.1. Отношение апостериорной дисперсии к априорной
всегда < 1, если процедура ФКБ – устойчива.
Рис.8.1. График изменения абсолютного
и относительного значения
апостериорной дисперсии от
-уровня сигнал/шум
Из рис.8.1. следует, что значение относительной апостериорной дисперсии монотонно уменьшается (соответственно относительная точность оценки возрастает) по мере увеличения отношения сигнал/шум. В тоже время из (8.11) также следует, что абсолютное значение апостериорной дисперсии
растет пропорционально оцениваемому сигналу (см. рис.8.1). Поэтому утверждение о том, что при увеличении уровня оцениваемого сигнала
точность его оценки возрастает, не верна. Верно то, что увеличивается относительная точность, но не абсолютная.
Функция
в ФКБ, показывающая точность оценки, играет также другую важную роль, обеспечивая устойчивость процедуры оценки. Кроме того, из уравнения (8.11) следует, что
не зависит от текущих значений оцениваемого сигнала
. Таким образом, точность оценки теоретически можно вычислить априори. Однако на практике точность оценки зависит также и от того, насколько точно заданы параметры в уравнениях состояния, наблюдения и насколько удачно выбран шаг квантования
в дискретных процедурах. Об этом информация – ниже.
Структурная схема модели наблюдения и ФКБ представлена на рис.8.2.

Рис.8.2. Структурная схема ФКБ. Точка над
означает производную
Невязка
формируется на выходе
. На выходе
имеем производную оценки
. После интегратора получаем искомую оценку
.
Аналоговые ФКБ легко реализуются на сосредоточенных элементах аналоговой электронной техники и по-сути представляют собой фильтр нижних частот или полосовой фильтр. Однако из-за разброса параметров они не нашли применения на практике.
Популярное: