Особенность рекурсивных вычислений оценки

⇐ ПредыдущаяСтр 2 из 4Следующая ⇒

Рекурсивные процедуры вычислений известны давно, со времен И.Ньютона, однако окончательно удалось их формализовать и оптимизировать уже в эру кибернетики. Наибольший вклад в изучение рекурсивных методов оценки внесли Р. Калман и Э. Бьюси. Кроме того, с рекурсивными процедурами стохастической аппроксимации связывают имена Качмажа, Роббинса, Монро и др.

Суть рекурсивных процедур в том, что по полученному на -м шаге значению вычисляется последующее значение на -м шаге. Далее значение на -м шаге вычисляется по полученным на -м шаге. То есть последующие значения вычисляются по предыдущим, но с учетом новых, очередных результатов наблюдения. Рекурсивная оценка – это процедура вычисления условного среднего , где - наблюдение.

Первой особенностью рекурсивных процедур является то, что они обладают ограниченной памятью, «забывают» дальнее и даже недалекое прошлое. Представим общий вид дискретной рекурсивной процедуры:

, (8.2)

где - масштабирующий весовой коэффициент, обычно ; - добавка к оценке на предыдущем шаге , невязка, учитывающая изменение текущего значения наблюдения .

Из уравнения (8.2) следует, что добавка к значению оценки на шаге как бы корректирует предыдущее значение оценки по результату наблюдения на данном шаге дискретизации. Коэффициентом устанавливается уровень влияния добавки , а, соответственно, и скорости сходимости оценки к установившемуся состоянию. Следует иметь в виду, что при больших значениях , близких к единице, отмечаются большие ошибки в установившемся состоянии, при маленьких , =1, 2, …, 10 скорость сходимости уменьшается, «удлиняется» память, при этом точность оценки возрастает.

Вторая особенность и отличие от выборочной оценки среднего , где в результате вычисления получают конкретное число – математическое ожидание, - значение рекурсивной оценки (8.2) может изменяться и корректироваться в процессе наблюдения, и если процесс приобретает ту или иную тенденцию (тренд) нестационарности, то получаемые значения рекурсивной оценки отобразят данную тенденцию (оценка будет корректироваться в соответствии с новыми наблюдениями).

Третья особенность в том, что процедура вычисления оценки продолжается до тех пор, пока поступают в реальном времени результаты наблюдений . Эту оценку можно остановить в любой момент времени или использовать на любом шаге дискретизации.

Рекурсивным свойством обладают марковские процессы:

, (8.3)

где - называется вероятностью перехода из состояния в состояние .

Это важное свойство марковских процессов дает возможность:

- формализовать математическую модель процесса в виде уравнения состояния для непрерывного процесса

, (8.4)

или для дискретного

, (8.5)

- находить рекурсивную оценку, используя в виде вероятности перехода прогнозную функцию

, (8.6)

где - коэффициент состояния в выражении (8.6), а - величина шага дискретизации, интервала, на который дается прогноз.

8.3. Формализованная процедура оценки случайного процесса (фильтр Калмана-Бьюси ─ ФКБ)

Данная процедура может иметь как аналоговый, так и дискретный вид в зависимости от того, каким образом представлен процесс . Как в том, так и в ином случае для оценки используют три (триаду) уравнения, достаточных для синтеза алгоритма оценки этого процесса. Три уравнения: наблюдения, состояния и оценки в классическом ФКБ представлены линейными уравнениями и имеют замкнутый, завершенный вид. Однако во многих случаях уравнения наблюдения или состояния этого процесса могут оказаться нелинейными, включать в себя тригонометрические функции, квадраты состояний или иные нелинейные выражения. Задача оценки при наличии нелинейности усложняется, решения находятся через процедуры упрощения, линеаризации или другие приемы, приводящие к тем или иным приближениям. Теория, посвященная синтезу таких нелинейных алгоритмов, носит название теории марковской нелинейной фильтрации.

В данной дисциплине рассматриваются только линейные процедуры, к которым, в основном, и удается свести практические задачи, возникающие в ТКС.

Аналоговые алгоритмы ФКБ

Триада уравнений для алгоритма оценки случайного процесса :

1. Уравнение наблюдения:

. (8.7)

2. Уравнение состояния:

. (8.8)

3. Уравнение оценки, удовлетворяющей критерию МСКО:

, (8.9)

где - (8.10)

дифференциальное уравнение Риккати для апостериорной дисперсии ошибки оценки.

- спектральные плотности мощности соответственно шума генерации в модели состояния и шума наблюдения в уравнении наблюдения. Если первый шум - носит виртуальный характер, он определяет уровень процесса , то - отображает реальный шум в канале наблюдения.

Все уравнения (8.7) - (8.10) представлены в виде многомерных функций с коэффициентами матричного вида, содержащих транспонирование, обозначаемое (Т) и обратные матрицы со степенями (-1).

Из сопоставления уравнений состояния (8.8) и оценки (8.9) видно, что левые части и первые слагаемые правых частей уравнений совпадают. Второе слагаемое правой части в квадратных скобках носит название невязки: . Очевидно, если оценка и оцениваемый случайный процесс совпадают , то невязка близка к нулю (это бывает при малых значениях шума наблюдения ), при этом корректировать оценку - не надо. Если же имеет место отклонение от оцениваемого значения того или иного знака , то, соответственно, невязка возрастает, и является корректирующим сигналом для получения новой оценки.

Из уравнения оценки (8.9) видно, что невязка умножается на величину, обратную спектральной плотности мощности шума наблюдения . Очевидно, при больших уровнях этого шума величина (его спектральная плотность мощности) будет пропорциональна не только отклонению оценки от истинного значения, но и значению шума наблюдения. Поэтому умножение на обратную величину (при большом уровне шума наблюдения) как бы снижает доверие к невязке, и таким образом доля вклада второго слагаемого в (8.9) уменьшается. При этом можно утверждать, что при качественных измерениях, когда шум , основной вклад в формирование оценки дает 2-е слагаемое, при некачественных – первое.

Важную роль также играет умножение невязки на функцию , определяющую изменение апостериорной дисперсии ошибки оценки. Анализ показывает, что сразу после включения ФКБ значения вначале относительно велики, затем постепенно уменьшаются до определенного уровня . Значение можно вычислить из уравнения (8.10), приравняв к нулю , то есть определить апостериорную дисперсию в установившемся состоянии фильтра, или, что тоже самое: определить точность оценки в этом установившемся состоянии.

При из (8.10) получаем обыкновенное квадратное уравнение, одно из решений которого позволяет определить искомую дисперсию. Так, полагая, что , - мощность шума, - спектральная плотность мощности чисто случайного полезного оцениваемого сигнала, из (6.9) получаем:

, (8.11)

где - отношение мощности полезного сигнала к мощности шума в полосе приема этого сигнала . График функции (8.11) представлен на рис.8.1. Отношение апостериорной дисперсии к априорной всегда < 1, если процедура ФКБ – устойчива.

Рис.8.1. График изменения абсолютного и относительного значения апостериорной дисперсии от -уровня сигнал/шум

Из рис.8.1. следует, что значение относительной апостериорной дисперсии монотонно уменьшается (соответственно относительная точность оценки возрастает) по мере увеличения отношения сигнал/шум. В тоже время из (8.11) также следует, что абсолютное значение апостериорной дисперсии растет пропорционально оцениваемому сигналу (см. рис.8.1). Поэтому утверждение о том, что при увеличении уровня оцениваемого сигнала точность его оценки возрастает, не верна. Верно то, что увеличивается относительная точность, но не абсолютная.

Функция в ФКБ, показывающая точность оценки, играет также другую важную роль, обеспечивая устойчивость процедуры оценки. Кроме того, из уравнения (8.11) следует, что не зависит от текущих значений оцениваемого сигнала . Таким образом, точность оценки теоретически можно вычислить априори. Однако на практике точность оценки зависит также и от того, насколько точно заданы параметры в уравнениях состояния, наблюдения и насколько удачно выбран шаг квантования в дискретных процедурах. Об этом информация – ниже.

Структурная схема модели наблюдения и ФКБ представлена на рис.8.2.

Рис.8.2. Структурная схема ФКБ. Точка над означает производную

Невязка формируется на выходе . На выходе имеем производную оценки . После интегратора получаем искомую оценку .

Аналоговые ФКБ легко реализуются на сосредоточенных элементах аналоговой электронной техники и по-сути представляют собой фильтр нижних частот или полосовой фильтр. Однако из-за разброса параметров они не нашли применения на практике.

⇐ Предыдущая 123 4 Следующая ⇒