Оптимальное управление линейной дискретной системой при наличии аддитивных возмущений

Рассмотрим задачу синтеза оптимального управления линейной дискретной стохастической системой, описываемой уравнением

(19.10)

В отличие от случая управления по полным данным теперь будем считать, что измерению доступен не сам вектор состояния , а некоторый вектор , связанный с соотношением

(19.11)

где через обозначена случайная ошибка i –го измерения. В качестве критерия оптимальности по-прежнему примем критерий

(19.12)

где - заданные матрицы.

Будем считать, что и - независимые гауссовские случайные векторы с характеристиками

, , ,	(19.13)
, , .	(19.14)

Прежде всего необходимо определить достаточные координаты в данной задаче. С этой целью воспользуемся, так называемым, дискретным фильтром Калмана, позволяющим определить байесовскую (апостериорную) оценку текущего вектора состояния по всем предшествующим и текущим измерениям (19.11), т.е. по измерениям .

Введем следующие обозначения: , - соответственно апостериорное математическое ожидание и апостериорная корреляционная матрица вектора по измерениям , , - математическое ожидание и корреляционная матрица вектора по измерениям . Другими словами, - прогнозируемое на один шаг вперед значение , а - его корреляционная матрица. В силу (19.10) и (19.13) справедливы соотношения

,	(19.15)
.	(19.16)

С учетом принятых обозначений фильтр Калмана можно представить в виде […]

	(19.17)
.	(19.18)

Это значит, что вектор и матрица , определяемые в соответствии с (19.17) и (19.18), являются соответственно апостериорным математическим ожиданием и апостериорной корреляционной матрицей вектора при заданных измерениях. Вектор дает оптимальную в, смысле максимума апостериорной плотности вероятностей оценку вектора по всем прошлым и настоящим измерениям, матрица характеризует ковариации ошибок этой оценки.

Из соотношений (19.17) и (19.16) следует, что корреляционная матрица не зависит от конкретных измерений и управлений. Она полностью определяется свойствами системы и канала наблюдения (через матрицы , ), а также статистическими характеристиками ( , ) возмущений , и может быть определена заранее. Имея это в виду, можно считать, что условная плотность вероятностей типа в любой момент времени полностью определяется вектором и может быть представлена в виде . С другой стороны, знание согласно (19.17) и (19.15) достаточно и для определения собственной будущей эволюция. Иными словами, вектор является вектором достаточных координат в данной задаче.

Теперь можно перейти к определению алгоритма оптимального управления. С этой целью преобразуем соотношение (19.17) для вектора , представив соотношение (19.18) в следующем виде

(19.19)

Подставим его в (19.17), учитывая при этом (19.15), получим

(19.20)

гёде

(19.21)

С учетом (19.10), (19.11) и Ошибка! Источник ссылки не найден. последнее соотношение может быть приведено к виду

(19.22)

Оно позволяет установить статистические свойства вектора . В частности, согласно (19.13), (19.14), (19.16) можно записать, что

	(19.23)
.	(19.24)

Итак, эволюция достаточных координат описывается уравнением

(19.25)

причем

(19.26)

Воспользуемся достаточным условием оптимальности в виде рекуррентного соотношения (19.9) с учетом (19.7). Применительно к данной задаче получаем

(19.27)

Соотношение (19.27) с точностью до обозначений совпадает с соотношениями (18.12), (18.13). Поэтому согласно (18.14) - (18.20) можно записать следующие соотношения для функции будущих потерь

,	(19.28)
где	(19.29)
	(19.30)
.	(19.31)

Закон оптимального управления по-прежнему имеет линейную структуру

(19.32)

Начальные условия для рекуррентных соотношений (19.29) и (19.30) получим, рассмотрев последний шаг управления. Поскольку согласно (19.7)

(19.33)

то, принимая во внимание, что

, ( не измеряется)	(19.34)
		(19.35)

из (19.27) находим

	(19.36)
где	(19.37)
	(19.38)
;	(19.39)
.	(19.40)

Сравнивая (19.29) - (19.33) с (19.36) - (19.40), заключаем, что последние могут быть представлены более компактно в виде

(19.41)

Ранее было показано, что при наличии аддитивных возмущений алгоритм оптимального в смысле квадратичного критерия управления линейной системой по полным данным совпадает с алгоритмом оптимального управления соответствующей детерминированной системой. Полученное теперь решение формально также совпадает с детерминированным. Разница заключается лишь в том, что в алгоритме (19.32) вместо вектора фазовых координат х _i выступает вектор достаточных координат z_i (вектор оптимальной оценки), определяемый, в свою очередь, с помощью фильтра Калмана (19.17), (19.18).

Таким образом, в линейных системах с квадратичным критерием оптимальности при аддитивных гауссовских возмущениях оптимальный стохастический регулятор представляет собой последовательное соединение фильтра Калмана для получения вектора достаточных координат (оптимальной оценки) и устройства оптимального детерминированного управления. Сформулированный результат, известный в литературе также под названием теоремы разделения, находит широкое применение при получении приближенного решения задачи синтеза оптимального управления нелинейных систем. При этом задача синтеза оптимального управления по неполным данным разбивается на две решаемые независимо (по аналогии с линейным случаем): задачу определения оптимальных оценок вектора фазовых координат и задачу определения оптимального управления по полным данным. Основанием для этого служит тот факт, что при формировании блока оптимальной оценки добиваются хорошей сходимости оценки к истинному вектору фазовых координат.

Упражнение 1. Получить соотношения для фильтра Калмана (19.17), (19.18).

Упражнение 2. Показать, что, используя известное матричное тождество

соотношение (19.18) фильтра Калмана можно представить в виде

Упражнение 3.Решить поставленную выше задачу, принимая в качестве критерия оптимальности величину

(19.42)

⇐ Предыдущая 3 4 5 6 7 8 9 101112 Следующая ⇒

Последнее изменение этой страницы: 2019-10-24; Просмотров: 157; Нарушение авторского права страницы