Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Учет дополнительных терминальных ограничений. Непрерывный случай
Рассмотрим задачу синтеза оптимального управления системой
из условия обращения в минимум критерия при дополнительных терминальных ограничениях Как и в дискретном случае, для учета этих ограничений применим метод множителей Лагранжа, сводя исходную задачу к задаче минимизации обобщенного критерия
где — множители Лагранжа ( = 1, ), удовлетворяющие при оптимальном управлении системе уравнений
В соответствии с этим для выявления структуры оптимального управления следует воспользоваться уравнением Беллмана, соответствующим обобщенному критерию
с граничным условием, принимающим в данном случае вид Фактически уравнение (18.121) дает возможность определить закон оптимального управления при различных значениях множителей Лагранжа . Для отыскания окончательного решения следует решить систему уравнений (18.120) относительно . При этом сначала необходимо раскрыть зависимости характеристик при оптимальном управлении от множителей , j= 1, ..., l. Это можно сделать, вообще, различными способами. Один из них предполагает отыскание в общем случае плотности распределения вектора состояния в конечный момент времени с помощью уравнения Колмогорова и последующего раскрытия в соответствующей операции математического ожидания. Другой, более простой, способ заключается в получении уравнения и последующем решении его непосредственно для анализируемой характеристики . С этой целью обратимся к рекуррентному соотношению (18.29). Буквально повторяя рассуждения, используемые при выводе уравнения Беллмана, нетрудно установить, что при осуществлении предельного перехода при из (18.29) получим следующее уравнение в частных производных
относительно функции с очевидным граничным условием Параметры представляют собой вектор сноса и матрицы коэффициентов диффузии случайного процесса (18.118) при оптимальном законе управления . Функция представляет собой фактически величину , вычисленную при условии, что движение системы (18.118) начинается с момента t из состояния х и происходит при действии оптимального управления . Поэтому Так как закон управления , определяемый с помощью уравнения (18.121), параметрически зависит от набора , j = 1, ..., l, то как , так и будут также, зависеть от a. Таким образом, решение задачи синтеза при наличии дополнительных терминальных ограничений сводится к решению уравнения Беллмана (18.121) с целью выявления структуры оптимального управления, решению уравнений вида (18.122) с использованием уже найденного управления для установления зависимостей от a и последующему решению системы (18.120) относительно a. Задача в общем случае является достаточно сложной. Основная трудность состоит в необходимости совместного решения уравнений (18.121), (18.122). Она легко преодолевается для линейных систем при отсутствии ограничений на вектор управления, когда функции , являются квадратичными по своим аргументам. В этом случае задача формулируется следующим образом. Пусть динамическая система описывается линейным стохастическим уравнением где x — по-прежнему белый шум с нулевым математическим ожиданием и матрицей интенсивностей D. Требуется найти оптимальный закон управления системой из условия обращения в минимум критерия при дополнительных ограничениях Предполагается, что матрицы положительно определенные. В соответствии с этим уравнение Беллмана для данной задачи имеет вид с граничным условием Решение этого уравнения может быть записано в форме где определяются с помощью системы обыкновенных дифференциальных уравнений при граничных условиях Структура оптимального управления при этом получается линейной где матрица L определяется через матрицу L Как видно из приведенных соотношений, параметры, формирующие оптимальное уравнение, зависят от набора , j= 1,..., l.Поэтому для окончательного решения необходимо определить этот набор. Для этого обратимся к системе (18.120)
Установим зависимости . С этой целью раскроем сначала выражение для параметров . Получим Подставим в уравнение (18.122)
Нетрудно установить, что решение этого уравнения с граничным условием имеет также вид квадратичной формы где зависят лишь от времени. Действительно, подставляя в (18.124), получаем Это уравнение выполняется тождественно при любых x, если и удовлетворяют системе
с граничными условиями Представленные соотношения позволяют определить и тем самым установить искомую зависимость . Остается решить систему уравнений (18.123) относительно a. Таким образом, в задаче управления линейной системой с аддитивным белым шумом при наличии изопериметрических ограничений структура оптимального управления по-прежнему остается линейной. Однако коэффициенты обратной связи теперь уже зависят от статистических свойств возмущения. Эта зависимость проявляется через множители Лагранжа , которые являются корнями системы (18.123).
|
Последнее изменение этой страницы: 2019-10-24; Просмотров: 165; Нарушение авторского права страницы