Достаточные условия оптимальности при дискретном управлении

Рассмотрим задачу синтеза оптимального управления дискретной системой

(17.1)

где - вектор состояния системы; - вектор управления в i-й момент времени; - допустимое множество; - вектор-функция, устанавливающая связь между векторами и вектором ; N - количество шагов управления.

В качестве критерия оптимальности примем функцию конечного состояния

(17.2)

Требуется найти такую последовательность законов управления которая обеспечивает перевод системы (17.1) из начального состояния в конечное с минимальным значением критерия (17.2). Предполагается, что вектор текущего состояния системы доступен измерению и все измерения производятся точно.

Введем в рассмотрение функцию

(17.3)

По определению есть минимальное значение критерия (17.2), которое может быть достигнуто при оптимальном управлении системой (17.1), если считать, что ее движение начинается с момента i из состояния . Поскольку характеризует прогнозируемое значение критерия, будем называть ее функцией будущих потерь.

Применяя к выражению (17.3) метод поэтапной оптимизации, можно записать

(17.4)

или

(17.5)

Согласно определению (17.3) для момента i = N функция будущих потерь находится так

(17.6)

Таким образом, функция будущих потерь удовлетворяет рекуррентному соотношению (17.5) с граничным условием (17.6). Условие (17.6) может быть формально представлено также в виде

(17.7)

Нетрудно заметить, что последовательность управляющих воздействий , найденная в соответствии с рекуррентным соотношением (1.5), обеспечивает минимальное значение критерию (17.2). Это следует из определения самой функции будущих потерь. Действительно, согласно (17.3) для момента i=1 имеем

Следовательно, рекуррентное соотношение (17.5) с граничным условием (17.7) может рассматриваться в качестве достаточных условий оптимальности управляющей последовательности . Фактически рекуррентное соотношение (17.5) реализует метод динамического программирования, разработанный Р. Беллманом на основе использования выдвинутого им принципа оптимальности. В соответствии с этим принципом оптимальное управление в текущий момент времени не зависит от предыстории системы, а полностью определяется текущим состоянием и целью управления.

Применение достаточных условий оптимальности к решению поставленной задачи сводится к последовательному N-шаговому процессу использования соотношения (17.5), начиная с конечного момента времени i = N и кончая моментом i = 1. В результате определяются зависимости оптимального управления от текущего состояния системы т.е. решается задача синтеза оптимального управления. При этом на каждом шаге минимизация осуществляется лишь по текущему вектору управления . Таким образом, метод динамического программирования, реализующий достаточные условия оптимальности, представляет собой, по сути дела, метод численного решения задачи синтеза оптимального управления путем последовательной (поэтапной) минимизации функции многих переменных.

Основным препятствием для применения метода является так называемое " проклятие размерности", заключающееся в необходимости запоминания на каждом шаге оптимизации функции будущих потерь, т.е. функции многих переменных. Запоминание таких функций требует огромного объема памяти ЦВМ. Практически приходится прибегать к каким-либо аппроксимациям функции будущих потерь. В этом случае, ограничения, накладываемые на вектор управления и вектор фазовых координат, могут существенно облегчить решение задачи.

Упражнение 1. Убедиться в справедливости метода поэтапной оптимизации:

а) показать, что для любых имеет место равенство

(17.8)

б) получить аналог соотношения (17.8) для случая, когда на х и у накладывается смешанное ограничение вида ;

в) получить соотношение (17.4).

Упражнение 2. Показать, что для задачи управления системой

(17.9)

с минимизацией критерия

(17.10)

достаточные условия оптимальности могут быть представлены в виде рекуррентного соотношения

(17.11)

при граничном условии

(17.12)

Выяснить физический смысл функции в данном случае.

Упражнение 3. Убедиться, что ограничения, накладываемые на фазовый вектор вида , не изменяют структуры достаточных условий оптимальности.

⇐ Предыдущая 3 4 5 6 7 8 9 101112 Следующая ⇒

Последнее изменение этой страницы: 2019-10-24; Просмотров: 168; Нарушение авторского права страницы