Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Необходимые условия оптимальности. Дискретный случай



Рассмотрим задачу программирования оптимального управления дискретной системой

(11.1)

при ограничениях, накладываемых только на управление,

 

из условия обращения в минимум критерия

, (11.2)

считая, что вектор  и число  заданы, а вектор  свободен.

Обозначим через  искомую (оптимальную) управляющую последовательность ..

Наиболее простой подход к получению необходимых условий оптимальности, которым должна удовлетворять последовательность , очевидно, состоит в интерпретации данной задачи как специальной задачи математического программирования с последующим использованием известных результатов.

Итак, будем считать, что критерий (11.2) является некоторой функцией управления

.  

Здесь и в дальнейшем для удобства под  будем понимать последовательность , представленную в виде расширенного вектора

 

Зависимость  от  проявляется через уравнение (11.1).

Необходимые условия оптимальности в такой задаче заключаются в неотрицательности вариации критерия , где  — любое допустимое управление

(11.3)

В частности, полагая , а при  условие (11.3) может быть представлено в виде совокупности условий

, (11.4)

где под  понимается вариация критерия  за счет вариации управления только в момент времени .

Вообще говоря, условие (11.3) или совокупность условий (11.4) для моментов  представляет собой необходимые условия оптимальности в достаточно общем виде. Однако использование их непосредственно затруднительно, так как они не дают конструктивного алгоритма определения искомого управления.

Преобразуем эти условия к более удобному виду. С этой целью зададим допустимое управление  в виде

,  

где  — сколь угодно малое неотрицательное число;  — допустимое направление изменения управления;  — допустимая вариация управления;  — допустимое множество, представляющее собой прямое произведение множеств .

Из условия (11.4) следует, что

.  

Переходя к пределу при , получаем

,  

где  — вектор частных производных критерия по всем компонентам вектора .

Полагая, что  для всех  и , получаем совокупность необходимых условий оптимальности для различных моментов времени

, (11.5)

справедливых при любых допустимых , т.е. удовлетворяющих условиям .

Преобразуем условия (11.5), раскрыв производные . Дифференцируя критерий (11.2) с учетом уравнений (11.1), можно записать

,  

или, вводя формально обозначения

, (11.6)

более компактно

. (11.7)

Если теперь ввести в рассмотрение понятие гамильтониана

, (11.8)

то выражение (11.7) может быть представлено в виде

, (11.9)

а необходимые условия оптимальности (11.5) в виде

. (11.10)

С учетом обозначения (11.8) соотношения (11.6), определяющие вектор , а также исходные уравнения (11.1), могут быть приведены к следующей канонической форме

                 задано;  
(11.11)

Вектор , удовлетворяющий системе (11.11), в дальнейшем будем называть сопряженным вектором.

Таким образом, необходимые условия оптимальности в задаче управления системой (11.1) с целью достижения минимума критерия (11.2) заключаются в выполнении системы неравенств (11.10) с учетом уравнений (11.11).

В общем случае непосредственное использование этих условий для решения задачи программирования оптимального управления затруднительно. Однако можно заметить, что соотношение (11.9) справедливо для любого фиксированного (не обязательно оптимального) управления. Поэтому оно может быть успешно использовано при получении оптимального решения с помощью численных методов математического программирования [8], так как позволяет при фиксированном управлении с помощью двух просчетов по уравнениям (11.11) определить сразу все компоненты вектора градиента . Само же условие (11.10) в этом случае целесообразно использовать лишь для проверки решения, подозреваемого на оптимальное.

В некоторых частных случаях необходимые условия оптимальности могут быть приведены к более конструктивной форме. Рассмотрим два таких широко распространенных случая.

1. Оптимальное управление  является внутренней точкой области . Это возможно, например, когда на  никаких ограничений не накладывается. В этом случае любые векторы  являются допустимыми, в том числе и векторы, имеющие противоположные знаки. Поэтому для выполнения условия (11.10) необходимо выполнение строгого равенства

. (11.12)

2. Множество  выпукло и гамильтониан  — выпуклая по  функция. В этом случае каждое условие (11.10) является фактически необходимым и достаточным условием достижения гамильтонианом своего минимума по :

. (11.13)

Необходимые условия оптимальности в форме (11.13) будем называть дискретным принципом минимума.

Заметим, что если вектор  в (11.6) определить следующим образом

, (11.14)

то в силу изменения знака в соотношениях (11.9), (11.4), (11.10) вместо (11.13) получим более распространенный в литературе принцип максимума [11]:

(11.15)

Упражнение 1. Показать, что производная  функции  по любому направлению  в точке , определяемая соотношением

 

вычисляется по формуле

.  

Упражнение 2. Показать, что производная вектор-функции  векторных аргументов  и  по вектору  может быть в матричном виде представлена следующим образом:

,  

где через  обозначены матрицы соответствующих размерностей, сформированные по правилу

.  

Упражнение 3. Показать, что производная скалярной функции , где  — векторы, по вектору  вычисляется по формуле

.  

Упражнение 4. Показать, что в задаче управления системой (11.1) с целью минимизации критерия (11.2) при дополнительном векторном ограничении на конечное состояние вида

(11.16)

полученные необходимые условия оптимальности, в общем случае — это соотношения (11.10)-(11.11), сохраняются с точностью до определения вектора , который теперь в отличие от (11.11) запишется как

. (11.17)

Здесь  — вектор множителей Лагранжа, подлежащий определению из условия

 В ф-лы.16 – 17 вернул привычное g вместо q  

Упражнение 5. Показать, что в задаче управления системой (11.1) с целью минимизации критерия

(11.18)

полученные необходимые условия оптимальности, например (11.10) и (11.11), сохраняются с точностью до определения самого гамильтониана, который теперь будет

(11.19)

Упражнение 6. Составить алгоритм численного решения задачи программирования оптимального управления системой (11.1) с использованием одного из градиентных методов поиска, например метода наискорейшего спуска [11].

 


Поделиться:



Последнее изменение этой страницы: 2019-10-24; Просмотров: 213; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.023 с.)
Главная | Случайная страница | Обратная связь