Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Необходимые условия оптимальности для непрерывных систем. Стохастический принцип минимума
Решение задач, связанных с оптимизацией непрерывных стохастических систем, как и в детерминированном случае, практически всегда требует дискретизации. Можно указать два ее способа. Первый состоит в переходе от исходной непрерывной задачи к дискретной сразу. При этом дифференциальные уравнения, описывающие поведение системы, заменяются на конечноразностные. Соответствующим образом преобразуется и критерий оптимальности. Для решения полученной задачи могут быть применены либо условия оптимальности для дискретных систем, либо соответствующие численные методы. Второй подход связан с использованием необходимых условий оптимальности, полученных непосредственно для исходной непрерывной задачи. Эти условия в явном виде редко позволяют получить решение задачи оптимизации. Они обычно лишь трансформируют исходную задачу в другую, например, связанную с краевой задачей для системы дифференциальных (в данном случае стохастических) уравнений, при решении которой в конечном счете и приходится проводить дискретизацию. Бывает заранее трудно отдать предпочтение какому-либо одному из этих подходов. Первый подход, очевидно, более прост в реализации при получении численного решения задачи, обладает определенной универсальностью, так как фактически исходную задачу сводит к задаче математического программирования, в решении которых в настоящее время накоплен богатый опыт. Однако применение второго подхода иногда позволяет более просто выявить структуру оптимального управления, а в некоторых случаях и найти более эффективный способ решения задачи в целом. Учитывая это, ниже рассматривается получение необходимых условий оптимальности в задаче программирования оптимального управления непрерывной стохастической системой. Пусть динамическая система на интервале времени описывается следующим стохастическим дифференциальным уравнением:
где , - векторы состояния и управления соответственно; задано; , - вектор-функция, непрерывно дифференцируемая по своим аргументам; - случайный процесс с известными статистическими характеристиками. Задача программирования оптимального управления заключается в отыскании такой временной зависимости , которая обеспечивает перевод системы (15.22) из заданного начального состояния в конечное с минимальным значением критерия
Рассмотрим упрощенный вывод необходимых условий оптимальности, основанный на дискретизации системы (15.22) с точностью до членов первого порядка малости, применении соответствующих условий оптимальности для полученной дискретной задачи и последующем обратном предельном переходе к непрерывному случаю. Более строгое доказательство требует анализа влияния членов более высокого порядка малости. Предположим, что непрерывный случайный процесс может быть представлен в виде дискретной последовательности случайных векторов , , которая при стремелении интервала дискретности к нулю стягивается к . Тогда для малых с точностью до членов первого порядка малости вместо уравнения (15.22) и критерия (15.23) можно записать их конечно-мерные аналоги:
Стохастический гамильтониан в данном случае имеет вид
Сопряженный вектор описывается уравнением
с граничным условием
Формально согласно (15.10) необходимые условия оптимальности имеют вид
Однако, как и в детерминированном случае, их можно привести к более конструктивной форме
Последнее соотношение справедливо для любого допустимого управления и для любого момента . Введя обозначения для гамильтониана
ему можно придать окончательно следующий вид:
Таким образом, для дискретной системы (15.24) при малых значениях интервала дискретности с точностью до малых первого порядка оказывается справедливым дискретный стохастический принцип минимума независимо от свойств гамильтониана и допустимого множества . Осуществим теперь предельный переход во всех соотношениях, определяющих необходимые условия оптимальности. Для этого устремим интервал дискретности к нулю. Уравнение (15.24) имеет вид исходного дифференциального уравнения (15.22), конечно-разностное уравнение (15.25) для сопряженного вектора перейдет в дифференциальное уравнение
с граничным условием
необходимые условия оптимальности (11.28) примут вид
где
Условия (15.20) - (15.32) представляют собой обобщение принципа минимума на случай непрерывных стохастических систем. Как и в дискретном случае, отличительной особенностью его является зависимость гамильтониана от случайных возмущений, что чрезвычайно усложняет решение задачи стохастического программирования по сравнению с детерминированным случаем. Для отыскания оптимального управления на основе условий (15.29) - (15.31) необходимо не только решить краевую задачу для систем (15.22) и (15.29), но и совместно с этим решением раскрыть операции минимизации и математического ожидания в (15.31).
Упражнение 1. Показать, что в задаче управления системой (15.22) с целью минимизации критерия
необходимые условия оптимальности (15.29) - (15.31) сохраняются и вместо соотношения (15.32) для гамильтониана следует использовать теперь следующее:
Упражнение 2. Получить необходимые условия оптимальности управления системой (15.22) с целью минимизации критерия (15.23) при дополнительном условии |
Последнее изменение этой страницы: 2019-10-24; Просмотров: 190; Нарушение авторского права страницы