Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯСтр 1 из 12Следующая ⇒
ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В первой части рассматривались задачи математического программирования, т.е. задачи оптимизации статических объектов, когда целевая функция зависила от целого ряда параметров, не изменяющихся по времени. Теперь перейдем к обсуждению более сложных задач оптимального управления динамическими объектами, т.е. объектами, состояние которых изменяется во времени. Типичным примером такого объекта является летательный аппарат. Для того чтобы летательный аппарат, как объект управления, эффективно выполнял свои функции, необходимо, по-крайней мере, решить две задачи. Первая задача заключается в определении траектории движения летательного аппарата. С математической точки зрения эта задача состоит в отыскании некоторой программы управления, представляющей собой зависимость величины управляющего воздействия от времени. Эту задачу будем называть Вторая задача заключается в формировании закона управления летательным аппаратом. Под законом управления в данном случае понимается зависимость управляющего воздействия от тех координат, которые доступны измерению в процессе движения в любой (текущий) момент времени. Решение этой задачи позволяет сформировать (синтезировать) структуру системы управления летательным аппаратом, работающей по принципу обратной связи. Эту задачу будем называть задачей синтеза управления. В дальнейшем речь пойдет о задачах программирования и синтеза оптимального управления. При решении как задачи программирования управления, так и задачи синтеза необходимо иметь в виду, что на любой летательный аппарат в процессе полета действуют различные возмущения (случайные и неопределенные), без учета которых зачастую просто нельзя обойтись. Характерным примером может служить задача управления конечным (терминальным) состоянием летательного аппарата, когда требуется осуществить выведение аппарата в требуемый район назначения с высокой точностью. При этом возможны случаи, когда решение той или иной задачи без учета возмущений, вообще, не может обеспечить требуемой точности управления. Поэтому при формировании как программы, так и закона управления летательными аппаратами, как правило, следует учитывать действие случайных и неопределенных факторов. Обсуждение начнем с детерминированной постановки задач оптимального управления для случаев непрерывного и дискретного управления.
Непрерывный случай Математическая постановка задачи оптимального управления любым динамическим объектом предполагает формирование математической модели с учетом всех требующих своего учета ограничений, выбор критерия оптимальности и, наконец, определение той информации, которая может быть использована при реализации искомого управления. В качестве математической модели летательного аппарата чаще всего рассматривают систему обыкновенных дифференциальных уравнений, которая в векторной форме имеет вид
Здесь — n -мерный вектор состояния, или фазовый вектор, определяющий состояние системы в текущий момент времени , — m-мерный вектор управления или просто управление; — непрерывно дифференцируемая вектор-функция, характеризующая вектор обобщенной силы, действующей на летательный аппарат; (∙ ) — символ дифференцирования по времени, Систему (10.1), не зависящую явно от времени , принято называть автономной. В общем случае ограничения, которые следует учитывать, и которые определяют область существования математической модели (10.1), будем задавать с помощью условий
где через обозначены допустимые области изменений векторов и соответственно; — время " существования" модели (10.1). Время может быть либо фиксированным, либо свободным. Условие принято называть фазовым ограничением, условие — ограничением на управление. Заметим, что могут зависеть явно от времени. Возможно также наличие и смешанных ограничений на фазовый вектор и управление. Частным случаем условий (10.2) является задание граничных условий . Будем полагать всюду, если специально не оговорено, что вектор задан. Что касается вектора , то в зависимости от условий задачи он может быть либо задан, либо быть свободным (частично или полностью), либо принадлежать допустимому множеству . Не нарушая общности, в качестве критерия оптимальности, подлежащего минимизации по управлению, можно рассматривать функцию конечного состояния
Задача оптимизации состоит в определении такого управления Задача оптимизации, в которой используется критерий вида (10.3), известна в литературе также под названием задачи Майера или задачи управления конечным состоянием. В зависимости от того, какую информацию предполагается использовать при реализации искомого управления, различают два основных типа задач управления. Задача программирования оптимального управления, когда считается, что никакая текущая информация (кроме начальных условий) об объекте не используется. В этом случае управление определяется как функция времени. Для его нахождения, как правило, используются либо необходимые условия оптимальности непосредственно, либо косвенно путем реализации различных численных методов поиска. Задача синтеза оптимального управления, когда считается, что в любой текущий момент времени состояние объекта известно (полностью или частично, непосредственно или косвенно). В этом случае управление должно быть найдено как функция тех координат, которые доступны измерению. Задача синтеза является существенно более сложной, чем задача программирования управления. Фундаментальной основой для ее решения могут служить достаточные условия оптимальности. Однако их непосредственное применения оказывается эффективным лишь в ограниченном классе задач, например, задач управления линейными объектами с квадратичным критерием оптимальности. В общем случае для решения задач синтеза необходим творческий подход, использующий различные приемы, к числу которых относятся, например, линеаризация моделей, декомпозиция исходной задачи на более простые, параметризация законов управления с последующим сведением задачи синтеза к задаче математического программирования и многие другие. Упражнение 1. Показать, что критерий оптимальности более общего вида (задача Больца) может быть сведен к функции конечного состояния по отношению к расширенному вектору , где компонента определяется с помощью дифференциального уравнения при граничном условии . Упражнение 2. Показать, что математическая модель неавтономной системы
т.е. системы, зависящей явно от времени, может быть сведена к автономной введением дополнительной переменной , удовлетворяющей уравнению при граничном условии . Упражнение 3. Показать, что задача максимизации критерия эквивалентна задаче минимизации критерия . Дискретный случай Рассмотрение дискретных систем в последнее время приобрело огромное значение в связи с широким применением цифровой вычислительной техники не только при решении задач, связанных с исследованием вопросов динамики и управления летательного аппарата, но и непосредственно в процессе управления такими объектами. В качестве математической модели дискретной системы в общем случае будем рассматривать векторное уравнение вида
где — векторы состояния и управления в момент времени соответственно; — вектор-функция, связывающая состояния системы в два соседних момента времени; — количество временных шагов управления. В частном случае уравнение (10.8) может быть интерпретировано как конечно-разностный аналог дифференциального уравнения (10.1), полученный дискретизацией последнего по времени. Область существования модели (10.8) по аналогии с (10.2) будем задавать системой условий:
где Ui, Xi — допустимые области изменений векторов xi, ui соответственно. Количество шагов может быть либо заданным, либо подлежащим определению. Как и в непрерывном случае, без нарушения общности в качестве критерия оптимальности можно рассматривать функцию конечного состояния
Задача программирования оптимального управления состоит в определении такой последовательности , которая осуществляет перевод системы (10.8) из заданного начального состояния в конечное с учетом (10.9) при минимальном значении критерия (10.10). В зависимости от условий задачи вектор конечного состояния может быть либо свободным (частично или полностью), либо принадлежать допустимому множеству: .
Упражнение. Показать, что критерий оптимальности вида может быть сведен к функции конечного состояния по отношению к расширенному вектору , где , определяется с помощью уравнения при граничном условии .
Управление линейной системой. Пример двусторонней операции Рассмотрим задачу управления системой, линейной относительно переменных состояния
где через обозначена матрица, зависящая от управлений , . В качестве критерия оптимальности примем линейную функцию конечного состояния
где вектор с считается заданным. Сторона, выбирающая управление , стремится минимизировать критерий (16.27), а сторона, выбирающая управление , преследует противоположную цель - максимизировать этот критерий. Составим гамильтониан для данной задачи:
Сопряженный вектор согласно (16.19) определится с помощью уравнения
при граничном условии . Нетрудно убедиться в том, что значение критерия (16.27), выраженное через вектор текущего состояния, а вместе с этим и через текущие управления, совпадает со значением гамильтониана для соответствующего момента времени. Действительно,
Если теперь выбор управлений производить из условия достижения критериальной функцией своего минимаксного значения, то согласно (16.30) минимаксного значения должен достигать и гамильтониан
Если при оптимальных управлениях критериальная функция имеет седловую точку, то и гамильтониан при этом должен иметь седловую точку. Другими словами, для линейного случая принцип минимакса справедлив независимо от свойств гамильтониана по управлениям и . Для иллюстрации применения принципа минимакса рассмотрим следующий пример. Пусть математическая модель операции описывается следующими уравнениями
где - - фазовые переменные; - заданные параметры; , -управляющие параметры одной стороны; , - управляющие параметры другой стороны в -й момент времени. На управления , накладываются ограничения , , , , , . Считается также, что все переменные состояния . В качестве критерия примем
Требуется найти такое управление для обеих сторон, чтобы в конце операции критерий принял минимаксное значение. Для решения задачи обратимся к анализу необходимого условия оптимальности (16.31). Гамильтониан в данной задаче
Сопряженные переменные определяются согласно уравнениям
при граничных условиях
Отсюда, в частности, следует, что ; для всех . Так как граничные условия для сопряженных переменных задаются на правом конце (при ), определять оптимальные управления будем в обратном времени, начиная с . Для простоты ограничимся рассмотрением лишь двух последних шагов. Итак, при согласно (16.34), (16.35) имеем
Из условия (16.31) находим оптимальные управления , . При этом очевидно, что , . Перейдем теперь к моменту . Согласно (16.35) получим , и гамильтониан (16.34) примет вид
Из условия (16.31) находим
Аналогично может быть осуществлен выбор оптимальных управлений и для других шагов.
Упражнение. Выявить структуру оптимального управления линейной системой вида
принимая в качестве критерия и считая, что управляющая последовательность стремится к его минимизации, а последовательность - к максимизации. Ограничения на управления и отсутствуют. Какими свойствами должны обладать матрицы , , для существования оптимального решения?
ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В первой части рассматривались задачи математического программирования, т.е. задачи оптимизации статических объектов, когда целевая функция зависила от целого ряда параметров, не изменяющихся по времени. Теперь перейдем к обсуждению более сложных задач оптимального управления динамическими объектами, т.е. объектами, состояние которых изменяется во времени. Типичным примером такого объекта является летательный аппарат. Для того чтобы летательный аппарат, как объект управления, эффективно выполнял свои функции, необходимо, по-крайней мере, решить две задачи. Первая задача заключается в определении траектории движения летательного аппарата. С математической точки зрения эта задача состоит в отыскании некоторой программы управления, представляющей собой зависимость величины управляющего воздействия от времени. Эту задачу будем называть Вторая задача заключается в формировании закона управления летательным аппаратом. Под законом управления в данном случае понимается зависимость управляющего воздействия от тех координат, которые доступны измерению в процессе движения в любой (текущий) момент времени. Решение этой задачи позволяет сформировать (синтезировать) структуру системы управления летательным аппаратом, работающей по принципу обратной связи. Эту задачу будем называть задачей синтеза управления. В дальнейшем речь пойдет о задачах программирования и синтеза оптимального управления. При решении как задачи программирования управления, так и задачи синтеза необходимо иметь в виду, что на любой летательный аппарат в процессе полета действуют различные возмущения (случайные и неопределенные), без учета которых зачастую просто нельзя обойтись. Характерным примером может служить задача управления конечным (терминальным) состоянием летательного аппарата, когда требуется осуществить выведение аппарата в требуемый район назначения с высокой точностью. При этом возможны случаи, когда решение той или иной задачи без учета возмущений, вообще, не может обеспечить требуемой точности управления. Поэтому при формировании как программы, так и закона управления летательными аппаратами, как правило, следует учитывать действие случайных и неопределенных факторов. Обсуждение начнем с детерминированной постановки задач оптимального управления для случаев непрерывного и дискретного управления.
Непрерывный случай Математическая постановка задачи оптимального управления любым динамическим объектом предполагает формирование математической модели с учетом всех требующих своего учета ограничений, выбор критерия оптимальности и, наконец, определение той информации, которая может быть использована при реализации искомого управления. В качестве математической модели летательного аппарата чаще всего рассматривают систему обыкновенных дифференциальных уравнений, которая в векторной форме имеет вид
Здесь — n -мерный вектор состояния, или фазовый вектор, определяющий состояние системы в текущий момент времени , — m-мерный вектор управления или просто управление; — непрерывно дифференцируемая вектор-функция, характеризующая вектор обобщенной силы, действующей на летательный аппарат; (∙ ) — символ дифференцирования по времени, Систему (10.1), не зависящую явно от времени , принято называть автономной. В общем случае ограничения, которые следует учитывать, и которые определяют область существования математической модели (10.1), будем задавать с помощью условий
где через обозначены допустимые области изменений векторов и соответственно; — время " существования" модели (10.1). Время может быть либо фиксированным, либо свободным. Условие принято называть фазовым ограничением, условие — ограничением на управление. Заметим, что могут зависеть явно от времени. Возможно также наличие и смешанных ограничений на фазовый вектор и управление. Частным случаем условий (10.2) является задание граничных условий . Будем полагать всюду, если специально не оговорено, что вектор задан. Что касается вектора , то в зависимости от условий задачи он может быть либо задан, либо быть свободным (частично или полностью), либо принадлежать допустимому множеству . Не нарушая общности, в качестве критерия оптимальности, подлежащего минимизации по управлению, можно рассматривать функцию конечного состояния
Задача оптимизации состоит в определении такого управления Задача оптимизации, в которой используется критерий вида (10.3), известна в литературе также под названием задачи Майера или задачи управления конечным состоянием. В зависимости от того, какую информацию предполагается использовать при реализации искомого управления, различают два основных типа задач управления. Задача программирования оптимального управления, когда считается, что никакая текущая информация (кроме начальных условий) об объекте не используется. В этом случае управление определяется как функция времени. Для его нахождения, как правило, используются либо необходимые условия оптимальности непосредственно, либо косвенно путем реализации различных численных методов поиска. Задача синтеза оптимального управления, когда считается, что в любой текущий момент времени состояние объекта известно (полностью или частично, непосредственно или косвенно). В этом случае управление должно быть найдено как функция тех координат, которые доступны измерению. Задача синтеза является существенно более сложной, чем задача программирования управления. Фундаментальной основой для ее решения могут служить достаточные условия оптимальности. Однако их непосредственное применения оказывается эффективным лишь в ограниченном классе задач, например, задач управления линейными объектами с квадратичным критерием оптимальности. В общем случае для решения задач синтеза необходим творческий подход, использующий различные приемы, к числу которых относятся, например, линеаризация моделей, декомпозиция исходной задачи на более простые, параметризация законов управления с последующим сведением задачи синтеза к задаче математического программирования и многие другие. Упражнение 1. Показать, что критерий оптимальности более общего вида (задача Больца) может быть сведен к функции конечного состояния по отношению к расширенному вектору , где компонента определяется с помощью дифференциального уравнения при граничном условии . Упражнение 2. Показать, что математическая модель неавтономной системы
т.е. системы, зависящей явно от времени, может быть сведена к автономной введением дополнительной переменной , удовлетворяющей уравнению при граничном условии . Упражнение 3. Показать, что задача максимизации критерия эквивалентна задаче минимизации критерия . |
Последнее изменение этой страницы: 2019-10-24; Просмотров: 331; Нарушение авторского права страницы