Постановка задачи оптимального управления

⇐ ПредыдущаяСтр 3 из 11Следующая ⇒

Если состояние какой-либо системы, в том числе экономической, может изменяться под влиянием управляющих воздействий и необходимо подавать эти воздействия таким образом, чтобы управлять системой наилучшим образом, возникает задача оптимального управления. Эта задача является частным случаем общей задачи оптимизации.

Определим некоторые ключевые понятия, необходимые для описания задачи оптимального управления.

Будем считать, что состояние системы в любой момент времени может быть описано вектором , где - n-мерное пространство. В этом случае пространство называется пространством состояния системы.

Последовательность состояний системы во времени называют траекторией системы.

Независимая переменная называется аргументом процесса. В качестве аргумента процесса может выступать любая величина. В нашем случае t - это время. Переменная пробегает некоторый отрезок числовой прямой, т.е. , или отрезок натурального ряда . В случае с числовой прямой процессы, происходящие в системе, рассматриваются как непрерывные, а в случае натурального ряда – как дискретные или многошаговые.

Будем считать, что управляющие воздействия могут быть заданы с помощью вектора - мерного векторного пространства . Вектор-функция называется программой управления.

На состояние системы и на управление накладываются ограничения: , где - некоторое подпространство -мерного пространства. Ограничения на и также могут задаваться в каждый момент времени t: .

Пару функций называют процессом. Связь между функциями и выражается моделью процесса. Для непрерывных систем модель процесса задается системой дифференциальных уравнений:

где - обозначение производной xⁱ по t. Модель может также быть представлена в векторной форме:

(1)

Для определенности будем считать момент начала процесса равным нулю ( =0). Если ¹ 0 то перейдем к другому аргументу . Момент окончания процесса примем равным . Аргумент процесса, таким образом, изменяется в переделах .

Определим состояние, в котором система находится в начальный момент времени:

(2)

Если на промежутке задана программа управления , то, подставив функцию в правую часть системы (1), получим:

(3)

Решив систему дифференциальных уравнений (3) с учетом условия (2), можно найти траекторию , которая соответствует заданному уравнению и заданному начальному состоянию . Задавая различные законы управления , можно получать и различные траектории системы.

В дискретном случае модель задается в виде системы рекуррентных уравнений:

Или в векторной форме:

(4)

Аргумент процесса принимает дискретные значения . Начальное состояние будем считать равным .

В дискретной системе, так же как и в непрерывной, программа управления при позволяет однозначно определить траекторию системы. В начальный момент состояние известно. Подставим это состояние в систему (4) и найдем :

Затем найдем , подставив найденное значений , и т.д.

...

Так по заданному управлению и начальному состоянию можно однозначно определить траекторию системы.

Процессы , которые удовлетворяют уравнениям модели процесса (3) или (4), заданным начальным условиям (2) и ограничениям на состояние и управление называются допустимыми процессами. Обозначим множество допустимых процессов через M.

Для постановки оптимизационной задачи необходимо ввести в рассмотрение функционал , заданный на множестве . Задача оптимального управления состоит в выборе элемента множества , на котором функционал достигает минимального значения. Процесс называется оптимальным процессом, соответствующее управление - оптимальным управлением, а траектория - оптимальной траекторией.

Функционал описывает критерий управления. Оптимальным по сравнению с любым другим процессом будет тот, на котором значение функционала минимально. Заметим, что если необходимо добиться максимизации функционала , то это может быть достигнуто минимизацией функционала - .

В социально-экономических задачах сложно выделить какой-либо один критерий управления. Для решения многокритериальных задач используются различные методы, например, иногда выводится один главный критерий, а остальные критерии добавляются в качестве ограничений (то есть значение критерия не должно превышать определенной величины, таким образом, множество M сужается). Иногда критерии свертываются в один с помощью весовых коэффициентов.

В задаче оптимального управления для непрерывных систем обычно рассматривают функционалы вида:

(5)

где:

и - заданные функции.

Первое слагаемое (5) оценивает качество процесса на промежутке , а второе слагаемое (так называемая, терминальная составляющая) оценивает качество состояния системы в конечный момент времени (t=T). Иногда конечное состояние системы задается заранее. В этом случае терминальная составляющая исключается из функционала (5), а условие добавляется в качестве дополнительного ограничения. Такие задачи называются задачами с фиксированным правым концом траектории.

Для задачи оптимизации дискретных процессов в формуле функционала интеграл заменяется на сумму:

(6)

Существуют такие постановки задачи, когда момент времени окончания процесса не задан заранее, а выступает в качестве критерия управления. Такие задачи называются задачами на быстродействие. Они используются тогда, когда требуется перевести систему из заданного начального состояния в заданное конечное состояние за минимальное время .

Примеры моделей управляемых процессов

Рассмотрим пример задачи оптимального управления. Модель Леонтьева задается выражением:

(8)

Рассмотрим эту модель на некотором промежутке времени . Будем считать валовой продукт X эндогенной переменной, а потребление C - экзогенной. Если задать потребление как функцию от времени на промежутке , то из уравнения модели (8) можно однозначно найти траекторию валового выпуска продукта . Запишем (8) в виде:

(9)

Необходимо также учесть начальное состояние системы и ограничения на минимальную и максимальную величину потребления. Кроме того, из экономического смысла модели вытекает требование неотрицательности переменных.

(10)

В качестве критерия развития экономики возьмем суммарное дисконтированное потребление на всем периоде планирования и экономический потенциал на конец этого периода. Функционал примет вид:

(11)

Здесь - функция дисконтирования, которая позволяет привести потребление к одному моменту времени. Весовые коэффициенты позволяют расставить приоритеты между двумя целями планирования.

Рассмотрим теперь задачу построения траектории процесса по заданному управлению.

Пусть на промежутке дана модель управляемого процесса в виде системы дифференциальных уравнений:

Начальные условия:

При этом управление задано кусочно-непрерывной функцией:

По заданным управлению и начальному состоянию требуется построить траекторию управляемой системы на участке .

Очевидно, что имеется два участка [0; 3[ и [3; 10] на которых u(t) непрерывна. Для участке подставим значение u=0. Получим систему дифференциальных уравнений:

Решаем второе уравнение методом прямого интегрирования:

где C₂ - произвольная постоянная. Подставим теперь выражение для x₂ в первое уравнение и найдем x₁:

Получено общее решение системы дифференциальных уравнений. Для того, чтобы найти частное решение, подставим в общее решение начальные условия :

, откуда

Таким образом, частное решение системы с учетом начальных значений примет вид:

В точке t=3 состояние системы будет описано двумя числами: x₁(3)=12, x₂(3)=1. Рассмотрим теперь участок траектории . Здесь управление задается выражением u=-1. Подставив это выражение в исходную систему, получим:

Также решив второе уравнение и подставив результат в первое, получим общее решение системы:

Итак, общее решение:

К моменту времени t=3 система окажется в точке x₁(3)=10, x₂(3)=3. Начало второго участка совпадает с концом первого. Подставив эти значения получим частное решение:

Частное решение:

Таким образом, окончательно искомая траектория будет иметь вид:

На рисунке 5 показана построенная траектория.

Рисунок 5 – Траектория управляемого процесса

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒