Управление ИСУ при неточном знании параметров подсистем

⇐ ПредыдущаяСтр 13 из 13

Как уже было отмечено для решения вопроса о целесообразности построения иерархической системы управления(ИСУ) необходимо сравнить максимальный гарантированный результат(МГР) центра при централизованном и (частично) децентрализованном способах управления. При этом учитывается влияние неопределённых факторов. Для этого будем считать, что выигрыш центра определяется функцией , где –управляющие параметры центра; удовлетворяющие ограничениям , i=1, 2, а α -неопределённый параметр, про который центру известно только, что α ∊ А.

Тогда, следуя принципу МГР, центр оценивает свой выигрыш величиной

При децентрализованном способе управления центр передаёт нижнему уровню право выбора параметра .Пусть обмен информацией (в том числе и о величине α ) между уровнями приводит к усложнению класса стратегий , i=1, 2.

Основываясь на предположении о рациональном поведении элементов нижнего уровня центр может построить множество откликов на свою стратегию. В этом случае принцип МГР позволяет оценить выигрыш центра величиной:

В случае полной информированности А= всегда имеет место неравенство .

Однако в более реальном случае наличия неопределённости возможны любые из трёх соотношений: , , .

Выполнение какого-либо одного из них определяется, во-первых, самой моделируемой ситуацией (функцией , множествами и, во-вторых, тем насколько удачен выбор процедур обмена информацией (множествами ).

В отличие от традиционных постановок задач принятия решений в условиях неопределённости будем изучать вопросы выбора рациональных решений в условиях наличия неопределённости, которую назовём субъективной.

Субъективная неопределённость характеризуется тем, что во-первых подсистемы имеют различную информированность о неопределённых факторах: о параметрах системы и её элементов, о влиянии на систему внешней среды, и во-вторых учитывается возможность и целесообразность обмена информацией о действиях элементов(т.е. о выборе ими управлений), о параметрах, описывающих влияние внешней среды.

Обмен информацией производится только в своих интересах, следовательно, не исключается возможность отказа от сообщения какой-либо информации или сообщения ложной информации.

Замечание 1. Обмен информацией о неточно известных параметрах формализуется, как дополнительный элемент стратегии, то есть приводит к расширению самого понятия стратегии. Целесообразность такого расширения проиллюстрируем на следующем простом примере иерархической игры.

Пример.

Пусть выигрыш игрока 1(центра) описывается функцией , множества выборов игроков имеют вид

Функция выигрыша игрока 2(подчиненного) неизвестно игроку 1, который только знает, что она равна одной из двух функций

Таким образом с точки зрения игрока 1:

, ,

Истинное значение или не известно игроку 1, но известно игроку 2.

В описанных условиях на классе стратегий игрок 1 не может получить гарантированно глобальный максимум

при , .

Действительно, при , игроку 1 одинаково выгодно выбирать или . Однако игрок 2 при одном из этих выборов может получить глобальный минимум. Следовательно, выбору он предпочтёт выбор . Поэтому в данном случае обоим игрокам выгоден обмен информацией, о том какую именно функцию максимизирует игрок 2. Рассчитывая на получение такой информации(обозначим её через τ ) игрок 1 выберет и сообщит игроку 2 стратегию

Которая вместе с выбором игрока 2 и сообщении им истинной информации о своей функции выигрыша игроку 1 гарантирует обоим игрокам получение глобального максимума.

Далее предполагается, что игрок 2 может сообщить игроку 1 любое значение (не обязательно )Если он не сообщает такой информации, то игрок 1 формально, по своему усмотрению присваивает этой величине какое-то значение из множества А.

Итак, будем считать что = , = , то есть игрок 1 до выбора будет знать точную информацию о и какую-то информацию о .

Итак, рассмотрим игру , где как и ранее проекция: 𝜋: ,

Введём некоторые обозначения

, α )≥

Стратегия наказания:

( , α )=

Далее будем считать, что выполняются следующие условия:

Знание игроком 1 множества А не противоречит объективному описанию модели, т.е. истинное значение неопределённого параметра принадлежит этому множеству

Подчинённый (игрок 2) доброжелателен к начальнику - центру (игроку 1).Это условие как и ранее можно заменить условиями, справедливыми при всех α ∊ А

-множества

-замыкание –множество = .

Стратегия наказания не зависит от параметра α

Построим стратегию

(

В этой стратегии наказание реализуется, если игрок 2 не сообщил информацию о неопределённом параметре, т.е. или сообщив информацию 𝜏 ∊ А выбрал ≠ (𝜏 ).

Замечание 2. Независимость стратегии наказания от неопределённого параметра не является жёстким ограничением для экономических моделей. Наказание-это выбор минимального значения цены и поощрения, либо максимального штрафа и т.д.

Замечание 3. Как и ранее предполагаем, что максимумы и минимумы в соответствующих выражениях достигаются.

Теорема. В сформулированных условиях МГР игрока 1 равен

и достигается путём выбора игроком 1 оптимальной стратегии

Доказательство. Игрок 2 может выбрать лучшую для себя пару , т.е. его выигрыш оценивается величиной

Если же игрок 2 ослушается начальника-игрока 1, то при любом

В силу доброжелательности или как часто бывает в силу строгого неравенства

игрок 2 с гарантией для игрока 1 выберет наилучшую для себя пару что в свою очередь гарантирует игроку 1 выигрыш

Итак, результат гарантируется игроку 1. На больший результат он рассчитывать не может, так как при известном может получить не больше и рассчитывая на худшее для себя он не может ожидать выйгрыша более чем

Теорема доказана.

Экономные процедуры обмена информацией

Пусть , где размерность вектора . Если велико, то передача и анализ информации о вызывает большие технические трудности и экономические затраты.

Поэтому целесообразно исследовать вопрос об эффективности принятия решений по агрегированной информации, например, вида , где y – агрегированная информация о выборе игрока 2,

- линейный невырожденный оператор:

, ,

Например:

Здесь ,

Обозначим

образ множества в пространстве .

Таким образом стратегия игрока 2 по прежнему определяется выбором , то есть

Множество стратегий игрока 1 состоит из выбора целого числа , ,

выбора оператора и выбора функции .

Кроме того, зададим монотонно неубывающую функцию, например, вида , которая имеет смысл платы за пользование каналами связи, где

c – стоимость инфраструктуры, обеспечивающей передачу информации,

d – оплата одного канала связи,

- число каналов связи(по размерности вектора ).

Целью игрока 1 является максимизация значения функции

Поясним постановку и решение задачи на примере.

Пример:

Пусть функции выигрыша игроков линейны по их управлениям:

где управления игрока 1:

, ,

а игрока 2:

, .

Наложим на параметры задачи ограничения:

Последнее ограничение обеспечивает выигрыш игроку 2 (в оптимальной точке), превышающий величину

В нашей линейной модели

а стратегия наказания имеет вид:

Обозначим оптимальный выигрыш игрока 1 при соответственно .

При получаем игру , решение которой имеет вид

Оптимальный (рациональный) выбор игрока 2 определяется равенствами

или покоординатно

При имеет игру , в которой оптимальная стратегия игрока 1 имеет вид

Оптимальный выигрыш игрока 1 равен

а выигрыш игрока 2

превышает величину в силу наложенного условия

Наконец, при и выборе оператора

игрок 1 обеспечивает себе выигрыш

выбором оптимальной стратегии

При этом игрок 2 опять получит строго больше своего МГР.

Заметим, что всегда

Более того в линейной модели при любой размерности вектора игроку 1 достаточно иметь всего лишь один канал связи и ничего не потерять в выигрыше!

Определим условия на параметры модели, при которых

Используя выражения для оптимального выигрыша игрока 1 во всех этих случаях, имеем:

Из первого неравенства получим:

А из второго

Окончательно имеем:

В этом случае суммарный выигрыш игрока 1 от действий игрока 2 больше половины стоимости обслуживания одного канала, но меньше его полной стоимости.

Задача. Подобрать численные значения параметров модели, при которых:

Пусть в пространстве критериев множество выигрышей задается ломаной OABCDO.

Тогда отрезок BC – определяет множество эффективных точек, отрезок AB – слабоэффективных точек.

Заметим, что для эффективной точки а строго положительный ортант не содержит других точек.

⇐ Предыдущая 4 5 6 7 8 9 10 11 1213