Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Управление ИСУ при неточном знании параметров подсистем⇐ ПредыдущаяСтр 13 из 13
Как уже было отмечено для решения вопроса о целесообразности построения иерархической системы управления(ИСУ) необходимо сравнить максимальный гарантированный результат(МГР) центра при централизованном и (частично) децентрализованном способах управления. При этом учитывается влияние неопределённых факторов. Для этого будем считать, что выигрыш центра определяется функцией , где –управляющие параметры центра; удовлетворяющие ограничениям , i=1, 2, а α -неопределённый параметр, про который центру известно только, что α ∊ А. Тогда, следуя принципу МГР, центр оценивает свой выигрыш величиной При децентрализованном способе управления центр передаёт нижнему уровню право выбора параметра .Пусть обмен информацией (в том числе и о величине α ) между уровнями приводит к усложнению класса стратегий , i=1, 2. Основываясь на предположении о рациональном поведении элементов нижнего уровня центр может построить множество откликов на свою стратегию. В этом случае принцип МГР позволяет оценить выигрыш центра величиной: В случае полной информированности А= всегда имеет место неравенство . Однако в более реальном случае наличия неопределённости возможны любые из трёх соотношений: , , . Выполнение какого-либо одного из них определяется, во-первых, самой моделируемой ситуацией (функцией , множествами и, во-вторых, тем насколько удачен выбор процедур обмена информацией (множествами ). В отличие от традиционных постановок задач принятия решений в условиях неопределённости будем изучать вопросы выбора рациональных решений в условиях наличия неопределённости, которую назовём субъективной. Субъективная неопределённость характеризуется тем, что во-первых подсистемы имеют различную информированность о неопределённых факторах: о параметрах системы и её элементов, о влиянии на систему внешней среды, и во-вторых учитывается возможность и целесообразность обмена информацией о действиях элементов(т.е. о выборе ими управлений), о параметрах, описывающих влияние внешней среды. Обмен информацией производится только в своих интересах, следовательно, не исключается возможность отказа от сообщения какой-либо информации или сообщения ложной информации. Замечание 1. Обмен информацией о неточно известных параметрах формализуется, как дополнительный элемент стратегии, то есть приводит к расширению самого понятия стратегии. Целесообразность такого расширения проиллюстрируем на следующем простом примере иерархической игры. Пример. Пусть выигрыш игрока 1(центра) описывается функцией , множества выборов игроков имеют вид
Функция выигрыша игрока 2(подчиненного) неизвестно игроку 1, который только знает, что она равна одной из двух функций Таким образом с точки зрения игрока 1: , , Истинное значение или не известно игроку 1, но известно игроку 2. В описанных условиях на классе стратегий игрок 1 не может получить гарантированно глобальный максимум при , . Действительно, при , игроку 1 одинаково выгодно выбирать или . Однако игрок 2 при одном из этих выборов может получить глобальный минимум. Следовательно, выбору он предпочтёт выбор . Поэтому в данном случае обоим игрокам выгоден обмен информацией, о том какую именно функцию максимизирует игрок 2. Рассчитывая на получение такой информации(обозначим её через τ ) игрок 1 выберет и сообщит игроку 2 стратегию
Которая вместе с выбором игрока 2 и сообщении им истинной информации о своей функции выигрыша игроку 1 гарантирует обоим игрокам получение глобального максимума.
Далее предполагается, что игрок 2 может сообщить игроку 1 любое значение (не обязательно )Если он не сообщает такой информации, то игрок 1 формально, по своему усмотрению присваивает этой величине какое-то значение из множества А. Итак, будем считать что = , = , то есть игрок 1 до выбора будет знать точную информацию о и какую-то информацию о . Итак, рассмотрим игру , где как и ранее проекция: 𝜋: , Введём некоторые обозначения , α )≥
Стратегия наказания: ( , α )=
Далее будем считать, что выполняются следующие условия: Знание игроком 1 множества А не противоречит объективному описанию модели, т.е. истинное значение неопределённого параметра принадлежит этому множеству Подчинённый (игрок 2) доброжелателен к начальнику - центру (игроку 1).Это условие как и ранее можно заменить условиями, справедливыми при всех α ∊ А -множества -замыкание –множество = . Стратегия наказания не зависит от параметра α . Построим стратегию ( В этой стратегии наказание реализуется, если игрок 2 не сообщил информацию о неопределённом параметре, т.е. или сообщив информацию 𝜏 ∊ А выбрал ≠ (𝜏 ). Замечание 2. Независимость стратегии наказания от неопределённого параметра не является жёстким ограничением для экономических моделей. Наказание-это выбор минимального значения цены и поощрения, либо максимального штрафа и т.д. Замечание 3. Как и ранее предполагаем, что максимумы и минимумы в соответствующих выражениях достигаются. Теорема. В сформулированных условиях МГР игрока 1 равен и достигается путём выбора игроком 1 оптимальной стратегии Доказательство. Игрок 2 может выбрать лучшую для себя пару , т.е. его выигрыш оценивается величиной Если же игрок 2 ослушается начальника-игрока 1, то при любом
В силу доброжелательности или как часто бывает в силу строгого неравенства
игрок 2 с гарантией для игрока 1 выберет наилучшую для себя пару что в свою очередь гарантирует игроку 1 выигрыш Итак, результат гарантируется игроку 1. На больший результат он рассчитывать не может, так как при известном может получить не больше и рассчитывая на худшее для себя он не может ожидать выйгрыша более чем Теорема доказана.
Экономные процедуры обмена информацией Пусть , где размерность вектора . Если велико, то передача и анализ информации о вызывает большие технические трудности и экономические затраты. Поэтому целесообразно исследовать вопрос об эффективности принятия решений по агрегированной информации, например, вида , где y – агрегированная информация о выборе игрока 2, - линейный невырожденный оператор: , ,
Например: Здесь , Обозначим образ множества в пространстве . Таким образом стратегия игрока 2 по прежнему определяется выбором , то есть Множество стратегий игрока 1 состоит из выбора целого числа , , выбора оператора и выбора функции . Кроме того, зададим монотонно неубывающую функцию, например, вида , которая имеет смысл платы за пользование каналами связи, где c – стоимость инфраструктуры, обеспечивающей передачу информации, d – оплата одного канала связи, - число каналов связи(по размерности вектора ). Целью игрока 1 является максимизация значения функции Поясним постановку и решение задачи на примере. Пример: Пусть функции выигрыша игроков линейны по их управлениям:
, , где управления игрока 1: , , а игрока 2: , . Наложим на параметры задачи ограничения: ,
Последнее ограничение обеспечивает выигрыш игроку 2 (в оптимальной точке), превышающий величину В нашей линейной модели а стратегия наказания имеет вид: Обозначим оптимальный выигрыш игрока 1 при соответственно . При получаем игру , решение которой имеет вид Оптимальный (рациональный) выбор игрока 2 определяется равенствами или покоординатно При имеет игру , в которой оптимальная стратегия игрока 1 имеет вид = Оптимальный выигрыш игрока 1 равен а выигрыш игрока 2
превышает величину в силу наложенного условия
Наконец, при и выборе оператора игрок 1 обеспечивает себе выигрыш выбором оптимальной стратегии = При этом игрок 2 опять получит строго больше своего МГР. Заметим, что всегда Более того в линейной модели при любой размерности вектора игроку 1 достаточно иметь всего лишь один канал связи и ничего не потерять в выигрыше! Определим условия на параметры модели, при которых Используя выражения для оптимального выигрыша игрока 1 во всех этих случаях, имеем:
Из первого неравенства получим:
А из второго Окончательно имеем: В этом случае суммарный выигрыш игрока 1 от действий игрока 2 больше половины стоимости обслуживания одного канала, но меньше его полной стоимости.
Задача. Подобрать численные значения параметров модели, при которых:
Пусть в пространстве критериев множество выигрышей задается ломаной OABCDO. Тогда отрезок BC – определяет множество эффективных точек, отрезок AB – слабоэффективных точек. Заметим, что для эффективной точки а строго положительный ортант не содержит других точек.
Популярное:
|
Последнее изменение этой страницы: 2016-07-13; Просмотров: 555; Нарушение авторского права страницы