![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Случай двух игроков – партнеров.
Задана исходная игра:
И ее информационное расширение:
Пусть игрок 1 ходит первым, то есть выбирает Тогда игроку 1 гарантируется выигрыш
Максимальный гарантированный результат (МГР) игрока 1 равен:
а оптимальная стратегия
Итак, смысл ОП МГР заключается в следующем: Игрок 1 для каждой стратегии Замечание 1. Во всех формулах (3)-(5) предполагается, что максимум и минимум достигается (это имеет место когда, например, Пример 1. Если то МГР игрока 1 (см. (4)) принимает вид В случае Напомним, что всегда Замечание 2. В предположении, что игрок 1 знает все параметры игрока 2, то есть знает множество
В этом случае, множество Замечание 3. Если игрок 2 доброжелателен по отношению к игроку 1, то есть среди эквивалентных для игрока 2 выборов из множества
Конечно доброжелательность исключается при антагонистическом конфликте ( Если же
Пример 2. Пусть Имеем Тогда С другой стороны из условия доброжелательности получаем: Иерархическая игра (игра Гермейера) Иерархическая игра определяется следующими правилами (предполагается, что игрок 1 – начальник, игрок 2 – подчиненный): 1) Игрок 1 знает все параметры модели игрока 2, то есть множество 2) Игрок 1 делает свой ход первым, то есть выбирает стратегию 3) Игрок 2 при известной ему стратегии 4) При наличии неопределенных факторов (в данном случае – неоднозначного выбора 2-го игрока из множества
На основании этих предположений в зависимости от информации о выборах 2-го игрока, которую игрок 1 имеет или ожидает иметь, формулируются разные игры. Рассмотрим их.
I. Игра Тогда в этой игре МГР 1-го игрока:
В случае доброжелательности игрока 2 МГР игрока 1 равен
а оптимальная стратегия определяется из условия Можно «стимулировать» доброжелательность, используя побочный платеж Аналогичный прием можно использовать в играх II. Игра III. Игра Однако первый игрок знает правило поведения второго ( Замечание 5. В играх Замечание 6.
Можно рассматривать игры Из этого следует, что просчет вариантов действий в глубину не следует делать больше трех, дальше все повторяется. Экономическая интерпретация иерархических игр Г1, Г2 и Г3 Игра где x – ресурс, p(x) – продукция, Пусть Найти Если
Игра Опять пусть «+» - премия, «-» - штраф, налог. Тогда стимулирование выбора
Игра Пусть игрок 1 стимулирует реализацию ситуации где Игроку 1 важно только, что выделяемый ресурс Как уже отмечалось, решение игр Игра Г2. В этой игре
Поэтому стратегии игрока 1 – функции
Для игрока 2 имеем
Вспомогательные конструкции. Стратегия наказания:
Максимально гарантированный результат (МГР) подчиненного равен
Множество исходов выгодное подчиненному
Исходы (x1, x2 ) вне этого множества не устраивают игрока 2 и он всегда может добиться выигрыша не меньше, чем L2 , выбирая x2 = xˆ 2 из условия Определим Наконец определим
Отметим, что Теорема 1. При условии доброжелательности, оптимальный выигрыш игрока 1 в игре Г2, равен К2, а Доказательство: При известной стратегии - если - если же игрок 2 выберет
Если В случае
Итак, в условиях теоремы игроку1 гарантируется исход Покажем, что К2 - максимальный гарантированный выигрыш.
Действительно, если исход ( то он лежит вне множества D2 по определению Но вне множества D2 выигрыш игрока 2 оценивается величиной
Это не выгодно игроку 2 и он всегда может выбором Теорема доказана. Замечание 2. Условие доброжелательности может быть опущено, если множество
Действительно, в этом случае даже, если
Где точка (
величина Механизмом такой стимуляции может служить «побочный платеж».
Игра В этой игре игрок 2 знает выбор игрока 1 до своего выбора Вспомогательные конструкции. Определим МГР игрока 2: Далее определим стратегию наказания (стратегию наихудшую для игрока 2) из условия В игре
Напомним, что всегда К3 =
Построим стратегию игрока 2:
где Оптимальная стратегия игрока 1имеет вид:
Содержательно игрок 1 выберет В противном случае игрок 1 выбирает Теорема 2. При условии доброжелательности игрок 2 оптимальный выигрыш игрока 1 в игре Доказательство. Аналогично доказательству теоремы 1.
Замечание 1 и 2 к теореме 1 справедливы и для теоремы 2. Кроме того, в силу
Упражнение. Докажите, что если в антагонистической игре существует седловая точка, то
Пример. Ранее на этом примере, мы строили ситуации равновесия на сложных стратегиях. Теперь проиллюстрируем решение иерархических игр. Игра Определим множества рациональных ответов игрока 2.
Тогда max min
при Замечание. Решение игры Игра В этом случае
φ 1н(х2) =
К2 = Оптимальная стратегия игрока 1:
φ 10(х2) =
Выигрыш игрока 2 равен Игра Г3. В этой игре
Стратегия наказания
Оптимальный выигрыш игрока 1 определяется следующим образом:
Построим стратегию игрока 2:
где Оптимальная стратегия игрока 1 имеет вид:
При этом игрок 2 получит Заметим, что в этом примере Итак, для поиска решения иерархических игр на классе стратегий вместо решения сложнейших вариационных задач получена процедура сведения этих задач к задачам оптимизации на исходных множествах. Для этого необходимо проделать следующие вычисления: 1. Найти значение гарантированного выигрыша подчиненного. 2. Определить стратегии наказания начальником подчиненного. 3. Ведением дополнительного неравенства определяется допустимое по интересам и возможностям множество альтернатив подчиненного. Это множество содержит выборы, при которых выигрыш подчиненного не может быть меньше его гарантированного результата. 4. Определяется точка из этого множества, доставляющая максимум функции начальника. 5. Конструируется стратегия начальника, приводящая к реализации этой оптимальной точки и включающей в себя штрафные санкции за невыполнение указаний.
Для иллюстрации на приведенном простом примере биматричной игры продемонстрируем громоздкость алгоритма решения игры Итак, в данном примере игрок 1 имеет в своем распоряжении 27 = В приведенной таблице первой строке соответствует выбор стратегии
Второй строке
В правых столбцах приведены выигрыши игроков при различных ответах игрока 2 на эти стратегии. Например, оптимальный ответ игрока 2 на стратегию 1 заключается в выборе третьего столбца. При этом реализуется исход (1, 3) с выигрышами (2, 7).
Как видно из таблицы, оптимальными для игрока 1 являются стратегия 20 и стратегия 21, приводящие к исходу (3, 1) с выигрышами (7, 2). Именно этот результат и был получен с помощью процедуры, не требующей перебора всех стратегий. Проиллюстрируем работу предлагаемого алгоритма, когда множество управлений не является конечным. Пример Пусть
В данном примере
Множество Решение задачи оптимизации При этом В случае доброжелательности игрока 2 этот исход и есть решение задачи при использовании игроком 1 стратегии
Без условия доброжелательности «подправим» оптимальную стратегию
При этом выигрыш игроков равен
Лекция 8 Популярное:
|
Последнее изменение этой страницы: 2016-07-13; Просмотров: 586; Нарушение авторского права страницы