Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Ситуация равновесия по Нэшу в информационном расширении игры
Пусть задана игра: Г = < , , , > и ее информационное расширение:
Определение. ( 0, 0)- ситуация равновесия в информационном расширении игры, если M10 =M1(π ( 0, 0))= M1(π ( , 0)) M20= M2(π ( 0, 0))= M2(π ( 0, ) Заметим, что ( 0, 0) π (х10, х20) – равновесный исход, но не ситуация равновесия! Таким образом, ситуация равновесия может реализоваться на стратегиях ( º, º ) є но ее проекция ( хº 1, хº 2) є не обязательно равновесная по Нэшу. Напомним, что стратегия а = х1а(х2) называется абсолютно оптимальной стратегией, если справедливо равенство: M1(x1а(x2), x2)= M1(x1, x2) Определим x2= х2а - оптимальный ответ второго игрока из условия: M2(x1а(x2), x2) = M2(x1а(x2а), x2а )
Положительные свойства стратегий: Свойство 1. Ситуация равновесия всегда существует на классе стратегий ( , )=(x1(x2), x2) Доказательство: Достаточно выбрать абсолютно оптимальную стратегию а = хª 1(x2), и оптимальный ответ на нее а = х2а По определению: M1(x1а(x2), x2) = M1(x1, x2), M2(x1а(x2а), x2а ) = M2(x1а(x2), x2). Тогда, если = х2а, то M1(π ( , x^2а))= M1(x1(xª 2), xª 2) = M1(x1а(x2а), x2а ). Если = а ( ), то M2(x1а(x2), x2 )= M2(x1а(x2а), x2а), что соответствует определению ситуации равновесия в информационном расширении игры.
Свойство 2. Если , то и – увеличение информации приводит к возможности увеличения выигрыша.т Доказательство: Первый игрок может не использовать дополнительную информацию и получить . А если повезёт (дополнительная информация оказалась полезной), то получит строго больше.
Свойство 3. Пусть игрок 1 знает х2. Определим взаимовыгодное множество для этого случая: 12={(х1, х2) M1( х1, х2) ≥ M1(х1, х2); M2( х1, х2) ≥ M2(х1, х2)}. Любая точка из этого множества может быть сделана ситуацией равновесия на классе стратегий {х1(х2), х2[х1(х2)]} Аналогичное утверждение верно и в симметричном случае, когда игрок 2 знает х1. Здесь взаимовыгодное множество определяется следующим образом: 21={(х1, х2) M1( х1, х2) ≥ M1(х1, х2); M2( х1, х2) ≥ M2(х1, х2)}. А класс использованных стратегий имеет вид: { х1 [х2(х1)], х2 (х1)}. Для иллюстрации сделанных выводов рассмотрим следующий Пример. [1] Исследуем биматричную игру: М1= M2=
Сначала найдем равновесные ситуации в исходной игре. Для этого определим: x1a(x2) –абсолютно оптимальную стратегию первого игрока и х2 = x2a – оптимальный ответ второго. Напомним, что: x1a(x2): M1(x1a(x2), x2) = M1(x1, x2)x2a: M2(x1a(x2а), x2a) = M2(x1a(x2а), x2). Итак: 3, если x2 = 1 x1a(x2) = 2, если x2 = 2 2, если x2 = 3 Аналогично: 3, если x1 = 1 x2a(x1) = 2, если x1 = 2 2, если x1 = 3
Единственная ситуация равновесия в исходной игре определяется из условия пересечения оптимальных стратегий в точке (x1a(x2а), x2a(x1a)) (2, 2). В этой ситуации выигрыши игроков равны (4, 4). Построим П-множество Парето на классе исходных управлений. Напомним, что (x1п, x2п) П если не существует (x1', x2')єХ1*Х2, такой что: Mi(x1', x2') ≥ Mi(x1п, x2п), i=1, 2 (дизъюнкция) Mi(x1', x2') > Mi(x1п, x2п), i=1 либо i=2 (конъюнкция) В пространстве выигрышей множество возможных решений имеет вид:
M2
П 7 6 П
4 (4, 4) с.р. 2 П
0 2 3 4 6 7 M1 рис.1 Как видно из рис.1: П = {( 1, 1); (1, 3); (3, 1)}, С выигрышами игроков соответственно МП = {(6, 6); (2, 7); (7, 2)}. Непосредственной проверкой убеждаемся, что ни одна из этих точек не является ситуацией равновесия в исходной игре. Покажем, что эти ситуации могут быть результатом проекции равновесных стратегий вида: { х1(х2), х2[х1(х2)]}, {х1[х2(х1)], х2(х1)}. Имеем для игрока 1: M1(x1, x2) = 0 M1(x1, x2) = 3 Определим: х2 = х2H - стратегия наказания первого игрока вторым, из условия M1(х1, х2) = M1(х1, х2H) В данном случае имеем х2H= . Далее для игрока 2 имеем: M2(x1, x2) = 0 M2(x1, x2) = 3 Определим х1H (х2) - стратегию наказания второго игрока первым. 2, если х1 = 1 х1H (х2)= 1, если х2 = 2 3 (2), если х3 =3
Покажем, что равновесные стратегии можно выбрать на классе стратегий {x1(x2), x2 [x1(x2)]}.Действительно, пусть
x10 (x2) = 1, х2=1 0 = х20 [х1(х2)] = 1, = х1н (х2), х2 1, х2н = 3,
Очевидно, эти стратегии проектируются в точку (х1 = 1, х2=1). В этой точке M1 = 6, M2 = 6. Если от этих стратегий отклонится игрок 1, то есть , то он получит не больше, чем M1(π ( , 0))= M1(π ( , 3) = M1(2, 3) = 3 < 6. Таким образом, игроку 1 не выгодно отклоняться от точки ( , 0). Если же при = , игрок 2 выберет , то его выигрыш оценивается величиной M2[π ( 0, )]. Если т.ч. х2 1, при = , то M2[π ( 0, )] = M2(х1H(х2), х2) = 0 < 6 Итак, игроку 2 также не выгодно отклоняться от точки ( , 0), то есть ( , 0) – ситуация равновесия в игре .
Замечание. Точку из множества Парето можно сделать равновесной, если выигрыши игроков в ней оцениваются величиной не меньшей, чем их максимально гарантированные результаты, соответствующие их информированности. Этому условию удовлетворяют также точка (7, 2) на классе стратегий {x1(x2), x2 [x1(x2)]} и точка (2, 7) на классе стратегий {x2(x1), x1 [x2(x1)]}. Упражнение. Точку (7, 2) можно сделать ситуацией равновесия на классе {x1(x2), x2 [x1(x2)]} Точку (2, 7) можно сделать ситуацией равновесия на классе {x2(x1), x1 [x2(x1)]}.
Итак, для построения ситуаций равновесия в игре двух лиц на сложных стратегиях необходимо проделать следующее: 1. Вычислить гарантированные (минимальные или максимальные, в зависимости от информированности ) результаты игроков. 2. Определить стратегии наказания, применение которых не позволит партнеру получить выигрыш, превышающий его гарантированный результат. 3. Определяется множество взаимовыгодных исходов, на котором игроки получают выигрыш, не меньший гарантированного результата. 4. Путем переговоров выбирается точка из этого множества, устраивающая обоих партнеров. 5. С помощью простой процедуры конструируются равновесные стратегии, включающие в себя обязательства выбора договорного исхода и штрафы на основе стратегий наказания за нарушение договоренностей.
Таким образом, решение сложнейшей по постановке задачи оказывается не сложнее, а. как правило, значительно проще решения традиционной задачи поиска ситуации равновесия. При этом построение взаимовыгодного множества дает полное решение задачи - построить все ситуации равновесия!
Проведем анализ рассмотренных ранее иллюстративных игр, но уже на классе стратегий. Популярное:
|
Последнее изменение этой страницы: 2016-07-13; Просмотров: 786; Нарушение авторского права страницы