Матрица выигрышей для «дилеммы заключенных»

⇐ ПредыдущаяСтр 18 из 18

Заключ. В Заключ. А	Признание	Отрицание
Признание	4 года 4 года	5 лет 1 год
Отрицание	1 год 5 лет	2 года 2 года

Особенность данной игры заключается в том, что в представленной ситуации каждый из заключенных имеет так называемую доминантную стратегию. Доминантная стратегия – это стратегия, предпочтительная для одного игрока вне зависимости от стратегии, выбранной другим игроком.

Рассмотрим выборы заключенного А. Если заключенный В сознается, то заключенному А тоже лучше сознаться и получить 4 года вместо пяти. Если В будет отрицать вину, то А все равно лучше сознаться и получить 1 год вместо двух. В данном случае, вне зависимости от выбора В заключенному А лучше сознаться. Аналогичная доминантная стратегия существует и для заключенного В, которому при любых выборах А также выгоднее сознаться. При этом, результат игры не изменится даже если заключенные смогут договориться, т.к. условия выбора таковы, что каждому участнику игры выгоднее сознаться.

Поиск решения в игре

Рассмотрим простейшую математическую модель конечной конфликтной ситуации, когда имеется два игрока и выигрыш одного из них равен проигрышу другого. Такая игра называется антагонистической игрой двух лиц с нулевой суммой.

Пусть в игре участвуют два игрока, каждый из которых может запсать любую цифру от 1 до 3. Если записанная цифра окажется больше цифры соперника, то выигрыш игрока будет положительным, и его величина будет равняться разнице между записанными цифрами.

Таким образом, каждый из игроков имеет три стратегии: А1 и В1 = «записать1»; А2 и В2 = «записать 2»; А3 и В3 = «записать 3». Выигрыши игрока А, которые он может получить при реализации каждой из своих стратегий во взаимодействии со стратегиями игрока В, можно представить в таблице:

Стратегии	В1 = 1	В2 = 2	В3 = 3
А1 = 1		-1	-2
А2 = 2			-1
А3 = 3

Игру можно представить в виде платежной матрицы, в которой строки – стратегии игрока А, столбцы – стратегии игрока В, а на пересечении строк и столбцов расположены выигрыши игрока А:

В общем виде платёжная матрица игры двух игроков с нулевой суммой может быть записана как:

Строго говоря, данная матрица отражает выигрыши игрока А. Но поскольку мы имеем дело с игрой с нулевой суммой, то результаты игры для игрока В также автоматически отражены в матрице при рассмотрении ее по столбцам и представляют собой проигрыши игрока В. Если же имеет место игра с ненулевой суммой, то матрица выигрышей игрока В должна быть построена отдельно.

Задача каждого из игроков – найти наилучшую стратегию, обеспечивающую ему наибольший гарантированный выигрыш.

Найдем наилучшую стратегию первого игрока. Минимальный размер выигрыша в каждой строке обозначим α _i:

Зная минимальные гарантированные выигрыши для каждой стратегии, первый игрок выберет ту из них, для которой это значение будет максимальным:

Подобная стратегия определения выигрыша называется максиминной, а величина α – гарантированный выигрыш, который может обеспечить себе первый игрок – нижней ценой игры.

Аналогичным образом будет вести себя и игрок В, с той лишь разницей, что он будет стремиться к минимизации проигрыша. Для этого определим максимальное значение его проигрыша по каждой возможной стратегии:

Оптимальной стратегией для игрока В будет та из них, которая позволяет ему гарантированно получить минимальный из возможных проигрышей:

Подобная стратегия называется минимаксной и позволяет определить β – верхнюю цену игры. Если игрок В будет придерживаться минимаксной стратегии, то он гарантированно проиграет не больше β.

Для матричной игры справедливо неравенство:

α ≤ β

Если α = β, то такую игру называют игрой с седловой точкой, а пару оптимальных стратегий (А_опт.; В_опт) седловой точкой матрицы. В этом случае элемент a_ij, являющийся ценой игры, является минимальным и для строки i, и для столбца j. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.

Если платежная матрица не имеет седловой точки, то решение игры заключается в формировании сложной стратегии, состоящей в случайном применении двух и более стратегий с определенной вероятностью. Такая стратегия называется смешанной.

В этом случае для игры с матрицей m*n стратегии игроков задаются вероятностями их применения.

Для первого игрока: x = (x₁…x_m),

Для второго игрока: y = (y₁…y_n),

Решение игры в смешанных стратегиях опирается на аппарат теории вероятностей. Теория игр утверждает, что каждая конечная игра имеет хотя бы одно решение, возможно в области смешанных стратегий.

Если в игре нет седловой точки, то поиск смешанной стратегии тем сложнее, чем выше размерность матрицы. Поэтому первым этапом решения такой игры является поиск и вычеркивание заведомо неэффективных стратегий с помощью принципа доминирования.

Теория игр тесно связана с линейным программированием. В частности, любая конечная игра двух лиц с нулевой суммой может быть представлена в виде задачи линейного программирования и решена с помощью симплекс-метода.

Антагонистические игры с нулевой суммой являются не единственным вариантом игры. Более того, в реальной экономике более часто встречаются ситуации, когда интересы игроков не полностью антагонистичны, то есть - игры с ненулевой суммой. В этой ситуации может возникнуть желание кооперировать свои действия с другим игроком (подобное поведение будет описываться кооперативной игрой), либо иным способом влиять на его действия (некооперативные игры).

Для некооперативной игры важным моментом является определение точек равновесия. Понятие равновесия в игре шире понятия оптимума, так как точка оптимума является лишь частным случаем равновесия. В общем случае пара стратегий (x*; y*) для игроков 1 и 2 является точкой равновесия по Нэшу, если ни один из игроков не может улучшить свое положение без изменения стратегии другого игрока. Иными словами, для любых x и y:

a₁(x; y*) ≤ a₁ (x*; y*)

a₂(x*; y) ≤ a₂ (x*; y*)

В теории игр доказано, что для любой конечной некооперативной игры с ненулевой суммой всегда существует по крайней мере одна равновесная пара смешанных стратегий.

В кооперативных играх с двумя игроками множество исходов игры может быть графически представлено на плоскости выигрышей.

Оптимальные решения находятся на правой верхней границе плоскости выигрышей. Среди всего множества оптимальных для каждого игрока решений может быть выделена область Парето-оптимальных решений, представленная на рисунке. Особенность данной области заключается в том, что ни один из игроков не может увеличить свой выигрыш без уменьшения выигрыша другого игрока.

Величины c₁и c₂ – значения выигрышей игроков при изолированном принятии решений. Очевидно, что игроки заинтересованы в объединении усилий (кооперации), если оно позволяет получить значения выигрышей не меньше, чем c₁и c₂. Отсюда следует, что игроки будут склонны к кооперации, если их выигрыши соответствуют участку DE. Участки AD и BE соответствуют оптимальным по Парето выигрышам одного из игроков, которые неприемлемы для другого игрока. Для первого игрока неприемлемы все точки, лежащие левее C₁D; для второго игрока неприемлемы все точки, лежащие ниже С₂Е. Участок пространства выигрышей, представленный линией DE, называют ядром кооперативной игры или ее переговорным множеством. На переговорном множестве выделяется точка М, соответствующая равновесию по Нэшу. В ней достигается максимум произведения:

max (a₁ – c₁)(a₂ – c₂),

в котором сомножители представляют собой превышения выигрышей каждого из игроков над выигрышами, которые могут быть получены игроками без кооперации.

⇐ Предыдущая 9 10 11 12 13 14 15 16 1718