Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Решение матричной игры в чистых и смешанных стратегиях
Целью участников любой матричной игры является выбор наиболее выгодных стратегий, доставляющих игроку А максимальный выигрыш, а игроку В – минимальный проигрыш. Предположим, что игроку А надлежит сделать свой выбор. Анализируя платежную матрицу, он для каждой чистой стратегии Ai сначала найдет минимальное значение α i ожидаемого выигрыша: , а затем из всех α i выделит наибольшее и выберет соответствующую ему чистую стратегию . Это и будет наиболее предпочтительная (гарантирующая) в данных условиях стратегия игрока А. Ее называют максиминной, поскольку она отвечает величине
. (7.1)
Число α , определяемое по формуле (7.1), называется нижней чистой ценой игры (максимином). Оно показывает, какой минимальный выигрыш может получить игрок А, правильно применяя свои чистые стратегии при любых действиях игрока В. В свою очередь, игрок В, стремясь минимизировать проигрыш, при выборе наиболее предпочтительной стратегии, использует принцип осторожности так: сначала он для каждой чистой стратегии Вj ( ) найдет максимально возможный проигрыш ( ), а затем среди β j выберет минимальное значение , которому и будет соответствовать искомая чистая стратегия . Ее называют минимаксной, так как она соответствует величине
. (7.2)
Число β , определяемое по формуле (7.2), называется верхней чистой ценой игры (минимаксом). Оно показывает, какой максимальный проигрыш может быть у игрока В при правильном выборе им своих чистых стратегий независимо от действий игрока А. Если в матричной игре нижняя и верхняя чистые цены совпадают, т.е. α = β , то эта игра имеет седловую точку в чистых стратегиях и чистую цену игры ν = α = β . Оптимальными для игроков будут соответственно максиминная и минимаксная стратегии, а чистой ценой игры – седловой элемент платежной матрицы. Если игра седловой точки не имеет, то решение игры следует найти в смешанных стратегиях. Обозначим через р1, ..., рm вероятности, с которыми игрок А использует в ходе игры свои чистые стратегии A1, ..., Аm. Для вероятностей рi выполняются условия:
. (7.3) Упорядоченное множество , элементы которого удовлетворяют условиям (7.3), полностью определяет характер игры игрока А и называется его смешанной стратегией. Аналогично упорядоченное множество , элементы которого удовлетворяют соотношениям , (7.4)
является смешанной стратегией игрока В. Итак, пусть игроки А и В применяют смешанные стратегии р и q. Это означает, что игрок А использует стратегию Ai с вероятностью pi, а игрок В – стратегию Вj с вероятностью qj. При использовании смешанных стратегий игра приобретает случайный характер, случайной становится и величина выигрыша игрока А (проигрыша игрока В). В связи с этим можно вести речь лишь о средней величине (математическом ожидании) выигрыша (проигрыша). Эта величина является функцией от смешанных стратегий р и q и определяется по формуле . (7.5)
Функция (7.5) называется платежной функцией игры с матрицей. Нижней ценой игры будем называть число α , определяемое по формуле , a верхней ценой игры – число β , определяемое по формуле . (7.6)
Оптимальными являются смешанные стратегии р* и q* игроков А и В, удовлетворяющие равенству
= = . (7.7)
Величину , полученную по формуле (7.7), называют ценой игры v. Пример решения задачи
Постановка задачи. На каждой из двух торговых баз ассортиментный минимум составляет одинаковый набор товаров из четырех видов. Магазины, обозначим их А и В, конкурируют между собой. Один и тот же вид товара в обоих магазинах продается по одной и той же цене. Однако товар, поставляемый в магазин В, более высокого качества. Если магазин А завезет с базы товар, отличный от товара, завезенного в магазин В, то товар будет пользоваться спросом, и магазин А от его реализации получит прибыль с, денежных единиц. Если же в магазины А и В завезены товары одинакового вида, то товар в магазине А спросом пользоваться не будет, поскольку такой же товар, по такой же цене, но более высокого качества, можно купить в магазине В, и потому магазин А понесет убытки по хранению и, возможно, порче товара в размере d, денежных единиц. Требуется формализовать конфликтную ситуацию, построить матрицу игры и дать рекомендации по выбору оптимальной смешанной стратегии магазина А при следующих числовых данных:
Решение задачи
1 Представим данную ситуацию в виде матричной игры. У руководства магазина А четыре стратегии: Аi - продавать товар i-го вида (i = 1, 4). Аналогично у руководства магазина В стратегии Вj - продавать товар j-го вида (j = 1, 4). Построим платежную матрицу данной игры на рабочем листе MS Excel в ячейках А1: Е5 (таблица 7.1).
Таблица 7.1 – Платежная матрица
Определим, имеет ли игра оптимальное решение в чистых стратегиях, т.е. проверим наличие седловой точки. Чтобы рассчитать верхнюю и нижнюю чистые цены игры, в столбец аi (F1: F5) вводим функцию МИН, а в строку β j (A6: E6) - функцию МАКС, получаем матрицу следующего вида (таблица 7.2).
Таблица 7.2 – Определение седловой точки
Далее аналогично вычисляем: ; . Так как а β , то игра не имеет решения в чистых стратегиях. 2 Решение игры в смешанных стратегиях
2.1 Преобразование платежной матрицы. Чтобы свести игру к задаче линейного программирования, увеличим все элементы платежной матрицы на 20 (таблица 7.3).
Таблица 7.3 – Преобразование платежной матрицы
2.2 Построение математической модели. Задача линейного программирования для игрока А:
где , pj – вероятность, с которой игрок А применяет свою j-ю чистую стратегию, v - цена игры.
2.3. Технология решения задачи средствами Excel. Строим следующую таблицу (таблица 7.4).
Таблица 7.4 – Решение задачи в Excel
Решив данную задачу средствами Excel, получаем: х1 = 0, 0129; х2 = 0, 0168; х3 = 0, 009; fmin = 0, 039.
Для определения смешанной стратегии, воспользуемся формулами:
.
Отсюда смешанная стратегия: р = (0, 333; 0, 434; 0, 233; 0), N =25, 79.
3 Анализ полученных результатов Итак, оптимальной стратегией магазина А будет продажа товаров в следующей пропорции: 33, 3 % товара 1-го вида; 43, 4 % товара 2-го вида; 23, 3 % товара 3-го вида. Средняя прибыль составит 25, 79 ден. ед.
|
Последнее изменение этой страницы: 2017-03-14; Просмотров: 1241; Нарушение авторского права страницы