Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Сведение решения игры к решению пары взаимно двойственных задач линейного программирования.
Исходные данные:
Для начала проедем анализ на доминирование. i-я строка доминирует j-ю, если все элементы i-той строки больше или равны соответствующим элементам j-той сроки. Т.к. строки выбирает первый игрок, мы убираем из платежной матрицы доминирумые строки. В нашем случае 1-я строка доминирует 3-ю, следовательно, нужно исключить третью строку:
В полученной платежной матрице 3-й столбец доминирует 5-ый. Т.к. столбцы выбирает второй игрок, мы исключаем из платежной матрицы пятый столбец. В результате получена платежная матрица 3 на 4, которую упростить уже невозможно:
Далее проводится анализ игры на седловую точку. Для этого находятся минимальные значения по строкам и максимальные значения по строкам:
Таким образом, нижняя цена игры , верхняя цена игры . Т.к. , решения игры в чистых стратегиях нет, следовательно, нужно искать решение игры в смешанных стратегиях. Для этого нужно сделать все элементы матрицы неотрицательными, прибавив к каждому элементу число 9. Решение при этом не изменится, а цена игры возрастет на 9 и станет неотрицательной. Матрица примет следующий вид:
Решение игры сводится к нахождению решений симметричной пары двойственных задач линейного программирования. Пусть ; – стратегии игроков. Сначала найдем стратегию Q*. Если второй игрок примет свою оптимальную стратегию, то первый игрок не может улучшить свое положение, отступая от своей оптимальной стратегии. Заставим первого игрока отступить от своей оптимальной стратегии, пользуясь чистыми стратегиями , при этом второй игрок придерживаться своей оптимальной стратегии. В любом случае проигрыш второго игрока не будет больше, чем цена игры V.
Разделим каждое из неравенств системы (9.1.) на V > 0 и введем обозначения:
В результате замены получим следующую систему: Поскольку , то переменные удовлетворяют условию: Т.к. V есть проигрыш второго игрока, который он стремиться сделать минимальным, величина должна быть максимальной. Таким образом, имеем задачу линейного программирования: Найти вектор , который обеспечивает максимум целевой функции (9.1.) При следующих линейных ограничениях: (9.2.) И условии неотрицательности переменных: (9.3.) Решение полученной задачи линейного программирования находится симплексным методом. Неравенства системы (9.2.) следует превратить в равенства, для этого добавляются дополнительные базисные переменные:
Последняя симплексная таблица.
Получено решение: , . Цену игры и Q* найдем по формуле Теперь найдем оптимальную стратегию P* первого игрока. Если первый игрок применяет свою оптимальную стратегию, то второй игрок не может улучшить свое положение, отступая от своей оптимальной стратегии. В случае использования втором игроком своих чистых стратегий , а первым игроком своей оптимальной стратегии P*, выигрыш первого будет не меньше, чем цена игры:
Разделим каждое из неравенств системы (9.1.) на V > 0 и введем обозначения:
В результате замены получим следующую систему: Поскольку , то переменные удовлетворяют условию: Т.к. V есть выигрыш первого игрока, который он стремиться сделать максимальным, величина должна быть минимальной. Таким образом, имеем задачу линейного программирования: Найти вектор , который обеспечивает минимум целевой функции (9.4.) При следующих линейных ограничениях: (9.5.) И условии неотрицательности переменных: (9.6.) Полученная задача является двойственной по отношению к задаче нахождения стратегии второго игрока. Решение двойственной задачи можно взять из последней сиплексной таблицы решения задачи (1). Аналогичным образом получена цена игры и стратегию P*: Теперь вернемся к исходной матрице :
Решение этой игры имеет вид:
34. Некооперативные биматричные игры, основные понятия и определения. Анализ биматричной игры в некооперативном варианте.
Игры, в которых отсутствует обмен информацией между игроками, называются матричными некооперативными. Игры, в которых игроки вступают непосредственный контакт, называются коопекративными (переговоры, вследствие которых создаются коалиции) Коалиционные – игроки создают коалиции (2 игрока могут создать три коалиции: только 1, только 2, оба вместе). Биматричные игры – интересы игроков неполностью противоположны. Они создают две матрицы:
На биматричные игры распространяются термины чистой и смешанной стратегии.
Биматричная игра в некооперативном варианте Анализ биматричной игры (некооперативной) сводится к поиску максимынных стратегий игроков, обеспечивающих максимально возможные гарантированные выигрыше при любом поведении противника. Множество пар смежных стратегий игроков
- стратегия игрока А - стратегия игрока В Если два игрока выбрали смешанные стратегии соответственно, то математические ожидания выигрышей игроков равны
Популярное:
|
Последнее изменение этой страницы: 2016-07-13; Просмотров: 878; Нарушение авторского права страницы