Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Решение матричной игры mxn (общий случай).
Здесь матричная игра сводится к задаче линейного программирования. Пусть дана игра с матрицей: Все элементы матрицы при этом считаются неотрицательными; Тогда цена игры будет положительной, v> 0. Вводятся новые переменные: Теперь матричная игра сводится к следующей задаче линейного программирования относительно 1-го игрока: или к двойственной ей – для 2-го игрока:
Понятие об игре с природой. Особенности, способы представления. Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под " природой " понимается совокупность неопределенных факторов; влияющих на эффективность принимаемых решений. Безразличие природы к игре (выигрышу) к возможности получения экономистом (статистиком) дополнительной информации о ее состоянии отличают игру экономиста с природой от обычной матричной игры, в которой принимают участие два сознательных игрока. Данный тип задач относится к задачам принятия решений в условиях неопределенности. Предположим, что ЛПР рассматривает несколько возможных решений: i = 1, …, m. Ситуация, в которой действует ЛПР, является неопределенной. Известно лишь, что наличествует какой-то из вариантов: j = 1, …, n. Если будет принято i -e решение, а ситуация есть j -я, то фирма, возглавляемая ЛПР, получит доход aij. Матрица A = (aij) называется матрицей последствий (возможных решений). В этой ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску. Оценим риск, который несет i- e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть j -я, то было бы принято решение, дающее доход aij. Значит, принимая i -e решение мы рискуем получить не aj, а только aij, значит принятие i -го решения несет риск недобрать rij = aj - aij. Матрица R = (rij) называется матрицей рис ков. Уникальные единичные случайные явления связаны с неопределенностью, массовые случайные явления обязательно допускают некоторые закономерности вероятностного характера.
Критерии Лапласа, Байеса, Вальда, Сэвиджа и Гурвица. 1. Правило Вальда ( правило крайнего пессимизма ). Рассматривая i -e решение будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход ai Но теперь уж выберем решение i0 с наибольшим ai0. Итак, правило Вальда рекомендует принять решение i0, такое что: ai0 = max ai = max ( min aij ) I i j По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е. a = max ( minaij ) 2. Правило Сэвиджа ( правило минимального риска ). При применении этого правила анализируется матрица рисков R = (rij). Рассматривая i -e решение будем полагать, что на самом деле складывается ситуация максимального риска bi = max [rij], Но теперь уж выберем решение i0 с наименьшим bi0. Итак, правило Сэвиджа рекомендует принять решение i0, такое что: bi0 =min bi = min (max rij) I i j Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается: a = min(max rij) 3. Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение i, на котором достигается максимум: λ min qij + (1-λ ) max qij, где 0 < λ < 1 J j Значение λ выбирается из субъективных соображений. Если λ приближается к 1, то правило Гурвица приближается к правилу Вальда, при приближении λ к 0, правило Гурвица приближается к правилу " розового оптимизма" (догадайтесь сами, что это значит). ( максимакс ) Критерий Гурвица является критерием пессимизма - оптимизма. Правило максимизации среднего ожидаемого дохода. Доход, получаемый фирмой при реализации i -го решения, является случайной величиной Qi с рядом распределения. Правило рекомендует принять решение, приносящее максимальный средний ожидаемый доход. 4а. По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r - max∑ (aijpj) 4б. Критерий Лапласа. q1 = q2 =... = qn = 1/n.
11. Понятие о статических играх с полной информацией на примере «Дилеммы заключенного». Определение. Под статической понимают такую игру, в которой все её участники принимают решения, не зная, какие именно решения принимают другие. Определение. Под играми с полной информацией понимают игры, в которых каждый из игроков точно знает характеристики других игроков. Пример. «Дилемма заключенного». Двое заключенных подозреваются в совершении некоторого преступления. Они помещены в разные камеры и не имеют никакой возможности обмениваться информацией. Каждому по отдельности предлагается сознаться (С) к определенному сроку, но можно и молчать (М). Если один сознался, а другой молчит, то сознавшегося освобождают, а молчун получает максимальный срок, равный 9 годам. Если оба сознались, то обоим срок снижается до 6 лет. Если оба молчат, то вину по основному преступлению доказать невозможно, и они получают по 1 году за незаконное владение оружием. Кратко игра записывается в виде матрицы: По традиции считается, что игрок 1 выбирает строки, а игрок 2 – столбцы. В каждой клетке матрицы стоят 2 числа: выигрыш игрока 1, выигрыш игрока 2. Матричная форма удобна для конечных игр двух лиц.
Популярное:
|
Последнее изменение этой страницы: 2016-05-30; Просмотров: 1223; Нарушение авторского права страницы