Решение матричной игры mxn (общий случай).

Здесь матричная игра сводится к задаче линейного программирования. Пусть дана игра с матрицей:

Все элементы матрицы при этом считаются неотрицательными; Тогда цена игры будет положительной, v> 0. Вводятся новые переменные:

Теперь матричная игра сводится к следующей задаче линейного программирования относительно 1-го игрока:

или к двойственной ей – для 2-го игрока:

Понятие об игре с природой. Особенности, способы представления.

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под " природой " понимается совокупность неопределенных факторов; влияющих на эффективность принимаемых решений. Безразличие природы к игре (выигрышу) к возможности получения экономистом (статистиком) дополнительной информации о ее состоянии отличают игру экономиста с природой от обычной матричной игры, в которой принимают участие два сознательных игрока.

Данный тип задач относится к задачам принятия решений в условиях неопределенности.

Предположим, что ЛПР рассматривает несколько возможных решений: i = 1, …, m. Ситуация, в которой действует ЛПР, является неопределенной. Известно лишь, что наличествует какой-то из вариантов: j = 1, …, n. Если будет принято i -e решение, а ситуация есть j -я, то фирма, возглавляемая ЛПР, получит доход a_ij. Матрица A = (a_ij) называется матрицей последствий (возможных решений).

В этой ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску.

Оценим риск, который несет i- e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть j -я, то было бы принято решение, дающее доход a_ij.

Значит, принимая i -e решение мы рискуем получить не a_j, а только a_ij, значит принятие i -го решения несет риск недобрать r_ij = a_j - a_ij. Матрица R = (r_ij) называется матрицей рис ков.

Уникальные единичные случайные явления связаны с неопределенностью, массовые случайные явления обязательно допускают некоторые закономерности вероятностного характера.

Критерии Лапласа, Байеса, Вальда, Сэвиджа и Гурвица.

1. Правило Вальда ( правило крайнего пессимизма ). Рассматривая i -e решение будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход a_i Но теперь уж выберем решение i₀ с наибольшим a_i0. Итак, правило Вальда рекомендует принять решение i₀, такое что:

a_i0 = max a_i = max ( min a_ij)

I i j

По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е. a = max ( mina_ij )
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

2. Правило Сэвиджа ( правило минимального риска ). При применении этого правила анализируется матрица рисков R = (r_ij). Рассматривая i -e решение будем полагать, что на самом деле складывается ситуация максимального риска b_i = max [r_ij],

Но теперь уж выберем решение i₀ с наименьшим b_i0. Итак, правило Сэвиджа рекомендует принять решение i₀, такое что:

b_i0 =min b_i = min (max r_ij)

I i j

Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:

a = min(max r_ij)
Kритерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

3. Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение i, на котором достигается максимум:

λ min q_ij + (1-λ ) max q_ij, где 0 < λ < 1

J j

Значение λ выбирается из субъективных соображений. Если λ приближается к 1, то правило Гурвица приближается к правилу Вальда, при приближении λ к 0, правило Гурвица приближается к правилу " розового оптимизма" (догадайтесь сами, что это значит). ( максимакс )

Критерий Гурвица является критерием пессимизма - оптимизма.
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы.

Правило максимизации среднего ожидаемого дохода. Доход, получаемый фирмой при реализации i -го решения, является случайной величиной Q_i с рядом распределения. Правило рекомендует принять решение, приносящее максимальный средний ожидаемый доход.

4а. По критерию Байеса за оптимальные принимается та стратегия (чистая) A_i, при которой максимизируется средний выигрыш a или минимизируется средний риск

r - max∑ (a_ijp_j)

4б. Критерий Лапласа.
Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.:

q₁ = q₂ =... = q_n = 1/n.

11. Понятие о статических играх с полной информацией на примере «Дилеммы заключенного».

Определение. Под статической понимают такую игру, в которой все её участники принимают решения, не зная, какие именно решения принимают другие.

Определение. Под играми с полной информацией понимают игры, в которых каждый из игроков точно знает характеристики других игроков.

Пример. «Дилемма заключенного». Двое заключенных подозреваются в совершении некоторого преступления. Они помещены в разные камеры и не имеют никакой возможности обмениваться информацией. Каждому по отдельности предлагается сознаться (С) к определенному сроку, но можно и молчать (М). Если один сознался, а другой молчит, то сознавшегося освобождают, а молчун получает

максимальный срок, равный 9 годам. Если оба сознались, то обоим срок снижается до 6 лет. Если оба молчат, то вину по основному преступлению доказать невозможно, и они получают по 1 году за незаконное владение оружием. Кратко игра записывается в виде матрицы:

По традиции считается, что игрок 1 выбирает строки, а игрок 2 – столбцы. В каждой клетке матрицы стоят 2 числа: выигрыш игрока 1, выигрыш игрока 2. Матричная форма удобна для конечных игр двух лиц.

⇐ Предыдущая 123 4 5 Следующая ⇒