Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Решение матричной игры mxn (общий случай).



Здесь матричная игра сводится к задаче линейного программирования. Пусть дана игра с матрицей:

Все элементы матрицы при этом считаются неотрицательными; Тогда цена игры будет положительной, v> 0. Вводятся новые переменные:

Теперь матричная игра сводится к следующей задаче линейного программирования относительно 1-го игрока:

или к двойственной ей – для 2-го игрока:

 

Понятие об игре с природой. Особенности, способы представления.

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под " природой " понимается совокупность неопределенных факторов; влияющих на эффективность принимаемых решений. Безразличие природы к игре (выигрышу) к возможности получения экономистом (статистиком) дополнительной информации о ее состоянии отличают игру экономиста с природой от обычной матричной игры, в которой принимают участие два сознательных игрока.

Данный тип задач относится к задачам принятия решений в условиях неопределенности.

Предположим, что ЛПР рассматривает несколько возможных решений: i = 1, …, m. Ситуация, в которой действует ЛПР, является неопределенной. Известно лишь, что наличествует какой-то из вариантов: j = 1, …, n. Если будет принято i -e решение, а ситуация есть j -я, то фирма, возглавляемая ЛПР, получит доход aij. Матрица A = (aij) называется матрицей последствий (возможных решений).

В этой ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску.

Оценим риск, который несет i- e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть j -я, то было бы принято решение, дающее доход aij.

Значит, принимая i -e решение мы рискуем получить не aj, а только aij, значит принятие i -го решения несет риск недобрать rij = aj - aij. Матрица R = (rij) называется матрицей рис ков.

Уникальные единичные случайные явления связаны с неопределенностью, массовые случайные явления обязательно допускают некоторые закономерности вероятностного характера.

 

 

Критерии Лапласа, Байеса, Вальда, Сэвиджа и Гурвица.

1. Правило Вальда ( правило крайнего пессимизма ). Рассматривая i -e решение будем полагать, что на самом деле ситуация складывается самая плохая, т.е. приносящая самый малый доход ai Но теперь уж выберем решение i0 с наибольшим ai0. Итак, правило Вальда рекомендует принять решение i0, такое что:

ai0 = max ai = max ( min aij )

I i j

По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е. a = max ( minaij )
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

2. Правило Сэвиджа ( правило минимального риска ). При применении этого правила анализируется матрица рисков R = (rij). Рассматривая i -e решение будем полагать, что на самом деле складывается ситуация максимального риска bi = max [rij],

Но теперь уж выберем решение i0 с наименьшим bi0. Итак, правило Сэвиджа рекомендует принять решение i0, такое что:

bi0 =min bi = min (max rij)

I i j

Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:

a = min(max rij)
Kритерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

3. Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение i, на котором достигается максимум:

λ min qij + (1-λ ) max qij, где 0 < λ < 1

J j

Значение λ выбирается из субъективных соображений. Если λ приближается к 1, то правило Гурвица приближается к правилу Вальда, при приближении λ к 0, правило Гурвица приближается к правилу " розового оптимизма" (догадайтесь сами, что это значит). ( максимакс )

Критерий Гурвица является критерием пессимизма - оптимизма.
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы.

Правило максимизации среднего ожидаемого дохода. Доход, получаемый фирмой при реализации i -го решения, является случайной величиной Qi с рядом распределения. Правило рекомендует принять решение, приносящее максимальный средний ожидаемый доход.

4а. По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск

r - max∑ (aijpj)

4б. Критерий Лапласа.
Если вероятности состояний природы правдоподобны, для их оценки используют принцип недостаточного основания Лапласа, согласно которого все состояния природы полагаются равновероятными, т.е.:

q1 = q2 =... = qn = 1/n.

 

11. Понятие о статических играх с полной информацией на примере «Дилеммы заключенного».

Определение. Под статической понимают такую игру, в которой все её участники принимают решения, не зная, какие именно решения принимают другие.

Определение. Под играми с полной информацией понимают игры, в которых каждый из игроков точно знает характеристики других игроков.

Пример. «Дилемма заключенного». Двое заключенных подозреваются в совершении некоторого преступления. Они помещены в разные камеры и не имеют никакой возможности обмениваться информацией. Каждому по отдельности предлагается сознаться (С) к определенному сроку, но можно и молчать (М). Если один сознался, а другой молчит, то сознавшегося освобождают, а молчун получает

максимальный срок, равный 9 годам. Если оба сознались, то обоим срок снижается до 6 лет. Если оба молчат, то вину по основному преступлению доказать невозможно, и они получают по 1 году за незаконное владение оружием. Кратко игра записывается в виде матрицы:

По традиции считается, что игрок 1 выбирает строки, а игрок 2 – столбцы. В каждой клетке матрицы стоят 2 числа: выигрыш игрока 1, выигрыш игрока 2. Матричная форма удобна для конечных игр двух лиц.

 


Поделиться:



Популярное:

  1. II зимние Олимпийские игры. Санкт-Мориц, 1928г. 11 – 19 февраля
  2. III. Решение логических задач с помощью рассуждений
  3. XXI зимние Олимпийские игры. Ванкувер, 2010г. 12 – 28 февраля
  4. Анализ информации, получаемой от САРП. Режимы истинного и относительного движения, их достоинства и недостатки. Проигрывание маневра. Возможная опасность чрезмерного доверия САРП.
  5. Бюджет, утверждающийся решением маслихата Республики Казахстан
  6. Во-вторых, роса создает своеобразную смазку. Эта смазка уменьшает силу трения при обратном двиПРАВИЛА ИГРЫ
  7. Воскрешение Лазаря (Иоанна 11:1-46).
  8. Глава 9. Обзор выигрышных стратегий и техник копирайтинга
  9. Да, правила игры действительно менялись на корню. Удар приходился по трем китам незыблемого мира бюрократии: способ назначений, формирование зарплаты и система стимулирования.
  10. Действиями оперативных аппаратов, направленными на решение стоящих перед ними задач
  11. Динамические игры с полной и совершенной информацией. Развернутая форма игры. Понятие о методе обратной индукции (игра «Террорист»).
  12. ДОПОЛНИТЕЛЬНЫЕ ИГРЫ И УПРАЖНЕНИЯ


Последнее изменение этой страницы: 2016-05-30; Просмотров: 1172; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.014 с.)
Главная | Случайная страница | Обратная связь