Задачи теории статистических решений

⇐ ПредыдущаяСтр 21 из 21

Близкой по идеям и методам к теории игр является теория статистических решений. От теории игр она отличается тем, что неопределенная ситуация не имеет конфликтной окраски — никто никому не противодействует, но элемент неопределенности налицо. В задачах теории статистических решений неизвестные условия операции зависят не от сознательно действующего «противника» (или других участников конфликта), а от объективной действительности, которую в теории статистических решений принято называть «природой». Соответствующие ситуации часто называются «играми с природой». «Природа» мыслится как некая незаинтересованная инстанция («равнодушная природа», — по Пушкину), «поведение» которой неизвестно, но, во всяком случае, не злонамеренно.

Казалось бы, отсутствие сознательного противодействия упрощает задачу выбора решения. Оказывается, нет: не упрощает, а усложняет. Правда, принимающему решение в «игре с природой» в самом деле «легче» добиться успеха (ведь ему никто не мешает! ), но ему «труднее» обосновать свой выбор. В игре против сознательного противника элемент неопределенности отчасти снимается тем, что мы «думаем» за противника, «принимаем» за него решение, самое неблагоприятное для нас самих. В игре же с природой такая концепция не подходит: кто ее знает, как она, матушка, себя поведет? Поэтому теория статистических решений — наиболее «шаткая» в смысле рекомендаций наука. Все же у нее есть право на существование и на внимание со стороны лиц, занимающихся исследованием операций.

Рассмотрим игру с природой: у нас (сторона А)имеется m возможных стратегий А₁, А₂, ..., A_m; что касается обстановки, то о ней можно сделать п предположений: П₁, П₂, ..., П_n. Рассмотрим их как «стратегии природы». Наш выигрыш a_ij при каждой паре стратегий A_i, П_j задан матрицей (таблица 28.1).

Требуется выбрать такую стратегию игрока А (чистую или, может быть, смешанную, если это возможно), которая является более выгодной по сравнению с другими.

С первого взгляда кажется, что эта задача похожа на игру двух игроков А и П с противоположными интересами и должна решаться теми же методами. Но это не совсем так. Отсутствие противодействия со стороны природы делает ситуацию качественно другой¹).

Таблица 28.1

П_j A_i	П₁	П₂	…	П_n
A₁ A₂ … A_m	a₁₁ a₂₁ … a_m1	a₁₂ a₂₂ … a_m2	… … … …	a_1n a_2n … a_mn

Давайте поразмышляем над задачей. Самый простой случай выбора решения в игре с природой — это случай когда (на наше счастье) какая-то из стратегий игрока А превосходит другие («доминирует» над ними), как, например, стратегия Л а в таблице 28.2. Здесь выигрыш при стратегии Ад при любом состоянии природы не меньше, чем при других стратегиях, а при некоторых — больше; значит, все ясно, и нужно выбирать именно эту стратегию.

Таблица 23.2

П_j A_i	П₁	П₂	П₃	П₄
A₁ A₂ A₃ А₄

¹) К сожалению, нередки случаи, когда люди, малоискушенные в исследовании операций, встретившись на практике с такой ситуацией, забывают о «равнодушии» природы и сразу же начинают решать задачу методами теории антагонистических игр. Такие рекомендации встречаются и в книгах (преимущественно популярных).

Если даже в матрице игры с природой нет одной доминирующей над всеми другими, все же полезно посмотреть, нет ли в ней дублирующих стратегий и уступающих другим при всех условиях (как мы это делали, упрощая матрицу игры). Но здесь есть одна тонкость: так мы можем уменьшить только число стратегий игрока А, но не игрока П — ему ведь все равно, много или мало мы выиграем! Предположим, что «чистка» матрицы произведена, и ни дублирующих, ни заведомо невыгодных игроку А стратегий в ней нет.

Чем же все-таки руководствоваться при выборе решения? Вполне естественно, должна учитываться матрица выигрышей (а_ij). Однако в каком-то смысле картина ситуации, которую дает матрица (a_ij), неполна и не отражает должным образом достоинств и недостатков каждого решения.

Поясним эту (далеко не простую) мысль. Предположим, что выигрыш a_ij при нашей стратегии A_i и состоянии природы П_j больше, чем при нашей стратегии A_k и состоянии природы П_l: a_ij > a_kl. Но за счет чего больше? За счет того, что мы удачно выбрали стратегию A_i? Необязательно. Может быть, просто состояние природы П_j выгоднее нам, чем П_l. Например, состояние природы «нормальные условия» для любой операции выгоднее, чем «наводнение», «землетрясение» и т. п. Желательно ввести такие показатели, которые не просто давали бы выигрыш при данной стратегии в каждой ситуации, но отражали бы «удачность» или «неудачность» выбора данной стратегии в данной ситуации.

С этой целью в теории решений вводится понятие «риска». Риском r_ij игрока A при пользовании стратегией A_i в условиях П_j называется разность между выигрышем, который мы получили бы, если бы знали условия П_j, и выигрышем, который мы получим, не зная их и выбирая стратегию A_i.

Очевидно, если бы мы (игрок A) знали состояние природы П_j, мы выбрали бы ту стратегию, при которой наш выигрыш максимален. Этот выигрыш, максимальный в столбце П_j, мы уже раньше встречали и обозначили β _о. Чтобы получить риск r_ij, нужно из β _j вычесть фактический выигрыш a_ij:

r_ij = β _j – a_ij.

Для примера возьмем матрицу выигрышей (a_j) (таблица 28.3) и построим для нее матрицу рисков (r_ij) (таблица 28.4).

При взгляде на матрицу рисков (таблица 28.4) нам становятся яснее некоторые черты данной «игры с природой». Так, в матрице выигрышей (a_ij) (таблица 28.3) во второй строке первый и последний элементы были равны друг другу: а₂₁ = а₂₄ = 3.

Таблица 28.3

П_j A_i	П₁	П₂	П₃	П₄
А₁ А₂ А₃
β _j

Таблица 28.4

П_j A_i	П₁	П₂	П₃	П₄
А₁ А₂ А₃

Однако эти выигрыши совсем не равноценны в смысле удачного выбора стратегии: при состоянии природы П₁ мы могли выиграть самое большее 4, и наш выбор стратегии A₂ почти совершенно хорош; а вот при состоянии П₄ мы могли бы, выбрав стратегию А₁, получить на целых 6 единиц больше, т. е. выбор стратегии А₂ очень плох. Риск—это «плата за отсутствие информации»: в таблице 28.4 r₂₁ = 1, r₂₄ = 6 (тогда как выигрыши а_ij в том и другом случае одинаковы). Естественно, нам хотелось бы минимизировать риск, сопровождающий выбор решения.

Итак, перед нами — две постановки задачи о выборе решения: при одной нам желательно получить максимальный выигрыш, при другой — минимальный риск.

Мы знаем, что самый простой случай неопределенности — это «доброкачественная» или стохастическая неопределенность, когда состояния природы имеют какие-то вероятности Q₁, Q₂, .., Q_n и эти вероятности нам известны. Тогда естественно (со всеми оговорками, сделанными по этому поводу в § 5) выбрать ту стратегию, для которой среднее значение выигрыша, взятое по строке, максимально:

(28.2)

Любопытно отметить, что та же стратегия, которая обращает в максимум средний выигрыш, обращает в минимум и средний риск:

(28.3)

так что в случае стохастической неопределенности оба подхода («от выигрыша» и «от риска») дают одно в то же оптимальное решение.

Давайте чуточку «испортим» нашу неопределенность и допустим, что вероятности Q₁, Q₂, …, Q_n в принципе существуют, но нам неизвестны. Иногда в этом случае предполагают все состояния природы равновероятными (так называемый «принцип недостаточного основания» Лапласа), но вообще-то это делать не рекомендуется. Все-таки обычно более или менее ясно, какие состояния более, а какие — менее вероятны. Для того чтобы найти ориентировочные значения вероятностей Q₁, Q₂, ..., Q_n, можно, например, воспользоваться методом экспертных оценок (см. § 5). Хоть какие-то ориентировочные значения вероятностей состояний природы все же лучше, чем полная неизвестность. Неточные значения вероятностей состояний природы в дальнейшем могут быть «скорректированы» с помощью специально поставленного эксперимента. Эксперимент может быть как «идеальным», полностью выясняющим состояние природы, так и неидеальным, где вероятности состоянии уточняются по косвенным данным. Каждый эксперимент, разумеется, требует каких-то затрат, и возникает вопрос: окупаются ли эти затраты возрастанием эффективности? Оказывается, «идеальный» эксперимент имеет смысл проводить только в случае, когда его стоимость меньше, чем минимальный средний риск (см., например, [6]).

Однако не будем больше заниматься случаем стохастической неопределенности, а возьмем случай «дурной неопределенности», когда вероятности состояний природы либо вообще не существуют, либо не поддаются оценке даже приближенно. Ну что же? Обстановка неблагоприятна для принятия «хорошего» решения — попытаемся найти хотя бы не самое худшее.

Здесь все зависит от точки зрения на ситуацию, от позиции исследователя, от того, какими бедами грозит неудачный выбор решения. Опишем несколько возможных подходов, точек зрения (или, как говорят, несколько «критериев» для выбора решения).

1. Максиминный критерий Вальда. Согласно этому критерию игра с природой ведется как игра с разумным, причем агрессивным противником, делающим все для того, чтобы помешать нам достигнуть успеха. Оптимальной считается стратегия, при которой гарантируется выигрыш в любом случае не меньший, чем «нижняя цена игры с природой»:

. (28.4)

Если руководствоваться этим критерием, олицетворяющим «позицию крайнего пессимизма», надо всегда ориентироваться на худшие условия, зная наверняка, что «хуже этого не будет». Очевидно, такой подход — «перестраховочный», естественный для того, кто очень боится проиграть, — не является единственно возможным, но как крайний случай он заслуживает рассмотрения.

2. Критерий минимаксного риска Сэвиджа. Этот критерий — тоже крайне пессимистический, но при выборе оптимальной стратегии советует ориентироваться не на выигрыш, а на риск. Выбирается в качестве оптимальной та стратегия, при которой величина риска в наихудших условиях минимальна:

S = . (28.5)

Сущность такого подхода в том, чтобы всячески избегать большого риска при принятии решения. В смысле «пессимизма» критерий Сэвиджа сходен с критерием Вальда, но самый «пессимизм» здесь понимается по-другому.

3. Критерий пессимизма-оптимизма Гурвица. Этот критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом («всегда рассчитывай на худшее! »), ни крайним, легкомысленным оптимизмом («авось кривая вывезет! »). Согласно этому критерию выбирается стратегия из условия

, (28.6)

где — «коэффициент пессимизма», выбираемый между нулем и единицей. При = 1 критерий Гурвица превращается в критерий Вальда; при = 0 — в критерий «крайнего оптимизма», рекомендующий выбрать ту стратегию, при которой самый большой выигрыш в строке максимален. При 0 < < 1 получается нечто среднее между тем и другим. Коэффициент у, выбирается из субъективных соображений — чем опаснее ситуация, чем больше мы хотим в ней «подстраховаться», чем менее наша склонность к риску, тем ближе к единице выбирается .

При желании можно построить критерий, аналогичный Н, исходя не из выигрыша, а из риска, но мы на этом не будем останавливаться.

«Что же, — спросит читатель, — выбор критерия — субъективен, выбор коэффициента — тоже субъективен, значит и решение тоже принимается субъективно, т. е., грубо говоря, произвольно? Где же тут наука? При чем тут математика? Может быть, лучше было бы просто, без математических затей, выбрать решение по своему произволу? »

В какой-то мере читатель прав — выбор решения в условиях неопределенности всегда условен, субъективен. И все же в какой-то (ограниченной) мере математические методы полезны и тут. Прежде всего, они позволяют привести игру с природой к матричной форме, что далеко не всегда бывает просто, особенно когда стратегий много (в наших примерах их было очень мало). Кроме того, они позволяют заменить простое лицезрение матрицы выигрышей (или рисков), от которого, когда матрица велика, может просто «зарябить в глазах», последовательным численным анализом ситуации с разных точек зрения, выслушать рекомендации каждой из них и, наконец, остановиться на чем-то определенном. Это аналогично обсуждению вопроса с различных позиций, а в споре, как известно, рождается истина. Так что не ждите от теории решений окончательных, непререкаемых рекомендаций — единственное, чем она может помочь — это советом...

Если рекомендации, вытекающие из различных критериев, совпадают — тем лучше, значит, можно смело выбрать рекомендуемое решение: оно, скорее всего «не подведет». Если же, как это часто бывает, рекомендации противоречат друг другу, не надо забывать, что у нас голова на плечах. Задумаемся над этими рекомендациями, выясним, насколько к разным результатам они приводят, уточним свою точку зрения и произведем окончательный выбор. Не надо забывать, что в любых задачах обоснования решений некоторый произвол неизбежен — хотя бы при построении математической модели, выборе показателя эффективности. Вся математика, применяемая в исследовании операций, не отменяет этого произвола, а позволяет только «поставить его на свое место».

Таблица 28.5

П_j A_i	П₁	П₂	П₃
А₁ А₂ А₃ А₄

Рассмотрим элементарный пример «игры с природой» 4× 3, матрица выигрышей которой (а_ij) дана в таблице 28.5. Поглядим на матрицу и попробуем сразу, без расчетов, указать, какой стратегией пользоваться? Несмотря на малый размер матрицы, это не так-то легко.

Теперь попробуем помочь себе, пользуясь критериями Вальда, Сэпиджа и Гурвица, причем в последнем возьмем = 0, 6 (перевес чуть-чуть в сторону пессимизма). Что-то они нам скажут?

1. Слово имеет критерий Вальда. Подсчитаем минимумы по строкам (см. таблицу 28.6) и выберем ту стратегию, при которой минимум строки максимален (равен 25). Это—стратегия A₃.

Таблица 28.6

П_j A_i	П₁	П₂	П₃	α _i
А₁ А₂ А₃ А₄

2. Слово имеет критерий Савиджа. Перейдем от матрицы выигрышей (таблица 28.6) к матрице рисков (таблица 28.7), в правом дополнительном столбце запишем максимальное в строке значение риска γ _i.

Из чисел правого столбца минимальное (60) соответствует стратегиям А₂ и А₃; значит, обе они оптимальны по Сэвиджу.

Таблица 28.7

П_j A_i	П₁	П₂	П₃	γ _i
А₁ А₂ А₃ А₄

3. Слово имеет критерии Гурвица (при = 0, 6). Опять перепишем таблицу 28.5, но на этот раз в правых трех дополнительных столбцах поставим: минимум строки а_i, ее максимум , и величину h_i = α _i + (1- ) округленную до целых единиц (см. таблицу 28.8).

Максимальное значение h_i = 47 соответствует стратегии A₃.

Итак, в данном случае все три критерия согласно говорят в пользу стратегии А₃, которую есть все основания выбрать.

Таблица 28.8

П_j A_i	П₁	П₂	П₃	α _i		h_i
А₁ А₂ А₃ А₄

А теперь возьмем случай, когда между критериями возникает «спор». Матрица выигрышей (a_ij) с заранее выписанными столбцами минимумов строк α _i, максимумами строк и значениями h_i (при = 0, 6) дана в таблице 28.9.

По критерию Вальда оптимальной является стратегия A₁, по критерию Гурвица с = 0, 6 — стратегия

Таблица 28.9

П_j A_i	П₁	П₂	П₃	П₄	α _i		h_i
А₁ А₂ А₃

А₃. Посмотрим, что скажет критерий Сэвиджа. Матрица рисков с дополнительным столбцом, содержащим максимумы строк γ _i, дана в таблице 28.10.

Минимальным в последнем столбце является число 38, так что критерий Сэвиджа, так же как и критерий Гурвица, «голосует» за стратегию А₃.

Над этим стоит поразмыслить. Если мы очень боимся малого выигрыша «11», который нас может постигнуть при стратегии А₃, ну что же — выберем стратегию A₁, рекомендуемую крайне осторожным критерием Вальда, при котором мы, по крайней мере, можем себе гарантировать выигрыш «19», а может быть, и больше. Если же наш пессимизм не так уж мрачен, пожалуй, надо остановиться на стратегии А₃, рекомендуемой двумя из трех критериев.

Таблица 28.10

П_j A_i	П₁	П₂	П₃	П₄	γ _i
А₁ А₂ А₃

Читатель, конечно, заметил, что тут мы говорим на каком-то нематематическом языке, а скорее на языке «рассуждений и здравого смысла». Что поделаешь — в неопределенности ничего хорошего нет, и при отсутствии нужной информации никакая математика не поможет нам в однозначном выборе «оптимального» решения. Жизнь есть жизнь, будущее полно неопределенностей, и нам зачастую приходится принимать отнюдь не строго оптимальные, а «приемлемые» решения, при обсуждении которых разные «подходы» и «критерии» выступают в качестве как бы спорящих сторон.

В заключение отметим следующее: все три критерия (Вальда, Сэвиджа и Гурвица) были сформулированы нами для чистых стратегий, но каждый из них может быть распространен и на смешанные, подобно тому, как мы это делали в теории игр. Однако смешанные стратегии в игре с природой имеют лишь ограниченное (главным образом, теоретическое) значение. Если в игре против сознательного противника смешанные стратегии иногда имеют смысл как «трюк», вводящий в заблуждение противника, то в игре против «равнодушной природы» этот резон отпадает. Кроме того, смешанные стратегии приобретают смысл только при многократном повторении игры. А если уж мы ее повторяем, то неизбежно начинают вырисовываться какие-то вероятностные черты ситуации, и мы ими можем воспользоваться для того, чтобы применить «стохастический подход» к задаче, а он, как мы знаем, смешанных стратегий не дает. Кроме того, в ситуациях с «дурной» неопределенностью, когда нам мучительно не хватает информации, главная задача — эту информацию получить, а не выдумывать хитроумные методы, позволяющие без нее обойтись. Одна из основных задач теории статистических решений — это как раз планирование эксперимента, цель которого — выяснение или уточнение каких-то данных. На вопросах планирования эксперимента мы здесь останавливаться не будем: это отдельный предмет, требующий серьезного внимания. По этому вопросу мы отошлем читателя к специальным руководствам [29, 30], а также к интересно написанной популярной книге [27]. Основной принцип теории планирования эксперимента состоит в том, что любое принятое заранее решение должно пересматриваться с учетом полученной новой информации,

* * *

Таким образом, наш краткий обзор, посвященный задачам, принципам и методологии исследования операции, закончен. В нем автор стремился ознакомить читателя не только с возможностями, но и с ограничениями математических методов, применяемых для обоснования решений. Главное — ни один из этих методов не избавляет человека от необходимости думать. Но не просто думать, а пользоваться при этом математическими расчетами. Помня, что, по меткому выражению Хемминга, — «главная цель расчетов — не цифры, а понимание».

⇐ Предыдущая 12 13 14 15 16 17 18 19 2021