Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Оптимисты и пессимисты в мире автоматов



Рассмотрим еще один способ введения неоднород­ности в коллектив автоматов, решающий некоторую задачу. Как всегда, начнем с некоторой содержатель­ной интерпретации задачи.

Пусть некто решил жениться. Но поскольку же­нитьба — шаг серьезный, то жених намеревается принять решение только после того, как он будет иметь некоторую информацию о своей будущей спут­нице жизни. Пусть для него жизненно важны две

100

вещи: наличие квартиры у его избранницы и умение ее готовить вкусные обеды. Такой меркантилизм не должен смущать читателя. Авторы книги вовсе не идеализируют героя этой истории, а может быть, и осуждают его за невнимание к вещам куда более серьезным, чем жилплощадь и пища. Но что подела­ешь. Иногда для наглядности приходится мириться с некоторыми недостатками героя примера. Степень информированности жениха об интересующих его предметах будем выражать следующим образом. Если квартира у избранницы есть, то Х1 = 1, в про­тивном случае Х1 = 0. Если же жених пока не обла­дает сведениями о наличии у своей избранницы от­дельной квартиры, то полагаем X1 = 0,5. Аналогично считаем, что умение готовить обеды приводит к Х2 = 1, неумение — к Х2 = 0, а значение Х2 = 0,5 свидетельствует об отсутствии у жениха необходимой информации. Введем еще переменную Y, которая бу­дет отражать решение жениха. Если он твердо решил жениться, то Y=1. Значение Y = 0 свидетельствует об его отказе от избранницы, а Y = 0,5, означает, что жених колеблется, не зная, что ему делать.

Составим отражающую эту ситуацию табл. 3.4. Она задает пять функций троичной логики, завися­щих от двух аргументов X1 и Х2. Наиболее проста из них функция Y1 Как видно из таблицы, Y1=min(X1,X2). В логике такую функцию принято называть конъюнкцией. Если жених использует для принятия своих решений эту функцию, то он согла­шается на брак только при условии выполнения двух своих требований: наличия квартиры и умения гото­вить вкусные обеды. Если хотя бы одно из этих усло­вий не выполнено, то он отказывается от брака. При наличии неопределенности в условиях, когда осталь­ные требования выполнены, или в условиях полной неопределенности (X1 = 0,5; X2 = 0,5) жених медлит с решением и не говорит ни да, ни нет. По-видимому, он ждет новой порции информации. Такое поведение жениха можно назвать объективным или бесстраст­ным.

Остальные функции в нашей таблице описывают способ принятия решений несколько иного типа. Функции Y2 и Yз отражают пессимистическую точку зрения. Жених такого типа всегда предполагает, что мир устроен не лучшим образом и всегда надо ждать

101

 

Таблица 3.4

           X1            X2            Y1            Y2            Y3            Y4            Y5
0 0 0 0 0 0 0
0 0,5 0 0 0 0 0
0 1 0 0 0 0 0
0,5 0 0 0 0 0 0
0,5 0,5 0,5 0 0 0,5 1
0,5 1 0,5 0 0,5 1 1
1 0 0 0 0 0 0
1 0,5 0,5 0 0,5 1 1
1 1 1 1 1 1 1

 

от него подвоха. Поэтому он склонен интепретировать незнание как отрицательную оценку. Такой же­них — пример явного пессимиста. При этом, если он руководствуется функцией Y2, то его пессимизм до­стигает крайней степени. При наличии любой неопре­деленности происходит отказ от дальнейшего накоп­ления информации, и общение жениха с невестой прекращается. В случае функции Yз пессимизм не столь категоричен. Лишь в случае полной неопреде­ленности жених прекращает свои попытки устроить свою личную жизнь. При частичной неопределенно­сти он стремится продолжить сбор интересующей его информации.

Оставшиеся две функции характеризуют противопо­ложный взгляд на мир. Это взгляд оптимиста, всегда надеющегося, что природа принесет ему неожидан­ную удачу. Оптимист, руководствующийся в своем выборе функцией Y5, представляет собой случай крайнего (пожалуй, даже «оголтелого») оптимиста, ибо в своих рассуждениях он заменяет все оценки 0,5 оценками, равными 1. Функция Y4 характеризует более осторожного оптимиста, который склонен заме­нять единицей не более одной оценки 0,5.

Таким образом, подобно рангам рефлексии можно ввести ранги пессимизма — оптимизма. Будем счи­тать, что бесстрастный жених имеет ранг, равный нулю. Жених, заменяющий т и более оценок 0,5 на 0, имеет ранг пессимизма п —m+1, где п —число, учитываемых условий, а жених, заменяющий т и ме­нее оценок 0,5 на 1,—ранг оптимизма т. В случае двух аргументов, который отражен в нашей таблице,

102

возможны ранги пессимизма и оптимизма 1 и 2. Число возможных рангов растет линейно с ростом числа аргументов n.

При принятии своего решения о браке жених мо­жет руководствоваться и несколько иными соображе­ниями, чем было описано выше. Весьма возможно, что он не такой уж и экстремист и готов жениться и в том случае, когда у его избранницы есть либо квартира, либо она относится к числу хозяек, готовя­щих весьма вкусные обеды. Наличие того и другого одновременно рассматривается таким претендентом на ее руку как редкая удача. Описание процесса принятия решений о браке таким женихом можно представить в виде табл. 3.5.

Таблица 3.5

X1 X2 Z1 Z2 Z3 Z4 Z5
О 0 0 0 0 0 0
0 0,5 0,5 0 0,5 1 1
0 1 1 1 1 1 1
0,5 0 0,5 0 0,5 1 1
0,5 0,5 0,5 0 0,5 0,5 1
0,5 1 1 1 1 1 1
1 0 1 I 1 1 1
1 0,5 1 1 1 1 1
1 1 1 1 1 1 1

 

 Функция Z1=max(X1,Х2) в логике называется дизъюнкцией. Она определяет бесстрастный выбор жениха, согласного на выполнение хотя бы одного своего требования. Функции Z2 и Z3, отражают пес­симистическую точку зрения, a Z4 и Z5 оптимисти­ческую точку зрения при дизъюнктивном выборе. По­добно тому как при конъюнктивном выборе мы ввели в рассмотрение ранги пессимизма —оптимизма, их можно ввести и при дизъюнктивном выборе. Введен­ные нами функции, кроме Y1 и Z1, можно соответственно называть пессимистическими или оптимистиче­скими квазиконъюнкциями и квазидизъюнкциями тех или иных рангов пессимизма — оптимизма.

Для иллюстрации воздействия введенных нами ха­рактеристик на коллективное поведение автома­тов рассмотрим модель, являющуюся, известным

103

 

обобщением модели игры в размещения, которая обсуждалась для однородного коллектива автоматов в начале данной главы.

Каждое утро пастух, выгоняющий стадо на выпас, решает довольно сложную оптимизационную задачу:

куда гнать стадо? Он знает п участков, пригодных для выпаса. Но и другие пастухи, пасущие свои стада в том же районе, осведомлены о них не хуже его. И вполне может случиться, что, пригнав свое стадо в прекрасную долину недалеко от деревни, он увидит, что кто-то уже опередил его еще накануне и вся пища уже уничтожена. А в более высокогорной котловине травы может быть совсем немного, ибо дожди в по­следнее время были редки и трава, по всей видимости, не набрала там силу. Есть, правда еще одно прекрасное место, но там почти наверное придется де­лить его с соседями и животным его стада придется съесть меньше, чем они бы смогли.

Как же пастуху добиться своей цели: увеличить живой вес своего стада? Говорят, что в соседнем рай­оне пастухи договорились между собой и составили план выпаса. Но в их районе об этом только погова­ривают. И о чем только думает районное начальство, которое должно заботиться о суммарном весе всего поголовья животных в стадах района?

Оставим на время пастуха с его нелегкими раз­думьями. Формализуем постановку задачи о поиске наиболее благоприятного места для выпаса стада. Вместо пастуха с его стадом будем рассматривать некий автомат, который имеет п различных действий, смысл которых сводится к выбору одного из п участ­ков для выпаса. Каждый такой участок автомат ап­риорно оценивает двумя оценками: оценкой вероят­ности наличия в этом месте достаточного количества пищи для того, чтобы животные не голодали X1i (i здесь номер участка), и оценкой посещаемости уча­стка, отражающей прогноз о среднем числе автома­тов, которые могут одновременно с ним оказаться на участке с номером i(X2i). Эти две оценки могут фор­мироваться за счет накопления некоторого предше­ствующего опыта, знания о характере участков и по­годных условий или на основании «голого эмпириз-ма». Несколько огрубляя задачу, будем считать, что все оценки имеют троичный характер. Тогда X1i=1

104

означает, что на участке i имеется достаточно пищи для прокорма стада, X1i=" 0 — что пищи на участке i явно мало, a X1i==0,5 — что у автомата нет информации о вероятности нахождения на участке i достаточ­ного количества пищи. Вторые оценки имеют следующий смысл: X2i== 1 — на участке с номером i предполагается такое количество одновременно пасущихся автоматов, которое при равном распределении ресур­сов (пропорционально числу пасущихся автоматов, пришедших на этот участок) обеспечивает нашему автомату необходимое количество пищи; X2i==0 озна­чает, что пищи при дележе с соседями по участку будет явно недостаточно, а X2i==0,5 свидетельствует об отсутствии информации по этому вопросу.

Таким образом, при принятии решения о выборе участка автомат может действовать как наш гипоте­тический жених, принимающий решение о браке. Что же показали результаты моделирования на ЭВМ? Коллектив автоматов выходил на оптимум с точки зрения районного начальства лишь при определенных распределениях рангов пессимизма — оптимизма. При этом, если в модели допускалось «вымирание» автоматов — т. е. они в течение некоторого числа тактов распределений по участкам не набирали по­рогового значения количества пищи, то с течением времени моделирования в коллективе возрастал про­цент умеренных пессимистов, которые оказывались более жизнеспособными, чем оптимисты всех рангов. Процентный состав пессимистов и оптимистов в кол­лективе, распределение их по рангам во многом за­висят от истинных параметров среды. Но в любом случае крайние пессимисты и оптимисты приносят мало пользы коллективу и при наличии вымирания быстро из него исчезают. Наиболее устойчивыми в среднем оказываются совокупности, в которых около 40 % бесстрастных автоматов, около 40 % умеренных пессимистов и 20 % умеренных оптимистов.

Этот феномен связан с тем, что в однородных кол­лективах без организации какого-либо взаимодей­ствия между автоматами (например, общей кассы или случайного парного взаимодействия) все автоматы кучно переходят от одного выбора к дру­гому. Если же в коллективе имеются различные автоматы, то пессимисты и оптимисты выбирают те

105

 

участки, которые не выбрали бы бесстрастные автоматы, что приводит к «размазыванию» коллектива автоматов по участкам. Тот же эффект, как было показано, достигается введением общей кассы в од­нородном коллективе автоматов, решающем задачу размещения.

В рассмотренной нами модели «игроки» оперировали не с самими значениями тех или иных параметров среды, а с их оценками. В одном из эксперимен­тов, например, предлагалось, что X1i==1, если вероят­ность наличия нужного количества пищи на участке с номером i больше 0,75. Если она была меньше 0,25, то полагалось, что X1i=0. В остальных случаях принималось, что X1i=0,5. Для второго параметра X2i=1> если на i-м участке было менее 1/4 всех стад, имеющихся в районе. А когда это количество увеличивалось до 3/4 или превосходило это число, полагалось, что X2i=0. В остальных случаях оценка второго параметра была равна 0,5. Субъективизм. этих границ очевиден. Люди в своей практике при­нятия решения в конфликтных ситуациях используют многие виды таких субъективных оценок.

На рис. 3.18 показаны кривые, характеризующие отношения игрока-человека к получаемым им в про­цессе игры выигрышам. По оси абсцисс на графиках отложены величины выигрыша — проигрыша игроков, а по оси ординат—субъективные оценки этих значений игроком. Названия, приведенные на рисун­ке, говорят сами за себя. Дж. Кемени и Дж. Томпсон, проанализировав эти функции оценок, показали, что в коллективе из игроков с различной психологи­ческой доминантой решения, принимаемые ими в одних и тех же условиях, могут быть весьма различными. Приведем одну из моделей, предложенную ими.

Пусть некто устраивает лотерею. Он выбирает такую стоимость одного лотерейного билета s, при­обретя который участник лотереи может с вероят­ностью g выиграть некоторую сумму l. Математиче­ское ожидание проигрыша для устроителя лотерея равно g{-l)+(l-g)s. Конечно, он не захочет про­игрывать и сделает так, чтобы выполнялось неравен­ство       0<g<s/(l+s)

106

 

Величина g мала, так как l велико по сравнению с s. Пусть человек, купивший лотерейный билет, оцени­вает свои выигрыши и проигрыши с помощью одной из тех оценочных функций f, которые показаны на рис. 3.18. Тогда он оценивает математическое ожидание полезности покупки лотерейного билета как  

 

Естественно считать, что человек покупает лоте-рейный билет только в том случае, когда эта оценка положительна. Тогда разные типы игроков примут

107

различные решения. Легко представить себе, что при определенных значениях s, l и g их решения распре­делятся следующим образом: решение играть примут азартный игрок и бедняк; заурядный игрок будет играть в лотерею лишь при малых значениях l, а от­чаянный при l, большем, чем абсцисса точки раз­рыва; объективный, осторожный, выигрывающий и богач откажутся от участия в лотерее; заурядный откажется при больших значениях l, а отчаянный — если l меньше абсциссы точки разрыва на графике его оценочной функции.

Материал двух последних параграфов свидетель­ствует о том, что в моделях коллективного поведения введение неоднородности служит тем же целям, что и дополнительные механизмы по целенаправленному воздействию среды на участников коллектива. Поэто­му можно считать, что разнородность, столь часто встречающаяся в природе и технических системах, не является чем-то случайным, «нарушающем гармо­нию», а отражает фундаментальную идею о лучшем функционировании разнородных коллективов, решаю­щих общую задачу в условиях децентрализации, по сравнению с однородными коллективами, решающи­ми ту же задачу.


Еще три простые модели

D животном мире и мире растений неоднород­ность помогает регулировать соотношение тех или иных видов в биоценозах и фитоценозах. В качестве иллюстрации приведем две простенькие модели, хо­рошо известные в экологии.

На рис. 3.19,а показана ситуация, сложившаяся в среде, где живут бактерии, изображенные в виде овалов. В некоторые из них проникли частицы, назы­ваемые плазмидами. Эти органические образования стоят на грани живого и неживого. Плазмиды самовоспроизводятся и имеют обмен с внешней для них средой. Этой средой служат для них тела бактерий. В условиях неперенаселенности, когда бактерии име­ют достаточное количество пищи, плазмиды выделя­ют в окружающую их среду вещество, называемое иммунопротеином. На рис. 3.19, а плазмиды показаны зачерненными кружками, а иммунопротеин — точка­ми. Но вот количество бактерий увеличилось на

108

столько, что они начинают испытывать голод. Голодают и плазмиды. Это приводит к тому, что плазмиды, оказавшиеся за граничным значением голодания, начинают вырабатывать не иммунопротеин, безвредный для бактерии-хозяина, а комицин. На рис. 3.19,6 показана такая ситуация, когда одна из плазмид начинает вырабатывать комицин (зачерненные квад­ратики в теле бактерии). Комицин убивает бактерию и плазмиду. Но комицин, попадая во внешнюю сре­ду, убивает в определенной окрестности все бактерии, не содержащие в своем теле иммунопротеин (рис. 3.19, б), после чего в среде остается уже мень­шее число бактерий (рис. 3.19,г), Если их все еще слишком много, то найдется такая плазмида, кото­рая опустится ниже «порога жизни" и начнет сра­батывать комицин, что приведет к дальнейшему со­кращению популяции бактерий. Плазмиды же де­лятся вместе с бактериями только тогда, когда пищи становится «слишком много", выше некоторого

109

 

порога, превышение которого вызывает деление у «чистых» бактерий.

Эту реальную модель саморегулирования численности организмов можно представить и в виде неод­нородного коллектива автоматов, живущего в некоторой среде, в которой поддерживается постоянный уровень пищи. Вся пища делится поровну между чле­нами коллектива. Автоматы - плазмидоносители делят­ся в том случае, когда количество поглощаемой ими пищи превышает некоторый порог Q1. Остальные автоматы производят деление при более низком по­роге Q2. Когда автомат - плазмидоноситель получает пищи меньше, чем Q3 < Q2, то он погибает и унич­тожает все обычные автоматы, которые находятся от него на определенном расстоянии (например, на торе в клетках, отстоящих от данной на расстоянии, не превышающем 5-кратного размера клетки). Для того чтобы одновременно не погибли все автоматы - плазмидоносители в модели, случайным образом выби­рается один из них. Если после этого уровень пищи все еще не превосходит Q3, то случайным образом выбирается еще один автомат, способный уменьшить величину популяции. Моделирование такого процесса на ЭВМ показало почти точное совпадение процесса регулирования с тем, что происходит в природе у бактерий.

Вторая модель регулирования численности чуть-­чуть сложнее. Пусть члены коллектива могут исполь­зовать друг относительно друга при столкновениях (например, при случайных парных взаимодействиях) две стратегии: агрессивную и угрожающую. Если оба члены коллектива применяют агрессивную стратегию, то это напоминает драку двух петухов или схватку оленей. Оба противника наращивают усилия и не же­лают уступать друг другу. И лишь гибель или позор­ное бегство одного из них выявляет победителя. Если один из членов коллектива применяет агрессивную стратегию, а другой лишь угрожающую, то при дости­жении определенного уровня агрессивности тот, кто придерживался угрожающей стратегии, спасается бег­ством. Встреча собаки и кошки — яркий пример этой ситуации. Собака сначала всегда придерживается аг­рессивной стратегии, а кошка отвечает ей угрожаю­щей (выгибает спину, издает шипение и т. д.). Если собака пугается и переходит на угрожающую страте-

110

гию, то после взаимных угрожающих поз животные расходятся. Если же собака продолжает наращивать усилия в рамках агрессивной стратегии, то кошка спасается бегством.

Противники с самого начала могут оба придержи­ваться угрожающих стратегий. Они принимают раз­личные ритуальные угрожающие позы, и этот про­цесс продолжается до тех пор, пока один из них не признает себя побежденным (для этого он, как пра­вило, принимает специальную ритуальную позу под­чинения). Подобное соперничество можно наблюдать у собак, серых гусей, тетеревов и многих других животных.

Рассмотрим модель подобного соперничества. Агрессивную и угрожающую стратегии будем обо­значать соответственно буквами А и У. Составим таблицу, в которой оценены все возможные комбина­ции парного соперничества (табл. 3.6).

Таблица 3.6

                        Вто рой
        А У
Первый А (-5, -5) (+10, 0)
    У (0, +10) (+2, +2)

 

На пересечении строк и столбцов таблицы стоят пары чисел. Это условные оценки выигрышей — про­игрышей соперников при выборе той или иной стра­тегии поведения. Если, например, один из них (пер­вый) выбрал стратегию А, а второй — стратегию У, то первый получает выигрыш, равный 10 условным единицам, а второй остается при «своем интересе». Поясним теперь, как возникли эти оценки. Сначала мы условно оцениваем победу при соперничестве как выигрыш, равный +10, серьезное повреждение или гибель, которые могут произойти при наращивании усилий в стратегиях А, оцениваем как (—20). По­скольку при встрече двух агрессоров исход поединка мы считаем равновероятным, то математические ожидания поощрения — наказания при паре страте­гий (А,А) есть 0,5*10+0,5*(—20)= --5. Аналогич­но для встречи со стратегиями (У,У) это ожидание

111

 

вычисляется как 0,5*10+(—3)=2. Здесь оценка (—3) есть плата за нервное напряжение в длитель­ном конфликте при стратегии У. Эта стратегия приводит к значительному расходу нервных и других ре­сурсов животного. Таким образом, таб. 3,6 задает платежную матрицу некоторой игры.

Рассмотрим организм, который может по своему желанию менять свою стратегию в зависимости от обстоятельств. Этот организм можно смоделировать в виде автомата с двумя состояниями, соответствую­щими стратегиям А и У, использование которых оп­ределяется вероятностями РA и Ру . При этом, ко­нечно, РA+Ру=1. Рассмотрим коллектив, состоя­щий из подобных автоматов, и предположим, что он неоднороден, причем неоднородность задается раз­личными значениями РA. В частности, при РA==1 автомат является чистым агрессором. Он во всех случаях жизни придерживается стратегии А. При РA==0 автомат всегда придерживается стратегии У.

Как и в предшествующей модели, зададим неко­торые пороги Q1 и Q2. Если автомат накапливает выигрыш, превышающий Q1, то он «размножается». Вместо него появляются два автомата с тем же зна­чением РA у каждого. Если же накопленное нака­зание становится по абсолютной величине больше Q2, то автомат «вымирает». Возникает вопрос об оптимальном значении РA при случайном парном взаимодействии автоматов в коллективе. При моде­лировании на ЭВМ было показано, что коллектив из достаточно большого количества описанных автома­тов, в котором значения РA имели распределение, близкое к равномерному, эволюционирует в сторону однородного коллектива, для которого РA прибли­жается к значению 8/13. Из теории игр следует, что смешанная стратегия, при которой стратегии А и У выбираются с вероятностями 8/13 и 5/13, является для игрока в определенном смысле наилучшей. Она обеспечивает игроку максимально возможный гаран­тированный выигрыш (при самых наихудших для него действиях противника). Интересно было бы по­лучить экспериментальные данные из наблюдений за животными (например, кошками), которые давали бы оценки частоты выбора ими стратегий А и У при встрече с противником, равным по силе. К сожале­нию, такими данными мы не располагаем.

112

Вернемся к тому, с чего мы начали настоящую главу. События в Арбатове побудили нас рассмотреть ряд моделей коллективного взаимодействия и согла­шений. Эти модели, будь дети лейтенанта Шмидта образованными в области децентрализованного уп­равления, позволили бы им извлекать из участков куда больший доход, чем тот, которого они достигли. И в этом сила моделей, с которыми мы познако­мились.

В заключение укажем еще на одну модель рас­пределения участков, которой можно было бы вос­пользоваться при экспансии детей лейтенанта Шмид­та на территориях, на которых они никогда не быва­ли и сведений о которых у них нет. Такие участки кажутся равноценными, и распределение их вряд ли кого-нибудь взволнует. Жеребьевка их чисто фор­мальна. Но вот участники дележа разъехались на места и начали «работу». Через некоторое время они уже могут оценить средний доход с доставшегося им участка. Повторный съезд участников конвенции должен восстановить справедливость (например, за счет отступных или общей кассы). Но владельцам богатых участков этого не хочется. Они не альтруис­ты. Тогда можно использовать механизм направлен­ной лжи. При вопросе о среднем доходе с участка спрашиваемый говорит истинную цифру лишь тем, чей доход выше, или тем, кому невыгодно переходить на его участок. Остальным он врет, снижая истин­ный доход до того уровня, когда переход для спра­шивающего становится невыгодным. В этой модели участники должны располагать различной информа­цией о реальных доходах других участников.

При этом увеличение объема информация способ­ствует улучшению условий функционирования дан­ного автомата. Обратим внимание читателей на это важное свойство обсуждаемой модели. В модели рефлексивного поведения такая прямая зависимость не наблюдается.

Все модели, которые мы предложили в данной главе, обладают одной особенностью. Если рассмат­ривать коллектив автоматов как прообраз некоторой биологической, социальной или технической системы, то эта система функционирует в параллельном режи­ме, все ее подсистемы действуют независимо друг от друга и им не приходится ждать каких-либо

113

 

результатов работы других подсистем. Такое положение дел встречается не столь уж часто. В сложных системах работа подсистем часто взаимоувязана, су­ществуют определенные временные зависимости, отражающие порядок срабатывания подсистем. Эти зависимости могут носить как вероятностный, так и детерминированный характер. Поэтому в последую­щих двух главах мы рассмотрим децентрализованное управление, осуществляемое при таких дополнитель­ных ограничениях.

Г л а в а 4 КОГДА "ВСЕ ПО СПРАВЕДЛИВОСТИ"

 

«Мы холодны душой к нелепым чудесам.

И лишь возможное всегда по вкусу нам».

 Буало


Поделиться:



Последнее изменение этой страницы: 2019-05-06; Просмотров: 216; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.036 с.)
Главная | Случайная страница | Обратная связь