Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Что дает случайное взаимодействие



Во всех рассмотренных в данной главе моделях участник игры воспринимал результат поведения ос­тальных участников только как реакцию на его по­ведение некоторой более или менее сложно организо­ванной внешней среды. Никакой информацией не только о поведении, но даже о наличии других участ­ников автомат (или игрок) не располагал. Как было показано выше, в ряде ситуаций в дополнительной информации не было никакой необходимости, так как

85

 

и без нее автоматы добивались целесообразного и даже оптимального поведения. Вместе с тем мы стал­кивались и с рядом не очень приятных характери­стик поведения — требования роста сложно­сти процедуры принятия решений (глубины памяти автоматов), весьма быстрого роста времени достиже­ния оптимального поведения и т. п. И вообще термин «коллективное поведение» мало подходил к описы­ваемым ситуациям — речь скорее всего шла о моделях совокупного поведения, о поведении некоторого «автоматного газа». Когда мы произносим слово «коллектив», мы обычно подразумеваем некоторую структуру отношений, наличие обмена информацией, организацию взаимодействия между членами коллектива. Можно надеяться, что учет указанных свойств в рассматриваемых нами совокупностях автоматов может, с одной стороны, улучшить характеристики поведения и, с другой, оценить возможности и эффек­тивность различных типов организации взаимодей­ствия.

При попытках построить модели поведения со взаимодействием следует постоянно помнить, что только достаточно простые модели, зависящие от не­большого числа параметров, позволяет разобраться в эффектах, возникающих в этих моделях и моделируе­мых ими ситуациях.

Какие же типы взаимодействия мы можем отне­сти к простейшим? К таким типам с нашей точки зрения следует отнести случайное парное взаимодей­ствие и однородное взаимодействие с ограниченным числом соседей.

Случайное парное взаимодействие состоит в том, что в каждый момент времени (в каждой партии иг­ры) весь коллектив, вся совокупность автоматов случайным образом разбивается на пары. Б каждой паре может быть реализован акт обмена информацией, в результате которого происходит изменение действия или внутреннего состояния автомата. На следующем такте разбиение коллектива на пары происходит за­ново, также случайным и независимым от предыду­щего разбиения способом.

При взаимодействии с ограниченным числом сосе­дей для каждого члена коллектива указывается его окрестность — список участников игры, называемых соседями данного автомата по игре, с которыми он

86

может осуществлять взаимодействие. Взаимодействие это может быть односторонним — автомат восприни­мает информацию от своих соседей ко игре или его выигрыш зависит от поведения его соседей по игре, но обратное в общем случае может быть неверным. Однородность ограниченного взаимодействия заклю­чается в том, что размеры окрестности для всех автоматов одинаковы. Таким образом, однородное взаимодействие задается однородным ориентирован­ным графом отношений.

Начнем изучение возможностей взаимодействия со случайных парных встреч.

При рассмотрении игры в размещения мы уже отмечали, что для обеспечения возможности догово­риться и, тем самым, обеспечить максимально возможный выигрыш можно организовать общую кассу, а можно, распределившись по одному на самых вы­годных участках, например циклически меняться ме­стами. Аналогичного эффекта нетрудно добиться, если повторять жеребьевку, например, каждый месяц. Однако трудности организации ежемесячных встреч не привыкших к дисциплине детей лейтенанта Шмид­та отчетливо демонстрируют все сложности такого способа централизованного управления. Столь же большие трудности (если не большие) встречаются на пути заочной жеребьевки и организации общей кассы. Однако эффект, эквивалентный эффекту вве­дения общей кассы, мог бы быть достигнут, если бы в конвенцию был включен пункт, обязывающий от­прысков героя при любой случайной встрече обмени­ваться участками. Если такие парные встречи дейст­вительно случайны и равновероятны, то механизм подобного взаимодействия обеспечивает каждому уча­стнику (естественно, при достаточном времени) пре­бывание в среднем одинаковое время на каждом уча­стке, т. е. выравнивает доходы всех участников игры. Для максимизации выигрыша при этом достаточно обеспечить первоначальное распределение всех игро­ков по одному на наиболее выгодных стратегиях и реализовать процедуру случайного парного обмена стратегиями.

Нетрудно видеть, что и в игре в распределения, если мы зададим некоторое начальное распределение игроков по стратегиям и организуем случайный пар­ный обмен стратегиями (первый тип взаимодействия).

87

 

то начальное распределение будет поддерживаться сколь угодно долго, так как при парном обме­не, порожденным любым механизмом разбиения на пары, число игроков, покидающих стратегию, будет равно числу игроков, выбирающих ее. С другой сто­роны, если разбиение на нары случайно и равнове­роятно, то средний выигрыш у игроков выравнивает­ся. Указанные соображения позволяют предположить, что таким образом организованная процедура взаимо­действия должна приводить к эффектам, эквивалент­ным введению общей кассы. Здесь, однако, представ­ляет интерес зависимость поведения автоматов в эк­вивалентной игре от глубины их памяти.

Обратимся снова к игре в распределения. Если автоматы, участвующие в игре, имеют минимальную глубину памяти, то указанное взаимодействие не из­меняет их поведения и, следовательно, автоматы ра­зыгрывают партию Антоса. С ростом глубины памя­ти таких автоматов их поведение стремится к пове­дению в игре с общей кассой, а разыгрываемая пар­тия — к партии Мора. Наиболее существенный эф­фект, возникающий здесь, как показывает анализ и моделирование поведения, состоит в том, что при данном типе взаимодействия и при любой глубине памяти средний выигрыш автоматов не меньше, чем максимальный выигрыш для данной глубины памяти в обычной игре и игре с общей кассой.

Первый тип взаимодействия, улучшая результаты поведения автоматов в игре и реализуя процедуру общей кассы без специального центрального устрой­ства, собирающего все выигрыши и делящего их по­ровну между игроками, не улучшает между тем ди­намики поведения коллектива. Сходимость к точке Мора остается столь же медленной.

Мы уже говорили выше, что в игре Гура чрезвы­чайно медленная сходимость объясняется тем, что при любой глубине памяти точкой динамического рав­новесия является точка, при которой автоматы рав­номерно распределены по стратегиям. Более того, в любой другой партии опять-таки при любой глубине памяти математическое ожидание изменения распре­деления автоматов по стратегиям направлено в сто­рону точки равномерного распределения. Можно предложить сравнительно простую процедуру случай­ного парного взаимодействия (взаимодействие второ-

 88

го типа), которая делает все партии игры Гура пар­тиями безразличного равновесия по математическому ожиданию смены распределения автоматов по стра­тегиям. Тогда опять средний выигрыш будет опреде­ляться временами выбора автоматом данной страте­гии.

Подобное взаимодействие, обеспечивающее опи­санный выше эффект, состоит в том, что когда авто­мат должен изменить свое действие в качестве ново­го выбирается действие, которое осуществляет парт­нер по паре. Если же в силу логики своей работы, автомат не должен изменять свое действие, то он не обращает никакого внимания на своего партнера по паре.

Эффект, достигаемый при этом типе случайного парного взаимодействия, оказывается замечательным. Если участвующие в игре автоматы имеют глубину памяти, равную п , то их средний выигрыш будет ра­вен выигрышу автоматов, имеющих глубину памяти 2n, в игре Гура без случайного парного взаимодей­ствия, а скорость сходимости к стационарному выиг­рышу будет такой же, как у автоматов с памятью п в обычной игре Гура. Заметим, что два связанных друг с другом автомата, каждый из которых имеет п состояний, образуют систему с n2 состояниями. Учитывая, что такая пара автоматов имеет четыре, а не две комбинации выигрыша и проигрыша, мы можем утверждать, что образование постоянных каолиций из автоматов дает степенное улучшение качества функционирования, тогда как случайное парное взаи­модействие обеспечивает экспоненциальное улучше­ние.

Совместное использование обоих типов случайного парного взаимодействия в игре в распределения обеспечивает проявление обоих указанных выше эф­фектов при достаточно большой глубине памяти. Од­нако введение второго типа случайного парного взаимодействия изменяет характер поведения в этой игре простейших автоматов.

Рассмотрим следующую ситуацию, моделируемую игрой в распределения. Пусть имеется несколько курортов. Привлекательность каждого курорта для отдыхающего там человека зависит от числа людей, выбирающих этот курорт одновременно с ним. Обыч­но в среднем привлекательность курорта падает по

 

 

мере роста числа находящихся там курортников. Падение привлекательности курорта приводит к тому, что возрастает вероятность в будущем году поехать в новое место. Каждый из нас знает, как мучитель­на смена привычного места и сколь случайна процеду­ра выбора нового. Однако, как правило, мы не бро­саем монету и не тычем с закрытыми глазами пальцем в карту СССР, а начинаем интересоваться, где отдыхают другие люди. Окончательное решение приходит, когда жена сообщает вам, что Эльвира Евсеевна прекрасно провела лето под Мариуполем. Самое удивительное при этом, что, в общем, с учетом са­мых различных факторов, удовлетворенность провес денным отпуском в среднем во всех местах одинако­ва. Это наводит на мысль, что указанная процедура обеспечивает выход на точку Нзша, а способ выбора нового места весьма напоминает последний способ организации случайного парного взаимодействия.

Действительно, если читатель согласен не забивать себе голову аналитическими выкладками и готов поверить нам на слово, то оказывается, что в «игре в распределения» случайное парное взаимодействие, состоящее в том, что в случае смены действия в каче­стве нового действия выбирается действие партнера по паре, обеспечивает выход простейших автоматов на партию Нэша. Этот факт также замечателен, тах как без взаимодействия для обеспечения выхода на точку Нэша необходимы автоматы с бесконечно боль­шой глубиной памяти. Резкое снижение требуемого объема памяти играющих автоматов столь же суще­ственно снижает время, необходимое для выхода на стационарное распределение, и значительно улучшает характеристики поведения в случае изменения внеш­них условий. На рис. 3.11, 3.12 и 3.13 (на них 1 — случайное парное взаимодействие, 2—общая касса, 3—обычная игра) приведены зависимости среднего выигрыша автоматов от глубины их памяти при ком­бинированном способе случайного парного взаимодей­ствия для игр, рассмотренных на рис. 3.7, 3.8 и 3.9.

В структурированных коллективах, т. е. в коллек­тивах, для которых определена структура взаимодей­ствия, эффективность функционирования каждого участника зависит от того, что он делает сам и что делают его непосредственные соседи по игре. Подоб­ная ситуация возникает, например, тогда, когда чле­ны коллектива располагаются в узлах некоторой сети связи или сети распределения некоторого ресурса, Примерами подобных ситуаций могут слу­жить сети связи или сети вычислительных машин, где мы хотим организовать децентра­лизованное поведение, оптимизирующее неко­торые параметры си­стемы. В качестве та­ких параметров могут выступать производи­тельность или пропуск­ная способность, ре­активность системы или среднее время ожидания, стоимость и т. п. Децентрализо­ванное поведение при решении задач такого рода мы будем рас­сматривать в следую­щей главе. Здесь же нас будут интересовать не­которые эффекты, свя­занные собственно со взаимодействием, по­рождаемым структурой связей в системе. Вве­денные выше требо­вания ограниченности взаимодействия и его однородности вызва­ны следующими при­чинами: ограничен­ность связана с тем, что в большинстве ре­альных технических сетей узлы сети имеют ог­раниченное число связей друг с другом, а однород­ность (так же, как и ограниченность) существенно упрощает изучение моделей.

В качестве примеров управляющих систем с сетевой структурой могут выступать также системы

91

управления энергетическими или газораспределитель­ными сетями.

Мы будем говорить, что на однородном графе за­дана однородная игра с ограниченным взаимодейст­вием, если задана функция, определяющая доход иг­рока в зависимости от того, какое действие выбрал он сам и какие действия выбрали его соседи по игре. Естественно, что эта функция может зависеть и от внешних неконтролируемых участниками игры пара­метров. В силу однородности графа взаимодействия для задания игры достаточно задать всего одну та­кую функцию.

Рассмотрим некоторую условную ситуацию. Пусть у нас имеется водопроводная сеть, состоящая из рас­пределительных станций, соединенных между собой водоводами. Станция регулирует отпуск воды потре­бителям. Ее доход, с одной стороны, растет с увели­чением общего объема отпускаемой потребителям воды, но, с другой стороны, увеличение этого объема может привести к падению давления в магистралях, что вызовет определенные убытки и, следовательно, снижение дохода. При этом указанные зависимости определяются не только поведением самой станции, но и отбором воды из системы, осуществляемым бли­жайшими соседями станции. Аналогичные отношения возникают и в оросительных системах.

Приведенная содержательная интерпретация мо­дели игры с ограниченным взаимодействием весьма и весьма приблизительно описывает реальную ситуа­цию в подобных системах, но авторы надеются на снисходительность читателя. В принципе функции выигрыша могут учитывать все сложности оценки эффективности функционирования узла. Например, отказ станции включать насосы, обеспечивающий экономию электроэнергии. Существенно здесь лишь то обстоятельство, что доход каждого участника оп­ределяется только поведением его самого и его соседей из ближайшей окрестности.                   

В такой игре существуют устойчивые по Нэшу ситуации, когда никому из участников игры невыгод­но в одиночку изменять свое поведение. Аналогично рассмотренным выше играм, доход в точке Нэша всей системы может быть весьма далек от возможно­го максимума. Для достижения партии максимальной цены можно организовать общую кассу, однако не-

93

трудно понять, что в достаточно больших сетях ее введение практически лишает участников оператив­ной информации о реакции системы на их собствен­ное поведение. Вместе с тем, именно с ростом сети возрастают сложности централизованного управле­ния и увеличивается привлека­тельность децентрализованных систем.

Рассмотрим простенький чис­ленный пример. Пусть участни­ки игры имеют по два соседа каждый, т. е. их графом взаимо­действия является окружность (рис; 3.14). Выигрыш каждого участника определяется его дей­ствием и действиями его правого и левого соседей. Каждый уча­стник может делать одно из двух действий, которые мы обозначим через А и Б. Величины выигрыша автомата в зависимости от дей­ствий его правого и левого соседей приведены ниже

Ситуация Выигрыш ААА — 2 БАА 2 АБА 0 ББА 10 ААБ 10 БАБ 0 АББ 2 БББ —2

 

Отсюда видно, что среднему игроку выгодно изме­нять свое действие на другое, если он находится в си­туациях ААА, БАА, АББ и БББ, и невыгодно в ос­тальных ситуациях. Рассмотрим ситуацию ББАА, в которой третьему игроку выгодно изменить свое дей­ствие, что приводит нас к конфигурации БББА, в ко­торой становится выгодным изменить свое действие второму игроку. Ситуацией равновесия по Нэшу здесь является партия АБАБАБ ... АБ. Средний выигрыш в партии Нэша для этой игры равен 0. С другой сто­роны, партия ААББААББ ... ААББ обеспечивает средний выигрыш, равный 6, но, как мы видели, она неустойчива.

Обратим внимание на следующий факт: если один из участников игры изменяет свое действие, то это приводит к изменению только его выигрыша и выиг­рыша его ближайших соседей, но не затрагивает ос­тальных участников игры. Следовательно, если мы организуем общие кассы между соседями по игре, то изменение своего действия, приводящее к уменьше­

93

 

нию суммарного выигрыша в своей окрестности, а, значит, и во всем коллективе, становится для участ­ника невыгодным. Тогда и партия максимальной цены становится устойчивой по Нэшу, т. е. становится Таблица 3.2

Фрагмент партии Мора Выигрыш Фрагмент новой партии Выигрыш
ААББА 22/3 АААБА 8/3
АББАА 14/3 АБААА 0
ББААБ 22/3 БББАБ 8/3
БААББ 14/3 БАБББ 0

 

партией Мора. Проиллюстрируем сказанное на нашем примере. Обратимся к табл. 3.2. В ней в первом столбце приведены фрагменты партии максимальной цены, во втором столбце — выигрыш среднего во фрагменте игрока при наличии локальной общей кас­сы, в третьем столбце—фрагмент, образующийся при смене действия средним игроком, и, в четвер­том — выигрыш среднего во фрагменте игрока при наличии локальной общей кассы в новой ситуации.

Из табл. 3.2 видно, что ни одному из участников игры при использовании процедуры локальной общей кассы в партии максимальной цены невыгодно изме­нять свое действие.

Организация локальной общей кассы сводится к равномерному распределению дохода в узле между всеми узлами его окрестности и, с одной стороны, не требует сложных организационных мероприятий, а с другой, в силу небольшого числа соседей слабо мас­кирует зависимость получаемого дохода от результатов собственной деятельности. Еще раз подчеркнем, что указанный эффект достигается на сети независи­мо от ее размеров.

§ 3.5. «Он думает, что я думаю...»

У английского поэта Ковентри Патмора есть та­кие стихи:

— Он целовал Вас, кажется?

— Боюсь, что это так!

— Но как же Вы позволили?

94

— Ax, он такой чудак! Он думал, что уснула я И все во сне стерплю. Иль думал, что я думала, Что думал он: я сплю!

(перевод С. Маршака)

Эти стихи демонстрируют широко распространенную человеческую способность к рефлексии — рас-суждениям, при которых рассуждающий ставит себя на место другого человека и проводит рассуждения с его точки зрения. Рефлексивные рассуждения обла­дают свойством рекурсивности, т. е. как бы вклады­ваются друг в друга, как матрешки. Например, можно рассуждать о том, как некто рассуждает о вас или моделирует ваши рассуждения о нем. Ковентри Пат-мор в своем стихотворении прекрасно иллюстрирует эту рекурсивность рефлексивных рассуждении.

Зачем нам нужны рассуждения подобного типа? Мы их используем тогда, когда делаем выбор, успех и неуспех которого предопределяется не только на­шим собственным решением, но и решениями других людей, связанных с нами какими-то связями. Пример подобной ситуации—игра в размещения, в которой выигрыш каждого участника коллектива определяет­ся не только его индивидуальным действием, но и действиями остальных участников коллектива. По­этому использование в коллективном поведении ме­ханизмов, имитирующих рефлексивные рассуждения, может оказаться полезным. В данном параграфе мы постараемся показать это.

Введем сначала важное для нас понятие ранга рефлексии. Это понятие мы введем индуктивным пу­тем. Будем говорить, что индивид или автомат име­ет нулевой ранг рефлексии, если при выборе своего действия он никак не учитывает наличия других уча­стников коллектива. Выбор при нулевом ранге реф­лексии определяется только той информацией, кото­рая поступила на вход принимающего решение от среды. Индивид (или автомат) имеет первый ранг рефлексии, если он считает, что остальные участники коллектива имеют нулевой ранг рефлексии и он сам может выбирать действия за них. Отметим, что нали­чие первого ранга рефлексии связано с требованием наличия информации по крайней мере о некоторых

95

участниках коллектива и сигналах от среды; поступивших на их вход. Определение последующих ран­гов рефлексии происходит аналогичным образом. Ин­дивид или автомат имеет k-й ранг рефлексии, если он считает, что все остальные известные ему участ­ники коллектива имеют ранг рефлексии, равный k—1, и он может провести за них соответствующие рассуждения.

Такое определение ранга рефлексии связано лишь с мерой информированности системы, делающей вы­бор, о сигналах, поступивших на входы других си­стем. У человека же рефлексивные рассуждения в подавляющем большинстве случаев опираются на не­которые знания, хранящиеся в его «модели мира». Это знания о закономерностях поведения в данном обществе, человеческих возможностях в том или ином состоянии, нормах и ограничениях и т. п. Но даже в столь обедненном виде рефлексивные рас­суждения оказываются полез­ными в ряде моделей коллек­тивного поведения.

Рассмотрим следующую за­дачу. В дачном кооперативе пробурена скважина для по­дачи воды. На каждом участ­ке имеется свой собственный насос, способный подать воду из скважины в кольцевой коллектор, охватывающий все участки (рис. 3.15). Но мощ­ности этих насосов таковы. что создаваемый ими напор

в коллекторе позволяет производить поливку трех соседних участков, если включены два насоса. Другими словами, если на участках 2 и 3 насосы включены, то можно полить и посадки на участке 4. Каждый хозяин участка имеет индивиду­альную цель — обеспечить свой участок водой. Но имеется еще дачный трест — владелец всех n участ­ков, И у него есть собственная цель — экономия электроэнергии. При обеспечении поливки всех уча­стков для дачного треста невыгодно, чтобы работали все n насосов. Наилучшим для него является случай, когда работает только n/2 насосов (если п —четное), или (n+1)/2 насосов (если п —нечетное). Доста-

96

точно, например, включить насосы лишь на участках с четными (пли нечетными) номерами и весь полив будет обеспечен.

Конечно, дачный трест мог бы добиться этого какими-либо принудительными мерами, например централизованным управлением насосами из цент­ральной диспетчерской. Но владельцы участков это­му противятся, считая, что дачный трест вмешивает­ся в их личные дела. И тогда трест пытается орга­низовать экономию электроэнергии путем денежных штрафов за ненужный расход электроэнергии коллек­тивом владельцев участков.

Прежде чем пояснить, как это делается, отметим некоторую искусственность нашей задачи. Ее содер­жательная интерпретация нужна была нам лишь для того, чтобы вызвать у читателя некоторые образные ассоциации, а не подсовывать ему неизвестно откуда взятую модель, на которой будет показана полез­ность рефлексивных рассуждении.

Перейдем теперь к описанию самой модели. Име­ется кольцо, состоящее из п автоматов (будем для определенности считать п четным). Каждый автомат может находиться в двух состояниях — рабочем и выключенном. Эти состояния мы для краткости бу­дем обозначать соответственно 1 и 0. Каждый авто­мат имеет информацию о своем состоянии и состоя­нии двух своих соседей. Число действий каждого ав­томата также равно двум. Эти действия есть просто сообщения о том, в каком состоянии находится в данный момент автомат. На каждом такте функцио­нирования автоматы получают на вход сигналы поощ­рения и наказания. При поощрении автомат сохраня­ет свое состояние, при наказании — меняет его. Взаимодействие автомата в кольце со средой (дач­ным трестом) определяется табл. 3.3.

Если автомат при выборе своего очередного со­стояния будет руководствоваться только этой табли­цей, то мы будем считать его обладающим нулевым рангом рефлексии. Если все автоматы кольца имеют нулевой ранг рефлексии, то дачный трест может по­пасть в ситуацию, когда достижение его цели окажет­ся невозможным. Если, например, в начальный мо­мент все автоматы находятся в рабочем состоянии, то все они, согласно последней строке таблицы, по­лучат сигнал наказания и перейдут в нерабочие

97

Таблица 3.3

    Состояние     Вероятность наказания
собственное левого соседа правого соседа    
0 0 0 1
0 0 1 0,5
0 1 0 0,5
0 1 1 0
1 0 0 0
1 0 1 0,5
1 1 0 0,5
1 1 1 1

 

состояния. Но в этом состоянии весь коллектив опять получит сигнал наказания, все автоматы перейдут в рабочее состояние, и цикл замкнется. Насосы на участках будут либо все включаться одновременно, либо бездействовать», а цель дачного треста так и не будет достигнута.

Введем теперь различные ранги рефлексии. Пусть, например, некоторый автомат имеет первый ранг реф­лексии. Тогда он делает свой выбор следующим обра­зом. Он анализирует переход, который должны совер­шить его соседи (а для этого, он должен иметь ин­формацию о соседях своих соседей), считая, что они обладают нулевым рангом рефлексии, т. е. при своем выборе руководствуются приведенной выше таблицей, а затем совершает переход на основании своего рас­суждения. При этом вероятность наказания для него задается уже не средой, а определяется им самим. Другими словами, кроме информации о состояниях, в которых находятся его непосредственные соседи и соседи его соседей, автомат с первым рангом рефлексии должен еще звать правый столбец табл. 3.3, Только при наличии этой дополнительной информа­ции он сможет провести правильное рефлексивное рассуждение. Для иллюстрации его рассмотрим си­туацию, показанную на рис. 3.16. Сначала наш авто­мат проводит рассуждения за левого соседа. Как сле­дует из таблицы, определяющей функционирование автомата с нулевым рангом рефлексии, левый сосед не может получить сигнал наказания и останется в своем состоянии 0. Правый же сосед с вероятностью 0,5 сменит свое состояние и с такой же вероятностью.

98

сохранит его. Что делать нашему автомату в подобной ситуации? Если правый сосед сменит свое состояние, то, сохранив свое состояние, наш автомат окажется в благоприятном положении. Если же этого на произойдет, то вероятность наказания, которая нависнет над ним, будет равна 0,5. Если же наш автомат сменит свое состояние, то либо он получит сигнал наказания с вероятнос­тью 1 (если правый сосед изменит свое состояние), либо с вероятностью 0,5 (если правый сосед со­хранит свое состояние). В любом случае автомату с первым рангом рефлексии лучше сохранить свое текущее состояние.

 

Если бы автомат имел второй ранг рефлексии, то, согласно нашему определению, он считал бы своих соседей автоматами с первым рангом рефлексии, а, значит, проводя рассуждения за них, привлекал бы информацию не только о своих соседях и соседях этих соседей, но и о соседях соседей соседей. На рис. 3.17 показано, как расширяется множество ав­томатов, относительно которых необходимо иметь информацию об их текущих состояниях при росте значения ранга рефлексии.

Отметим, что если некоторый автомат имеет определенный ранг рефлексии, то это вовсе не означает, что он правильно предсказывает реакцию анализируемого множества автоматов. Он может и ошибать­ся. Имея, например, первый ранг рефлексии, автомат предполагает, что его соседи делают свои выборы как автоматы с нулевым рангом рефлексии. Но впол­не может оказаться, что его соседи сами являются

99

 

автоматами с рангом рефлексии выше нулевого. В этом случае прогноз их поведения не будет соответ­ствовать тому, что они на самом деле будут делать.

Можно поставить следующий вопрос: существуют ли такие распределения значений рангов рефлексии по коллективу автоматов, которые позволяли бы дач­ному тресту надеяться, что со временем коллектив придет к благоприятным состояниям (чередованию состояний 1—0—1—0 и т. д.). Моделирование этой задачи на ЭВМ показало, что коллектив выходит на этот глобальный оптимум не всегда, а лишь при оп­ределенных распределениях рангов рефлексии. Опти­мум по коллективу, например, всегда достигается, когда на кольце чередуются автоматы с нулевым и первым рангами рефлексии. Но он же достигается и не при столь регулярном их чередовании.

В конце § 3.4 мы рассмотрели модель, весьма близкую к той, которую мы сейчас проанализировали. В ней ситуацией равновесия оказывалась партия вида 1010 ... 10 (в обозначениях § 3.4 партия АБАБ ... АБ). Это та партия, которая устраивает нас в задаче включения насосов. Но в ранее рассмотренной мо­дели выход игроков в эту точку обеспечивался за­данной на стр. 94 системой выигрышей. В нашем же случае такой системы выигрышей нет. И коллек­тив автоматов не обладает в этой партии точкой рав­новесия.

Ее возникновение порождается неоднородностью в коллективе автоматов, вносимой различными ранга­ми рефлексии. И эта неоднородность позволяет нам решить задачу оптимизации, которую не способен ре­шить однородный коллектив, если не принять каких-либо дополнительных мер.


Поделиться:



Последнее изменение этой страницы: 2019-05-06; Просмотров: 242; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.045 с.)
Главная | Случайная страница | Обратная связь