Резюме. Использование фреймов в эвристическом поиске

⇐ ПредыдущаяСтр 10 из 14Следующая ⇒

За последние десять лет широкое распространение получила идея о том, что важны все аспекты представления информации с помощью " пространства задачи"; однако мысль о том, что описания могут быть полезны и для самих программ, и для авторов этих программ, не стала столь же популярной. Прогресс в понимании этого ключевого момента был фактически задержан остроумными схемами, созданными для того, чтобы избежать явных манипуляций описаниями.

Основным устремлением, особенно при доказательстве теорем и моделировании игр, была разработка средств, ведущих к систематическому уменьшению протяженности поиска в пространстве задачи. Иногда простая задача может быть решена при помощи последовательного перебора допустимых методов решения: перебор производится до тех пор, пока один из методов не даст положительного результата. В более сложных ситуациях используются усовершенствованные локальные правила поведения, а также варианты " восхождения к вершине" в пределах пространства задачи. Однако если нам и удается таким способом решить определенную задачу, мы получаем мало сведений о пространстве задачи и, следовательно, не повышаем свою квалификацию, 470 весьма пригодилось бы нам в будущем. Наиболее разработанными в эвристических методах являются игровые методы поиска решений, в которых используются различные стратегии для уменьшения дерева перебора, оценки терминальных вершин и выработки разумного хода. Однако даже в тех системах, где применяются различные способы - организации иерархий символьных целей, отсутствует " осознанный" самой системой подход к процессу поиска решений и не совершенствуется качество представления информации. Я предлагаю следующее более совершенное и мощное правило.

Главной целью при решении задач должно быть стремление лучше понять пространство задачи и найти такие представления, в рамках которых данная задача решается довольно просто. Цель поиска состоит в том, чтобы получить информацию для формирования надлежащего представления, а не для нахождения решения, как это обычно предполагается; после того, как удастся соответствующим образом представить это пространство задачи, решение найти будет значительно легче.

В частности, я являюсь противником того, что значимость интеллектуального эксперимента должна оцениваться либо относительно категорий " неудача - частичный успех - успех", либо с помощью таких понятий, как " улучшение ситуации" и " уменьшение различия". Применение какого-то метода или изменение представления могут быть ценными лишь в том случае, когда они ведут к совершенствованию стратегии проведения последующих экспериментов. В более ранних формулировках роли стратегий в эвристическом поиске эти возможности не были выделены, хотя в неявной форме они содержались в рассуждениях о задачах планирования.

Каким образом можно объединить новое правило с классической стратегией минимакса? Пусть мы находимся в определенном узле А дерева решения (играя в какую-нибудь игру, например, шахматы) и исследуем два (или более) возможных хода, скажем В и С. Каждый из этих ходов получает значения оценок V(B) и V(C). Затем оба этих значения объединяются с помощью функции М для того, чтобы выработать одну общую оценку

S(A) = M( V(B), V(C) ).

По существу, с помощью функции М должны подводиться итоги поиска на всем дереве ниже узла А и определяться оценка позиции А.

Посмотрим, в чем заключается цель подобных действий. Если можно было бы произвести поиск на всем дереве перебора, то мы смогли бы использовать найденную в каждом узле оценку S для принятия решения о том, какой следующий ход лучше всего сделать. Если, однако, оценка S дается просто в виде числа, то на это" основе невозможно будет провести значительные рассуждения, требуемые для анализа существующей ситуации.

Если значение S(B) невелико, то можно предположить, что В - неудачная позиция. Но если мы хотим, чтобы генератор ходов не повторял своих прежних ошибок, сообщение S должно включать некоторую дополнительную информацию относительно того, чем нас не удовлетворяет позиция В или как поступить в данном случае. Нам фактически требуется итоговое объяснение того, что обнаружено в процессе поиска; поскольку мы работаем с деревом перебора, нам требуется также рекурсивное суммирование подобных резюме.

Рассмотрим проблему, названную нами " расхождением резюме". Если резюме для ситуации А содержит (в общем случае) любое явное описание для В и С, то существует опасность того, что любая схема рекурсивного описания будет повторять дерево ходов; это приведет к столь же длительному поиску итогового сообщения, как и поиску самого решения. Чтобы этого не произошло, можно воспользоваться довольно простым способом - ограничить размеры самого резюме. В этом случае следует позаботиться о том, чтобы избежать сильного уменьшения информативности сообщений. Во фреймах-описаниях важные черты и отношения, находящиеся на верхних уровнях, могут служить в качестве резюме, а вспомогательные описания становятся доступными лишь по необходимости. Вопрос о том, какая часть проанализированного дерева должна оставаться в долговременной памяти, а какая отбрасываться после того, как сделан очередной ход, зависит от других аспектов использования участником игры всего накопленного им опыта.

Какие принципы должны лежать в основе образования резюме? И в этом вопросе концепция фреймов демонстрирует свою гибкость. Вместо того чтобы попытаться ограничить сообщения какими-то жесткими форматами, мы может построить набор " резюме" -фреймов для каждого данного случая; любой фрейм будет вызываться, когда его терминалы подходят к описаниям ситуаций более низких уровней, а маркеры согласуются с текущими целями. Таким образом, каждый из этих фреймов выполняет свою работу только тогда, когда он соответствует текущей ситуации. Например, у человека могут быть самые разные фреймы типа " шахматной вилки". Если конь занимает такую позицию, что угрожает одновременно и шахом, и взятием ладьи, то активируется фрейм вилки, соответствующий следующему условию: при любом из двух возможных ходов теряется та фигура, которая не изменит своей позиции. Как только будет активирован этот фрейм, он может дать конкретную рекомендацию, вероятно, следующего содержания: генератор ходов того игрока, который попадает под вилку, должен выяснить, не может ли какой-нибудь ранее сделанный ход обеспечить защиту того поля, откуда исходит угроза вилки.

Фреймы в качестве парадигм

" До тех пор, пока не была создана эта парадигма схоластов (средневековая теория " первого толчка" ), маятники как таковые не были известны людям, а ученые видели в них только качающиеся камни. Существование маятников было открыто благодаря изменению парадигмы, очень напоминающему переключение гештальта. Следует ли нам описывать то, что отличает взгляды Галилея от воззрений Аристотеля или Лавуазье от Пристли с позиций трансформации зрительных образов? Действительно ли они видели разные вещи, когда смотрели на одни и те же предметы? Имеются ли у нас какие-то основания утверждать, что они проводили свои исследования, находясь в разных мирах? Я отчетливо предвижу трудности, которые могут возникнуть в том случае, если предположить, что когда Аристотель и Галилей смотрели на качающийся камень, первый видел в этом лишь несвободное падение тела, а второй - маятник. Тем не менее, я убежден, что нам следует научиться находить смысл в утверждениях, подобных данному утверждению".

Т.Кун (1975)

Согласно предложенной Т. Куном эволюционной модели наука развивается с помощью установленных описательных схем. Крупные открытия являются результатом новых парадигм, новых способов описания вещей, которые приводят к новым методам и методикам. В конце концов, изменяется содержание научного знания.

Т.Кун предпочитает применять свою весьма эффективную схему нового описания на уровне крупных научных революций; мне кажется, что эта идея применима и к проблемам повседневного мышления. Действительно, последнее процитированное предложение Т.Куна подтверждает ту его точку зрения, что в визуальном восприятии парадигмы должны играть не метафорическую, а, скорее, самостоятельную роль, а это именно то, что мы предлагаем в нашей концепции фреймов.

Когда обычно наши воззрения не пригодны, когда не удается отыскать в своей памяти эффективные системы фреймов, нам следует построить новые системы, которые позволят правильно отразить новые реалии. По всей видимости, обычным следует считать способ построения новой, системы из двух или более старых систем с последующим редактированием или " доводкой" ее до такого совершенства, когда она во всем будет соответствовать имеющимся обстоятельствам. Но каким образом можно это сделать? Заманчиво сформулировать эту задачу так: построить систему фреймов с наперед заданными свойствами. Подобная постановка задачи может упростить решение, поскольку позволяет разбить его на два этапа: вначале формулировка требований, затем само решение проблемы.

Этот путь, однако, несвойственен процессу человеческого мышления, ибо требования никогда не формулируются все сразу, а новая система не строится по заранее и полностью построенному сценарию. В действительности неудовлетворенные требования осознаются нами последовательно в процессе видоизменения непригодного для нас представления в виде тех или иных недостатков или " дефектов".

Мне кажется правильной мысль С.Пейперта (1972) о том, что способность к диагностике и модификации своих собственных процедур - это важный элемент человеческого интеллекта. (Об этом смотрите работу М.Минского и С.Пейперта (1972)).

" Доводка", фундаментально важный его компонент, обладает своими особыми методами и процедурами. Каждый нормальный человек имеет возможность пользоваться ими в полной мере; в противном случае он не научился бы ни видеть, ни говорить, Обратимся теперь к работам И. Голдштейн (1973) и.Дж.Суссмана (1973), в которых рассматриваются вопросы явного использования знаний о доводке при обучении символьным представлениям. В этих работах строятся новые процедуры, которые должны удовлетворять многочисленным требованиям с помощью простых и вместе с тем мощных методов. Перечислим некоторые из них:

1. Первую попытку сделайте с помощью простого объединения процедур, каждая из которых позволяем достигнуть одну определенную цель.

2. Если что-то получается не так как, нужно, попытайтесь представить один из дефектов как особый (и нежелательный) тип взаимодействия двух процедур.

3. Примените тот " метод доводки", который согласно информации, имеющейся в памяти, дает хорошие результаты при исправлении этого особого вида взаимодействия.

4. Составьте резюме по итогам выполненных операций и включите его в хранящуюся в памяти ^библиотеку методов доводки".

Эти методы могут показаться несколько наивными, однако в тех случаях, когда новая проблема не слишком отличается от старых, имеются значительные шансы на успех, особенно при правильном подборе процедур-кандидатов на совместную ра6оту. Коли же новая проблема резко отличается от всех предыдущих, то не следует ожидать, что вообще должна существовать такая теория обучения, которая будет хорошо работать в этих условиях. Без структурированного познавательного плана, без " почти промахов" П.Уинстона(1970) и без хорошей подготовки к решению проблем данного типа нельзя ожидать появления совершенно новых парадигм, как бы остро мы в них ни нуждались.

Что представляют собой " виды взаимодействий" и " методы доводки"? Самым простым для них, видимо, следует считать тот случай, когда результат достижения первой цели оказывает влияние на некоторые условия, необходимые для достижения второй цели. В этом случае можно предложить использовать эту предпосылку в качестве нового условия; известны, однако, такие ситуации, в которых применение только этой методики не приведет к успеху, ибо это новое условие несовместимо с первой целью.

Если задать вопрос о наиболее важных задачах в области искусственного или естественного интеллекта, то, на мой взгляд, среди них следует отметить, во-первых, проблему взаимодействия между рассмотренными выше идеями и, во-вторых, использование многочисленных вариантов представления для изучения одной и той же ситуации с нескольких точек зрения. Проведение исследований в этих направлениях потребует новых идей относительно взаимодействий между трансформируемыми элементами. Здесь проявляется определенная ограниченность представления о системе фреймов, взятой в изолированном виде. Образование новых представлений на базе старых является сложным процессом, в рамках нашей теории эта задача может быть решена лишь с помощью сложного предварительного ввода данных (конечно, если ее вообще можно решить). Более того, требуется особое искусство при разработке методов решения данной задачи, которую я считаю одной из основных в теории интеллекта.

Глава четвертая.

Управление

Централизация управления

Выше уже затрагивался вопрос о процессах, которые манипулируют системами фреймов. Далее я не буду касаться тех аспектов, которые связаны с длительным управлением процессами мышления, включая такие проблемы, как многоцелевое управление, распределение времени между задачами, распределение памяти, энергетических и других видов ресурсов.

В значительно более короткие промежутки времени - назовем их эпизодами - деятельность механизмов человеческого мышления и понимания, как я это себе представляю, направлена на то, чтобы отыскать подходящий в данной ситуации (будь то планирование или распознавание образов) фрейм и заполнить задания отсутствия его терминалов конкретными данными. Это дает нам возможность представить крупные проблемы в виде совокупности более мелких, а также затрагивает все обычные вопросы эвристического программирования, например:

ПОИСК СВЕРХУ - ВНИЗ ИЛИ ГОРИЗОНТАЛЬНЫЙ. Следует ли вначале обойти все терминалы или же попытаться осуществить полное заполнение пробелов одного, центрального терминала? В действительности, ни тот, ни другой вариант не следует считать достаточно хорошим. Человек обычно стремится " семь раз отмерить и один раз отрезать", однако всегда должна существовать возможность немедленной обработки субфреймов, вызванных интересным или неожиданным событием.

ЦЕНТРАЛЬНОЕ УПРАВЛЕНИЕ. Должен ли фрейм после своей активации взять на себя управление и руководить заполнением своих собственных пробелов, или же эта операция должна вестись под руководством какого-то центрального процесса? И здесь ни одна из этих двух стратегий не является наилучшей. Ни демон, ни любой другой локальный процесс не может обладать знаниями обо всей ситуации в целом, достаточными для принятия правильных решений; однако ни один " руководитель" верхнего уровня не может знать требуемое количество подробностей.

Видимо, оба вопроса следует попытаться решить на основе, предложенной У.Мартином(1974) в противовес идее о " поддержке" и задуманной как стратегия обращения с ошибками и неудачами. Нельзя ни передавать управление подчиненным структурам, ни полностью сосредоточить его на верхнем уровне; поэтому нам требуется такой интерпретатор, который имел бы доступ и к целям верхнего уровня, и к работе отдельных демонов. Терминалы различных типов нуждаются в различных типах процессов, поэтому одной стратегией здесь не обойтись. Заполнение пробелов терминала стены фрейма комнаты предусматривает поиск и заполнение конкретными данными субфрейма " стена" более низкого уровня, в то время как конкретизация терминала " дверь" предусматривает присоединение фрейма комнаты к фрейму дома. Для включения в каждый фрейм данных относительно действий подобного типа каждый терминал мог бы указывать интерпретатору на те инструкции, где сказано, как собирать нужную информацию и как реагировать в случае трудностей и различного рода неожиданностей.

Итак, процесс конкретизации фреймов должен объединять в себе элементы поиска на дереве решений и активации демонов: управление поиском на дереве решений зависит от результатов проверок, которые могут выполняться с помощью демонов.

После того, как фрейм комнаты будет включен в работу, он может проверить, например, основное свойство стены. Такие проверки будут производиться на дереве, узлы которого образованы всевозможными фреймами стены, а его структура обеспечивает удобный нелинейный порядок для выяснения того, какие задания отсутствия могут быть сохранены, а какие требуют дополнительного рассмотрения.

В модели, использующей демоны, предполагается, что определенные терминалы вызванного фрейма активируют связанные с ними демоны с целью наблюдения за развертыванием событий во внешнем мире. Круглый предмет, находящийся высоко на центральной стене (а на боковой - имеющий вид эллипса), по предположению, должен быть часами, и это должно получить свое подтверждение в вид найденной цифры или радиальной линии (стрелки). Если такое подтверждение не будет получено, то " наблюдатель" всё же " увидит" часы, но описать их подробно не сумеет. Четырехугольник, расположенный на уровне глаз, может представлять собой картину или окно; в таких случаях дальнейший анализ, как правило, необходим.

Цель работы системы зрительного восприятия заключается не в том, чтобы постоянно отыскивать все находящиеся вокруг нас предметы; ее главной задачей является помощь в выработке ответов на вопросы путем объединения визуальной информации с предположениями, вырабатываемыми внутренними процессами. Однако в любом случае мы должны иметь возможность правильно ориентироваться в пространстве относительно нашего ближайшего окружения, что, кстати говоря, требуется для ответа на большинство из встающих перед нами вопросов. Поэтому определенная часть процесса конкретизации будет выполняться независимо от каких бы то ни было специальных вопросов или целей. Ясно, что нам требуется такой механизм, который умел бы " идти на компромисс" и позволял бы легко заменять " слабые" задания отсутствия при выявлении демонами непредвиденных обстоятельств.

Структура управления " продукциями" А.Ньюэлла и Г.Саймона (1972) образуется последовательным расположением (в некоторой памяти) локальных правил поведения. В системах, подобных языку CONNIVER (А.Макдермотт, Дж.Суссман, 1972), существуют явные структуры управления высших уровней; однако и здесь многое зависит от того, какие утверждения (аналогичные " продукциям" ) активны в данный момент; такой вид управления полностью явным уже не назовешь. Обе эти системы характеризуются высокой степень" локального процедурального управления. Все, что удается заметить, сопоставляется со своим " образцом-предшественником", который вызывает другой субфрейм, подключает его к процессу поиска и выполняет некоторые предписанные им функции.

Здесь существует еще одна проблема: процессы, являющиеся общими для многих систем, должны быть централизованы. Это способствует и экономии ресурсов, и возможности их усовершенствования, что достигается в процессе отладки. Слишком большая автономия мешает системе быстро и правильно реагировать при появлении новых целей высокого уровня.

Ниже предлагается один из вариантов, с помощью которого, по всей вероятности, можно будет преодолеть подобные затруднения. Фрейм представляется в виде " пакета" данных в процедурах, в таком же виде представляются и цели высокого уровня. Когда вызывается какой-либо фрейм, его пакет добавляется к " среде" текущей программы и определяемые им процессы получают непосредственный доступ к тем данным, которые им нужны, не ухудшая при этом возможности работы с остальными знаниями системы. Теперь следует рассмотреть два вопроса: как в деталях реализуется эта идея и насколько она хороша.

⇐ Предыдущая 5 6 7 8 91011 12 13 14 Следующая ⇒

Последнее изменение этой страницы: 2017-04-13; Просмотров: 343; Нарушение авторского права страницы