Искусственный интеллект и процессы решения задач человеком

Стр 1 из 14Следующая ⇒

В настоящей работе не проводится границы между теорией человеческого мышления и теорией построения " думающих" машин: разделять их в данный момент не имеет смысла, поскольку как в той, так и в другой области знаний отсутствуют концепции, достаточно общие для объяснения и тем более для моделирования сложной интеллектуальной деятельности. Однако одно отличие все же имеется. Дело в том, что у специалистов-психологов, работающих над проблемами интеллекта, наблюдается определенная тенденция к сокращению числа различных механизмов, включаемых в модели функционирования человеческого мозга. Это ведет к попыткам достигнуть большего эффекта с помощью меньшего, чем может быть обосновано, числа основных механизмов мышления. Такие теории уделяют недостаточно внимания как вопросам управления психической деятельностью, так и уточнению наших знаний об отдельных интеллектуальных процессах. Ученые, работающие в области ИИ, видимо, сосредоточили все свои усилия именно на этих вопросах, но ни те, ни другие, однако, не придавали должного значения изучению самой структуры знаний, особенно знаний процедурального типа.

Можно понять, почему психологи чувствуют себя не очень уверенно, оперируя сложными схемами, не основанными на тщательно выверенных механизмах мышления. Однако стремление к ограничению их числа еще не соответствует данному этапу развития науки в той мере, в какой это может иметь место в будущем. Анатомия и генетика мозга являются той областью знаний, в которой можно предположить значительно большее число разнообразных механизмов, чем это можно себе представить сегодня. Нам следует сосредоточить свое внимание скорее на проблемах достаточности и эффективности, чем на проблеме необходимости.

Еще несколько лет назад главная цель работ по распознаванию образов сводилась к проблеме достаточности: найти любые пути, ведущие к разработке алгоритмов машинного анализа сцен. Только недавно специалистам удалось обнаружить и реализовать возможности правильного объединения отдельных черт и признаков в законченные структуры образов. Отмечу, прежде всего, работы Л.Робертса(1965), А.Гузмана(1968), П.Уинстона(1970), Д.Хаффмана(1971), М.Клоувза(1971), Дж.Сираи(1972), Д.Вальтца(1972), которые характеризуют собой ряд этапов в разработке вопросов анализа изображений типа " фигура-фон", " целое-часть" и выделение структурных групп.

Хотя эти работы достаточно просты, на их основе можно дать не только поверхностное толкование феномена зрительного восприятия, но и в какой-то степени объяснить быстроту и гладкость его протекания. Теория восприятия образов сталкивается с рядом новых вопросов при переходе от проблемы достаточности к проблеме эффективности. Каким образом различные виды " признаков" могут столь быстро, как это имеет место в человеческой практике, приводить к идентификации и описанию сложных ситуаций? Каковы способы внесения изменений при выявлении ошибок или нахождении новых доказательств? Как разрешаются противоречия? Как может быть изменена информация о местоположении объекта без перевычисления состояний других связанных с ним предметов? Как обстоит дело с движущимися объектами? Каким образом процессы зрительного восприятия используют знания, связанные с общими, невизуальными видами деятельности? Каким образом человек координирует информацию, поступающую из различных источников? Как в системе могут использоваться ожидания относительно результатов предполагаемых действий? Может ли теория объяснить феноменологические результаты зрительного восприятия образов, а также управляемое самим ходом восприятия построение и манипулирование воображаемыми сценами?

В рамках традиционных подходов бихейвористской и перцептуальной психологии было сделано очень мало, чтобы найти ответы на эти вопросы; однако взгляды некоторых работавших ранее психологов (см.Ф.Бартлетт, 1932), несомненно, нашли свое отражение в настоящей работе. В более поздних работах по теории символьной обработки информации, в публикациях, подобных статьям А.Ньюэлла(1973) и Л.Пилишина(1973), содержатся более конструктивные предложения по формулированию этих спорных вопросов.

Отслеживание образа куба

"...при обычном способе осмотра любого непрозрачного предмета видимая часть его поверхности обычно занимает все наше внимание, а о противоположной, даже точно такой же его части человек обычно в это время не думает; однако малейшая попытка определить вид другой стороны предмета для построения общей картины уточняет наше первое представление о нем..."

У. Хогарт (1955)

Я начинал изложение с разработки упрощенной системы фреймов для представления перспективных видов куба. Далее она будет модифицирована для представления внутреннего вида комнат и для приобретения, использования и обновления информации, необходимой человеку при перемещениях внутри дома.

В соответствии с использованным в работе А.Гузмана(1968) символическим представлением тел правильной формы с помощью " областей" и " связей" между ними можно допустить, что результатом восприятия внешнего вида куба является структура, подобная тон, что показана на рис.1.1. Подструктуры А и В представляют детали и обозначения двух граней куба. При перемещении вправо грань А исчезает из поля зрения, тогда как видимой становится новая грань С. Если теперь, находясь по отношению к кубу в ином месте, попытаться заново провести весь анализ сцены, то придется забыть о том, что было известно об А; затем заново найти информацию о В и описать грань С.

Но поскольку мы переместились вправо, то можем сохранить информацию о В, связав ее с терминалом " левой грани" второго фрейма куба. Чтобы сохранить (на всякий случай! ) сведения об А, мы связываем его с дополнительным терминалом невидимой грани в новой схеме куба, показанной на рис.1.2.

Если же потом переместиться обратно влево, то можно восстановить первоначальную картину без перцептивных вычислений, для этого потребуется только лишь восстановить связи верхнего уровня с первым фреймом куба. Теперь нам необходима информация о грани С. Для этого понадобится добавить еще одну невидимую грань справа в первом фрейме куба (рис.1.3).

Можно продолжить эту процедуру, чтобы подобным образом представить результаты осмотра предмета с других сторон. Это приведет к более полной системе фреймов, в которой каждый фрейм представляет собой различные " перспективные виды" куба. На рис.1.4. показаны три фрейма, соответствующие перемещению влево и вправо на угол в 45 градусов. Если продолжить этот анализ, то результирующая система может стать очень большой. Для более сложных объектов требуется большее число различных проекций. Не ясно, все ли они необходимы в обычных условиях или же требуется только одна проекция для каждой их разновидности. Это зависит от обстоятельств.

Подобный тип сложной структуры, конечно же, не создается заново каждый раз, когда человек осматривает какой-либо предмет. Видимо, в долговременной памяти ранится большой набор систем фреймов, и одна из них активируется, когда данные и ожидания дают возможность предполагать, что она соответствует видимой картине. Как же это происходит? Если выбранный фрейм подходит не в той мере, как хотелось бы, и не удается быстро найти более подходящий, а вопрос достаточно важен, то происходит приспособление наилучшего из обнаруженных фреймов к реальной картине и он запоминается для последующих применений.

Строятся ли такие системы фреймов для каждого знакомого нам объекта? Это выглядело бы слишком экстравагантно. Представляется более вероятным, что у человека имеются специальные системы для представления наиболее важных объектов, а, кроме того, множество фреймов для обычно используемых " основных форм"; их сочетания образуют фреймы для новых применений.

Различные фреймы системы похожи на многочисленные " модели" объектов, описанные А.Гузманом(1967) и П.Уинстоном(1970). Различные фреймы аналогичны различным видам изображений, а имена межфреймовских указателей соответствуют перемещениям или действиям, изменяющим местоположение наблюдателя. Ниже будет обсуждаться вопрос о том, следует ли рассматривать эти виды в качестве двух- или трехмерных моделей объектов.

В каждый фрейм включены терминалы, служащие для присоединения указателей, идущих к его субструктурам. Одна и та же физическая черта может присутствовать в различных видах изображения объекта, следовательно, соответствующий ей терминал будет совместно использоваться сразу несколькими фреймами. Это позволяет представлять в одном месте информацию, собираемую не только в разное время и в разных местах, но и не зависящую от позиции наблюдателя. Это важно и для невизуальных применений систем фреймов.

Ход процесса согласования, результатом выполнения которого является решение, соответствует ли реальной ситуации выбранный фрейм или нет, зависит как от текущих целей, так и от информации, связанной с этим фреймом. Фреймы содержат в себе маркеры терминалов и другие ограничения, а цели используются для принятия решений о том, какие из этих ограничений существенны в данный момент, а какие нет. Вообще говоря, процесс согласования может содержать следующие компоненты:

1. Проверка на адекватность. Выбранный на основе ожиданий или предварительных данных фрейм должен вначале пройти проверку на правильность сделанного выбора; при этом используются знания о ранее выделенных элементах, их местоположении, об отношениях и наиболее вероятных субфреймах. Перечень текущих целей используется для принятия решения о том, какие терминалы и какие условия следует учитывать при составлении фрейма с действительностью.

2. Конкретизация. Затем фреймом запрашивается информация, необходимая для конкретизации значений тех терминалов, которые более не могут сохранять свои заранее заготовленные значения. Например, может потребоваться описание грани С, если соответствующий терминал в данный момент времени не означен и не отмечен как " невидимый". Задания должны согласовывать с текущими условиями, задаваемыми маркерами соответствующего терминала. Так, грань С может содержать маркеры для таких ограничений или ожиданий как:

правая центральная область изображения;

должно быть означено;

должно быть видимым; если нет. рассмотреть перемещение вправо;

должно быть субфреймом " грань куба";

использует совместно с гранью В терминал левой вертикальной границы;

при неудаче рассмотреть фрейм " ящик, лежащий на боку";

тот же цвет фона, что и у грани В.

3. Управление. При получении сведений о трансформации (например, о предстоящем перемещении) выбранный фрейм передает управление соответствующему фрейму той же системы.

При более подробном рассмотрении этой схемы управления видно, что в ней содержатся возможности для использования многих видов знаний. Если попытка задания значений терминалам не удается, то результирующее сообщение об ошибке может быть использовано для выбора альтернативного варианта. Пользуясь этим, ниже рассмотрим вариант организации памяти в виде сети подобия, как это сделано в работе П.Уинстона(1970).

12 3 4 5 6 7 8 9 10 Следующая ⇒

Последнее изменение этой страницы: 2017-04-13; Просмотров: 368; Нарушение авторского права страницы