ОБОСНОВАНИЕ ПРАВИЛЬНОСТИ ИНФОРМАЦИОННОГО ПОДХОДА

К ПРОБЛЕМЕ ЗРЕНИЯ

7.1. ВВЕДЕНИЕ

В первой и второй частях этой книги я предпринял попытку изложить достаточно подробно подход к изучению зрительного восприятия, заключающийся в том, что оно рассматривается главным образом как задача обработки информации. Я старался в процессе изложения отвечать на наиболее часто возникающие вопросы, однако опыт, приобретенный мной в попытках разъяснения сути этого подхода в процессе чтения лекций и дискуссий, заставляет предполагать, что у читателя еще могут быть сомнения и вопросы, оставшиеся без ответа, хотя они и могут сводиться к самым простым замечаниям типа того, что вся схема выглядит слишком искусственной или — на противоположном полюсе мнений — маловыразительна.

Если бы мы, однако, останавливались на всех возможных возражениях, то это в слишком сильной степени нарушило бы наше изложение. Поэтому я счел за благо вынести ответы на такие возражения в отдельный раздел, построив его в виде дискуссии сторонника информационного подхода с человеком, относящимся к нему скептически. Ее основу составляют беседы, в которых участвовали Франсис Крик, Томазо Поджо и я, но эта сконструированная дискуссия отнюдь не следует им буквально, а мой воображаемый оппонент объединяет в себе черты целого ряда реальных людей. Наша дискуссия структурирована в не очень значительной степени и охватывает множество проблем, но, по-видимому, это неизбежно.

ДИСКУССИЯ

Не начать ли нам с идеи уровней объяснения, поскольку Вы придаете ей столь большое значение? Каким образом она связана с представлениями о детекторах признаков, в частности с первым постулатом Хораса Барлоу [9, р. 380], гласящим: " Описание деятельности отдельной нервной клетки, результаты которой передаются в другие нервные клетки и влияют на их деятельность, а также ответ нервной клетки на воздействия, оказываемые на нее активностью других нервных клеток, обладают полнотой, достаточной для функционально понимания нервной системы "?

338

Я не могу, естественно, согласиться с этой формулировкой Барлоу, хотя полностью разделяю одно из положений, лежащих в ее основе, а именно что единственный феномен, поддающийся наблюдению, — это деятельность нервных клеток, поскольку именно они являются первичными коррелятами восприятия. Этот постулат Барлоу, однако, не в состоянии охватить анализ на первом уровне — на уровне информационной теории. Невозможно понять стереопсис, рассматривая исключительно нейроны. Необходимо при этом принимать во внимание единственность, непрерывность и основную теорему стереопсиса. Невозможно понять процесс восстановления структуры по движению, не зная результата типа теоремы о восстановлении структуры по движению, показывающего, почему такое явление возможно. Кроме того, у ров -невый подход вводит усилия исследователя в рамки строгой интеллектуальной дисциплины, а это обстоятельство чрезвычайно важно для исследователя. До тех пор пока Вы оперируете категориями механизмов или нейронов, Ваш анализ чреват сравнительной неточностью.

Вспомним о морали, которую мы вынесли из анализа схем нижнего уровня стереопсиса, рассматривавшихся в разд. 3.3! Ни в одной из них информационная задача не была точно поставлена на высшем уровне, и почти все предложенные схемы на самом деле предусматривали выполнение совсем не той обработки информации, какая была нужна. Другим примером служит концепция сегментации, обеспечивающая разбиение изображения на отдельные области и выделение на нем объектов. На эту концепцию была затрачена масса времени, что привело в конечном счете к созданию множества частных релаксационных методов и методов, основанных на выдвижении и проверке гипотез, которые были предназначены для сращивания отдельных областей изображения в " осмысленные" области (см. гл. 4). И в данном случае проблема состоит в том, что эйфория, связанная с механизмами, предназначенными для выполнения каких-либо конкретный функций, оказывается столь сильной, что специалисты начинают ошибочно полагать, что они понимают эти механизмы в степени, достаточной для разработки их аппаратной реализации, точно так же, как это имело место в более простом случае стереопсиса. Реальный же прогресс был возможен лишь при обращении к первому уровню, т. е. к построению 2, 5-мерного хкиза и связанных с ним средств, а также при условии точной постановки соответствующих задач.

Достаточно ли определенно я выразил свою мысль? Концепция уровней имеет решающее значение: не обращаясь к ней, невозможно понять восприятие — это просто недостижимо на пути мышления в категориях синаптичес-ких пузырьков, нейронов и аксонов, точно так же, как невозможно понять полет, изучая исключительно оперение. Контекст, обеспечивающий правильное понимание роли оперения, задается аэродинамикой. Еще один ключевой момент состоит в том, что обьяснение всякого явления следует искать на соответствующем уровне. Бессмысленно, например, пытаться достичь понимания быстрого преобразования Фурье, реализуемого на ЭВМ IBM 370, на языке транзисторов. Это просто не имеет смысла, поскольку было бы чрезвычайно трудно.

Возьмем, например, сетчатку. Я утверждаю, что с информационной точки

339

зрения она воспроизводит (по Х-каналам) величину V ² G * /и (по К-каналам) ее производную по времени d / dt (4² G * Г). С информационной точки зрения — это точное описание того, что делает сетчатка. Естественно, ей свойственно множество других функций: она преобразует свет, способна работать в колоссальном динамическом диапазоне, ее центральная ямка обладает очень интересными свойствами, она может перемещаться и т. д. Что именно Вы будете считать разумным описанием функций сетчатки, зависит от той точки зрения, которой Вы придерживаетесь. Лично я адекватным описанием считаю процедуру V² G, но я занимаю откровенно информационную позицию. Физиолог, специализирующийся на изучении сетчатки, не согласился бы с этим, поскольку хотел бы точно знать, каким образом сетчатка " вычисляет" эту величину. Специалист же по хеморецепции едва ли согласился бы с тем, что анализ такого рода вообще имеет какое бы то ни было отношение к сетчатке! Каждая из точек зрения соответствует определенному уровню объяснения, и для каждой из них в конечном счете должно быть найдено свое место.

Хорошо, я понимаю Вас. Вы просто утверждаете, что первостепенную важность с информационной точки зрения представляет то, что делается и зачем оно делается - именно это и составляет Ваш высший уровень. Подробности реализации соответствующих процессов не столь уж важны с этой точки зрения при том условии, что с помощью этих процессов делается именно то, что требуется.

Я бы хотел выразить эту мысль еще категоричнее. На рис. 7.1 приведены три описания, в сущности, одного и того же процесса. В верхней части рисунка помещено математическое описание, с которым мы очень хорошо знакомы: V² G * I. На рис. 7.1, б изображен участок сетчатки, реализующий, как мы считаем, именно эту процедуру (по крайней мере, частично). И наконец, на рис. 7.1, в представлен кремниевый кристалл интегральной микросхемы, изготовленной по технологии приборов с зарядовой связью сотрудником научно-исследовательских лабораторий фирмы Hughes Г. Наддом и предназначенной для выполнения процедуры свертки V²G. Итак, по существу, все три объекта — формула, сетчатка и микросхема — оказываются идентичными на самом общем уровне описания их функций.

Независимы ли на самом деле различные уровни объяснения⁷

В сущности, нет, хотя информационная теория некоторого процесса довольно независима от алгоритмического уровня и уровня реализации, поскольку она определяется исключительно подлежащей решению задачей обработки информации. Соответствующий алгоритм, естественно, в очень значительной степени зависит от информационной теории, но он зависит также и от характеристик тех " аппаратных" средств, с помощью которых он должен быть реализован. Так, например, возможно, что биологические механизмы лучше приспособлены для реализации параллельных, а не последовательных алгоритмов, в то время как, очевидно, прямо противоположное можно сказать о средствах современной цифровой электроники.

340

Право, я не могу согласиться с тем, что информационная теория столь независима от других уровней. Точнее, я не могу вообразить, чтобы оказались возможными две совершенно различные теории некоторого процесса. Теория 1 может существенно превосходить теорию 2, представляющую собой, возможно, всего лишь одну из точек зрения, причем слабо обоснованную, однако может оказаться, что нейронные сети не обеспечивают простой реализации теории 1, но прекрасно воспроизводят теорию 2. В результате тщательная проработка теории 1 Сказалась бы напрасной тратой сил.

б) Рис. 7.1. Математические выражение, описывающее предварительную фильтрацию изображения (в). Поперечное сечение сетчатки, одна из функций которой - реализация выражения а), б). Принципиальная схема кремниевого кристалла интегральной микросхемы, обеспечивающей выполнение процедуры а) со скоростью, соответствующей частоте телевизионных кадров (в). V² — оператор Лапласа; G — гауссиан; / (х, у) — изображение; * — символ операции

свертки

341

в)

Рис 7 1 (окончание)

Конечно, вполне возможно, что дело будет обстоять именно таким образом (мне кажется, что именно с таким случаем мы встречаемся в задаче определения формы объекта по данным о затенении). Меня вовсе не удивило бы, если бы оказалось, что решение интегральных уравнений Хорна при определении формы объекта по данным о затенении с помощью нейронных сетей вызывает неоправданные осложнения, в то время как эти же уравнения для простых случаев поддаются решению на вычислительной машине. Человек лишь в очень ограниченной степени способен восстанавливать форму объектов по данным о затенении; соответствующие модели часто строятся на основе упрощенных допущений, которые часто нарушаются (случай вышеупомянутой теории 2). Тем не менее я не уверен в том, что усилия, затраченные на углубленное исследование, подобное выполненному Хорном, напрасны, даже в данных обстоятельствах. Хотя они и не дают непосредственной информации относительно стратегий восстановления формы объектов по данным о затенении, используемым человеком, такие исследования могут служить источником информации, необходимой в качестве основы для построения рутинных рабочих моделей, используемых нами

Что Вы могли бы сказать относительно известных идей, связанных с детекторами признаков⁷ Насколько они согласуются с Вашим подходом⁷

В историческом плане, я полагаю, понятие признака (я вовсе не хотел бы здесь заниматься его точным определением) сыграло важную роль в отходе наших представлений от концепции полного действия Лешли (согласно кото-342

рой мозг является некоторой разновидностью мыслящей овсяной каши, причем единственным решающим фактором является количество этой каши, участвующей в работе в соответствующий момент времени) и в переходе на значительно более конкретные позиции, связанные с деятельностью отдельных нейронов (таких позиций мы и придерживаемся в настоящее время). Эта смена представлений произошла благодаря работам Барлоу [8], Каффле-ра [125], Леттвина с соавторами [133] и, естественно, Хьюбела и Уисела [95, 96] В сущности, их результаты в конечном счете привели к возникновению представления, согласно которому одной из функций, выполняемых отдельными нервными клетками, является воспроизведение в явном виде сообщения о том, что на входе имеется некоторая конкретная и очень специфическая конфигурация — излагалось же это представление в категориях признаков.

В связи с основным вопросом^- в каких случаях наличие специфической конфигурации на изображении означает, что некоторая специфическая конфигурация реально существует во внешней среде? — возникает, однако, ряд чрезвычайно занимательных проблем. Первая из них (мы уже сталкивались с ней в гл. 1) связана с тем, каким образом описания внешней среды возникают в действительности. Так, например, лягушка фактически пытается обнаружить не муху — она отыскивает маленькие движущиеся черные пятнышки

подходящего размера Аналогичным образом комнатная муха на самом деле не получает представление наблюдаемого мира, в котором она находится. Она просто вычисляет значения двух параметров (^, Ф), которые вводятся в быстродействующее устройство, порождающее момент вращения, в результате при преследовании самки муха достаточно часто завершает этот процесс успешно. С другой стороны, совершенно очевидно, что человек действительно в явном виде определяет характеристики реальных наблюдаемых им поверхностей Интересно, что одной из особенностей эволюции зрительных систем является постепенный переход к решению трудной задачи представления все более существенных аспектов наблюдаемого мира Вознаграждением служит рост пластичности зрительной системы, который достигается за счет роста сложности анализа и, следовательно, роста затрат времени и размеров мозга, необходимых для его осуществления.

Ограничивается ли, однако, этим то, что можно сказать об идеях, связанных с признаками ^?

Нет, не ограничивается Существует интересный круг проблем, которые в определенной мере побуждают нас вновь обратиться к работам философов, изучавших восприятие, используя категории " сенсорных атомов", объединяющихся в более крупные " молекулы" сенсорного опыта, которыеи представляют собой те объекты, которые мы в состоянии распознавать. Вероятно, можно было бы выявить некую традицию попыток изучения распознавания, основанного на использовании признаков. Их отправной точкой можно считать идеи Барлоу [8], затем появился метод многомерного шкалирования Краскапа [124], Далее следует отметить прекрасную монографию Джардина и Сибсона, посвященную кластер-анализу [105], мои ранние работы по но-

343

вой коре [142] и огромное число работ, посвященных теории статистических решений.

В чем же состояла главная идея?

В ее основе лежала надежда на то, что процесс распознавания может осуществляться следующим образом: Вы смотрите на изображение, выделяете на нем признаки и используете найденные признаки для классификации и, следовательно, распознавания того, что Вы наблюдаете. В основе такого подхода лежит некоторое допущение, сводящееся, в сущности, к тому, что разумно заданные классы объектов определяют в некотором многомерном пространстве признаков, координаты которого соответствуют отдельным измеримым признакам, выпуклые или почти выпуклые области. Это означает, что " одинаковые" объекты — элементы одного и того же класса — характеризуются признаками, обладающими большим сходством, чем объекты, не являющиеся одинаковыми.

Это выглядит вполне логично. Что же было здесь не так?

К сожалению, это просто неверно — наблюдаемый мир ведь столь сложен. Неясно, относится признак к изображению или к соответствующему объекту? Различные условия освещения порождают совершенно разные изображения и точно то же самое можно сказать о различных точках наблюдения. Даже в таком частном случае, как изолированные двухмерные стилизованные рукописные символы, трудно установить, что должен представлять собой признак. Посмотрите, чю происходит при постепенном переходе от 5 к 6: исчезает угол, сужается промежуток. Практически ни для одной цифры нельзя ограничиться каким-либо единственным признаком. Зрительные описания, необходимые для решения этой задачи, должны быть более сложными и не столь непосредственно связанными с тем, что мы рассматриваем как их естественное представление в виде цепочки штрихов, нанесенных отдельными движениями.

Следовательно, Ваш главный тезис сводится к тому, что наш мир просто слишком сложен и потому не может служить источником разновидностей анализа, подобных тому, который порождается идеей детектора признаков?

Это верно, за исключением, естественно, тех случаев, когда для наблюдаемой среды удается задать жесткие ограничения: освещение, точка наблюдения, диапазон, в котором элементы поддаются наблюдению, и т. д. Если это сделано, то можно рассчитывать на получение определенных результатов. В противном случае — нет, причем для того, чтобы удостовериться в этом, приходится очень тщательно изучать публикации, поскольку об отрицательных результатах обычно не сообщается, несмотря на то, что подобные результаты могут оказаться исключительно важными при оценке перспективности соответствующей стратегии исследования.

Какие возможности существуют в тех случаях, когда объект исследования не позволяет вводить столь жесткие ограничения'!

Таких возможностей имеется две: использование более сложного крите-

344

рия принятия решений и использование лучшего представления. Переход к более сложному критерию принятия решений означает отказ от надежд на то, что классы соответствуют выпуклым кластерам признаков, и включение в процесс принятия решений логических механизмов, с тем чтобы вопросы, которые ставятся на определенном этапе процесса классификации, могли формулироваться с учетом полученных к этому моменту ответов. Грубо говоря, из этого подхода развился искусственный интеллект. Этот же подход приводит к взгляду на распознавание или классификацию как на разновидность направления решения задач. Решения, принимаемые в процессе поиска окончательного решения, и пути его поиска существенно зависят от частных результатов, получаемых в процессе определения окончательного решения;

эти результаты, в свою очередь, определяют, какую информацию необходимо использовать, для того чтобы процесс решения продолжался. В гл. 5 мы встречались с примерами такого подхода. Другая возможность связана с использованием некоторого представления или последовательности представлений, которые лучше приспособлены для решения именно той задачи, которую требуется решить в конкретном случае. Для зрения практически именно эта задача оказывается более существенной, хотя для таких областей, как медицинская диагностика, более плодотворным может оказаться подход, основанный на методах решения задач.

Не может ли оказаться так, что существуют какие-то иные подходы, которыми можно было бы воспользоваться для рассмотрения этих проблем? Что Вы могли бы сказать относительно процедурного представления знаний, использованного Виноградом [257] (в соответствии с таким способом представления, скажем, понятия типа " поднимать" или " кубик" представляются программами)! Если Вы хотите, чтобы был поднят кубик, то Вы прост последовательно реализуете две соответствующие программы. Мне такой подход кажется вполне разумным. Каким образом он связан с упоминавшимися Вами двумя возможностями*!

Процедурное представление на самом деле вовсе не является представлением — это просто некий способ реализации. Представление — значительно более точно определяемый объект. Так, в частности, не существует ни одного результата, который определял бы границы процедурного представления или вводил бы какие-нибудь условия единственности (в том смысле, как это было сделано в гл. 5). Этот механизм не в большей степени является представлением, чем любой список свойств! Как мы уже убедились, для того чтобы определить некоторое представление, следует задать его непроизводные элементы, возможный способ их " устройства" и т. д. В данном случае (в этих процедурных представлениях) непроизводными элементами служат просто примитивы соответствующего языка программирования (в работе Винограда — языка Плэннер или Лисп). Такие непроизводные элементы бесполезны при представлении того, что действительно реализует соответствующий процесс, если речь идет о любом описании высокого уровня, точно так же, как отдельные команды программы, реализующей быстрое преобразование Фурье и написанной на каком-либо машинном языке, бессмысленно исполь-

345

зовать для понимания смысла этого преобразования. Для того чтобы понимать программу и работать с ней, необходимо ввести в нее комментарии. Именно комментарии, а не машинный код, обеспечивают, в сущности, представление того, какого рода обработку информации выполняет программа. Программа HACKER, разработанная Сассманом [223], как раз и служит примером попыток создания полезного стандартного комментария в одном из конкретных и узких направлений программирования.

Почему Вы считаете, что список свойств не есть способ представления знаний? Так ли это на самом деле!

Этого я не утверждаю. Я считаю лишь, что список свойств не является представлением. Он является одним из приемов программирования, которым можно воспользоваться, чтобы реализовать некоторое представление, но собственно представлением не является. Для того чтобы убедиться в этом, достаточно поставить очень простой вопрос: что можно и что нельзя представить в списке свойств? Или, если воспользоваться приведенным выше выражением, каковы границы его возможностей? Единственно ли любое описание? Бессмысленно ставить зти вопросы применительно к списку свойств, точно так же, как и применительно к процедурам. Оба эти механизма универсальны с точки зрения представления, поскольку на самом деле они оба относятся к нижнему уровню объяснения и связаны с решениями, касающимися реализации. Это — не представления, это - механизмы. Выбор того или иного механизма влияет на то, сколь сложно или просто будет программисту придать какой-то части информации явный вид, однако решение о том, что именно должно переводиться в явную форму и что не должно, — это решение, касающееся собственно представления и не зависящее от механизма реализации.

Ах, так - ну, хорошо, давайте вернемся снова к признакам, поскольку именно от понятия признака мы в конце концов пришли к идее о том, что роль представления состоит в переводе определенной информации в явную форму, не так ли!

Именно так. Я считаю, однако, что пора отказаться от этих старомодных взглядов; значительно продуктивнее обратиться к системам представлений, позволяющих с необходимой полнотой описывать, во-первых, изображения, а затем и иные извлеченные из изображения аспекты наблюдаемого мира. Кроме того, я думаю, что важно не придавать чрезмерного значения установлению непосредственной связи наших идей с нейронным уровнем объяснения. В первую очередь следует убедиться в том, что наши представления и алгоритмы точны, устойчивы и основываются на психофизических данных. После этого можно будет углубиться в нейрофизиологию.

Прежде чем оставить эту тему, как мне кажется, следует обсудить еще одну проблему. Речь идет о признаках (допустим, что начиная с этого момента мы будем говорить о них как об описаниях) и об изменениях, позволяющих получать их. В чем точно заключается различие между некоторым элементом описания (вероятно, его можно было бы называть высказыванием) и соответствующим измерением? Действительно ли это так существенно? 346

Эта проблема имеет два аспекта. Один — исторический, который связан с тем, что еще в 1974 году, в этом вопросе имела место фантастическая путаница. Говоря проще, эта путаница состояла в том, что понятия измерений и высказываний смешивались в одну кучу. Так, например, нервная клетка, рецептивное поле которой обладает центрально-периферической организацией, будет отвечать на появление какого-либо пятнышка, но, кроме того, она будет отвечать и на появление множества иных объектов — линии, ярко-стного перехода, двух пятнышек и т. д. В сущности, часто по этому поводу нельзя сказать ничего, за исключением того, что нервная клетка воспроизводит значение свертки, например нашего " старого приятеля" V²G*7. Тем не менее эти клетки называли детекторами пятнышек.

Это не так уж страшно, когда речь идет о сетчатке, но если понимать определение простой нервной клетки (простейшая разновидность рецептивного поля), данное Хьюбелом и Уиселом [95], буквально, то оно также сведется к выполнению линейной свертки -с одной возбуждающей полоской и одной тормозящей полоской. В результате на выходе будет воспроизведена величина, близкая к первой производной по направлению. Сегодня я не считаю, что эти нервные клетки реализуют операцию линейной свертки (см. гл. 2), но дело, однако, состоит в том, что находятся люди, считающие их одновременно и устройствами, реализующими процедуру линейной свертки, и детекторами признаков, а это уже — интеллектуальное преступление. Естественно, выходные сигналы таких устройств, реализующих операцию линейной свертки, можно использовать для обнаружения яркостных переходов, но для этого требуются дополнительные усилия: необходимо отыскивать максимумы первых производных или пересечения нулевого уровня вторых. И естественно, теперь мы считаем, что простые клетки на самом деле являются детекторами пересечений нулевого уровня. Дело, однако, в данном случае снова состоит в том, что исключительно из-за неорганизованности мышления специалистов в области машинного зрения, а также и физиологов, упущена из вида плодотворная теория предварительной обработки изображений в зрительной системе в целом (см. гл. 2).

Второй аспект проблемы вполне актуален и в наши дни — он возникал уже в нашем рассмотрении в гл. 2 и связан с тем, когда и каким образом зрительные процессы " осуществляются с помощью символьных операций". Большинство согласится с тем, что некоторая матрица яркостей 1{х, у) или даже результат применения к ней операции свертки V ² G * I не очень похожи на объект, образованный символами. Это просто непрерывный двухмерный массив, некоторые элементы которого вызывают очевидный интерес. Тем не менее, когда мы начинаем говорить о людях и автомобилях, полях и деревьях, то явно'в очень значительной степени оперируем символами, и я снова подчеркиваю, что большинство сможет обнаружить намеки на символы в результатах экспериментов Хьюбела и Уисела [95]. Наша позиция состоит в том, что зрение обращается к операциям над символами практически сразу — прямо на стадии пересечений нулевого уровня, причем вся прелесть заключается в том, что переход от аналогового представления в виде некоторого массива к дискретным ориентированным отрезкам, пересекающим

347

нулевой уровень под определенным углом, осуществляется., вероятно, без потери информации [157, 179].

На этом использование символов ни в коем случае не заканчивается. Предварительная обработка изображений в зрительной системе почти полностью сводится к манипулированию символами. Концы, нарушения непрерывности, локально-характерные объекты, допустимые прямые, группы, границы — все эти объекты представляют собой чрезвычайно абстрактные конструкции, и лишь для очень немногих из них обнаружены нейрофизиологические кор-релянты; тем не менее эксперименты, подобные поставленным Стивенсом [220], указывают, что объекты такого рода должны существовать (см. гл. 2).

Каким еще образом можно было бы подойти к изучению этих явлений? Что Вы могли бы сказать о какой-либо разновидности трансформационного или структурного подхода, подобного использованному Хомским?

Предпринимались попытки разрабатывать грамматики для анализа изображений, включавшие правила, которым должны удовлетворять штриховые рисунки [173]. Однако эти грамматики в целом были неудачны и ни разу не увенчалось успехом их использование при анализе какого-либо реального изображения. Среди первых работ, выполненных в рамках такого подхода, наилучшим, как мне кажется, оказались варианты анализа миров, построенных из кубиков, которые были предложены Гасманом [75], Макуэр-том [139] и Уолцем [241]. К сожалению, обобщение этого анализа не было получено: он подвержен влиянию неправильного выбора соответствующего минимира, как, впрочем, и большая часть исследований в области искусственного интеллекта. Величайшей заслугой работ в области искусственного интеллекта явилось то, что они побуждали исследователей подтверждать свои взгляды с помощью соответствующих программ ЭВМ, причем в процессе разработки таких программ они часто убеждались в неправильности своих представлений. Эти исследования прокладывали путь конструктивному способу мышления, отвергая, например, данное Бертраном Расселлом определение восприятия объекта как множества всех допустимых образов этого объекта [208]. Сталкиваясь, однако, с необходимостью программировать в рамках таких исследований реальности, исследователи очень часто оказываются связанными с каким-либо мини-миром, в котором очень многие факторы проявляются лишь в простых формах. Хотя такие программы не были предназначены для решения отдельных задач, в целом они работали достаточно хорошо, для того чтобы обеспечить получение искомого результата. Именно к этому жанру относится программа Винограда, предназначенная для анализа мира, образованного кубиками [257]. Основная концептуальная ошибка здесь заключается в игнорировании модульности_; использование которой позволяет проводить разбиение задачи.

Я что-то не улавливаю Вашу мысль. Зачем здесь нужна модульность и каким образом она игнорировалась?

Как и раньше, я полагаю, что наиболее яркие примеры предоставляет нам зрение. Мини-миры, использовавшиеся в первых исследованиях, или, если

348

угодно, предметная область, представляли собой миры, состояние из кубиков, — конфигурации, образованные призмами, которые имели белую матовую поверхность и располагались на черном фоне. В результате изучения этой предметной области Уолц аккуратно систематизировал типы узлов, которые могут возникать при " встрече" различных типов яркостных переходов (как это показано на рис. 1.3) [241]. Допустив затенение, Уолц обнаружил, что большинство штриховых рисунков, построенных по таким сценам, допускает однозначную интерпретацию. Обратите, однако, внимание на то обстоятельство, что ни один из процессов общего характера, рассматривавшихся в гл. 3, в рамках этого подхода объяснен не был. Причина же состоит в том, что непросто изучать процессы общего характера, комбинация которых и создает зрение человека, если ограничиваться каким-то частным мини-миром, за исключением тех случаев, когда соответствующий мир тщательно выбирается исходя из уже сложившихся у исследователя представлений о том, что такой мир действительно соответствует какому-то модулю (как это имеет место в случае стереограмм, образованных случайными конфигурациями точек).

Принципиально важно понять различие между этими двумя разновидностями мини-миров. Первые имеют очень частный характер, вторые — общий. До сих пор была подтверждена ценность лишь мини-миров второго типа, хотя ограничения типа использованных Уолцем могут оказаться полезными применительно к 2, 5-мерному эскизу (см. гл. 4). Дело в том, что для истинных информационных модулей, отличающихся универсальным, а не частным характером, действительно можно доказывать теоремы, устанавливающие работоспособность этих модулей в реальном мире.

Именно в этом состоит подлинная разница между подходом, изложенным в данной книге, и концепцией, лежащей в основе искусственного интеллекта; отчаянные попытки запихнуть целостный действующий мини-мир в программу вычислительной машины (предприятие, требующее выполнения неимоверного объема работы) заставили искусственный интеллект (как направление) пренебречь попытками создать подлинную теорию, а затем и вовсе отказаться от таких попыток, сосредоточившись вместо этого на усовершенствовании инструментальных вычислительных средств. Эти усилия не увенчались особыми достижениями. Таким образом, хотя подход, практикуемый искусственным интеллектом, был необходим для того, чтобы избавить нас от ложных исходных представлений о простоте зрения, он, в свою очередь, стал ограниченным и бесплодным из-за неспособности осознать, что такое истинная информационная теория и каким образом ее следует развивать.

Существуют ли правила, обеспечивающие успешное выполнение такой работы?

Не думаю. Я считаю, что неудачи вначале вполне естественны. Пример.с полетом, приводившийся нами выше, прекрасно иллюстрирует ряд важных моментов. Во-первых, очевидно, что невозможно понять, каким образом летает птица, рассуждая о деталях структуры ее оперения. Поэтому естественно в качестве следующего шага попытаться повторить поведение птицы — я назы-

349

ваю это стадией имитации. В результате люди пытались строить крылья по образу и подобию птичьих и летать, размахивая ими. Из этого вообще ничего не получилось. На этой стадии имитация ограничивалась, в сущности, двумя нижними уровнями или, быть может, лишь вторым уровнем. Подлинный успех приходит лишь после того, как Вы понимаете, что профиль крыла обеспечивает аэродинамическую подъемную силу в соответствии с уравнением Бер-нулли. Эта часть относится к первому уровню - уровню аэродинамики. Именно она объясняет подобие птицы и самолета " Боинг-747" и отличие их от комара, который держится в воздухе не за счет крыльев, а буквально " протаптывая воздух" в настоящем турбулентном режиме

На каком-то этапе, однако, ведь все-таки придется непосредственно связать представления, относящиеся к первому уровню, с нейронными механизмами, не так ли? Вы говорили о глазах - о сетчатке и о V²^-преобразовании; что, однако, Вы могли бы сказать относительно движения глаз? Я понял, что с Вашей точки зрения (я хотел сказать, с ючки зрения обработки информации и уровней объяснения) они слишком тривиальны, для того чтобы заниматься ими. Это, однако, никак не облегчает мне поиск механизма, соответствующего им на нейронном уровне.

Да, я согласен с тем, что это трудная проблема. Но, во-первых, как я надеюсь, в гл. 4 было ясно показано, что движения глаз отнюдь не сводятся к обычному вычитанию. Мы установили там, сколь тесно, скажем, представление ориентации поверхности связано с тем, выбираете ли Вы систему полярных координат, привязанную к сетчатке (естественную с точки зрения формирования изображения), либо какой-либо более инвариантный тип привязанной к сетчатке системы координат.

Во-вторых, если отложить переход от системы координат, привязанной к сетчатке, то соответственно уменьшится сложность вычислительных операций, необходимых в тот момент, когда переход, наконец, осуществляется. В соответствии с изложенным в гл. 5 можно непосредственно переходить к представлению 3-мерной модели, для которого используется некоторая устойчивая система координат, привязанная к наблюдателю. После этого остается убедидься лишь в том, что при движении глаз соответствующее пятнышко перемещается так, как оно должно перемещаться.

И наконец, я полагаю, что в данном случае, как и всегда, не следует позволять обманывать себя кажущимися свойствами и богатством нашего восприятия. Мы уже сталкивались с этой проблемой в связи с непосредственностью и живостью нашего восприятия. Я был бы удивлен, если бы оказалось, что при движении глаз мы в состоянии уследить за чем-либо, выходящим за пределы минимума объектов, и считаю, что возможности человека в этом отношении чрезвычайно ограниченны.

Хорошо, я согласен с правдоподобностью Ваших доводов. Они, однако, не предполагают использования наших уровней, не так ли? Мне кажется, что это проблема несколько иного рода

Совершенно верно, однако, объясняется это главным образом тем, что теория движений глаз, относящаяся к первому уровню, столь проста, что мы 350

даже не упоминали ее там. Мне кажется, что фактически общие идеи, касающиеся этих проблем, можно найти у Гибсона, и совершенно очевидно, что их ясно сформулировали в конце 1960-х — начале 1970-х годов Марвин Мински и Симор Пейперт. Тем не менее эти общие идеи никогда не разрабатывались подробно. Курьезно, что происходило это из-за того, что искусственный интеллект оставался лишенным головного мозга: не было осознано существование теории первого уровня, которую предстояло создать. Это направление быстро продолжало (а часто и продолжает) погружаться в трясину механистических объяснений, в рамках которых запоминание должно обеспечиваться какой-либо разновидностью нервной сети, процессом, реализуемым на вычислительной машине, или некоторым набором процедур.

Мне это неизвестно. Эти способы кажутся мне вполне разумными объяснениями памяти. Почему Вы находите их столь предосудительными⁹

Действительно, в простых случаях типа движения глаз можно прибегать к столь непосредственному стилю рассуждений, оставаясь безнаказанным. Очень опасно, однако, рассчитывать на то, что подобный стиль мышления в принципе может позволить в самом деле прийти к какому бы то ни было истинному пониманию тех задач обработки информации, решением которых заняты нейронные механизмы.

Рассмотрим в качестве примера известный и элегантно сформулированный случай — обсудим вкратце теорию фреймов, предложенную Минским. Фрейм представляет собой, в сущности, некоторый объект, которому можно приписать различные свойства. Рассмотрим, например, следующие свойства слова, представленного в виде фрейма:

Имя Клайд

Цвет Розовый

Вес Большой

Аппетит Большой

Фрейму можно также поставить в соответствие и процессы, а содержание фрейма можно оснастить разнообразными взаимосвязями и индексами. В своей наиболее известной работе, относящейся к этой проблеме, Минский описывает, сколь велико число " субъективно правдоподобных" явлений, поддающихся рассмотрению в рамках этого подхода при условии, что используемые концептуальные элементы достаточно " велики" [168]. Я, од-ко, считаю этот подход фундаментально порочным из-за свойственного ему стиля мышления, основанного на анализе механизмов. Это возвращает нас к одной из уже обсуждавшихся проблем. Если бы фреймы давали некоторое представление, а не просто механизм можно было бы сразу установить, что поддается представлению с их помощью, а что — нет. Это может быть сделано, но пока еще не сделано. До тех пор пока это не сделано, следует остерегаться идей типа фреймов или списков свойств. Дело в том, что этот метод предполагает, скорее, мышление в категориях сравнений, чем рассмотрение каких-то реальных объектов, точно так же, как анализ зрения, основанный на изучении отдельных частей Фурье-спектра, является аналогом рассмотрения

351

описаний изображения, относящихся к различным масштабным уровням. Это слишком неточный метод, для того чтобы он мог оказаться полезным. В таких ситуациях подлинного прогресса можно добиться, лишь точно сформулировав соответствующие задачи обработки информации, возникающие в пределах нашего первого уровня.

Ваша точка зрения не относится, однако, исключительно к фреймам, не так ли? Не справедлива ли она по отношению ко всему искусственному интеллекту в целом?

Да, Вы это очень точно заметили — подходы, основанные на рассмотрении механизмов, по-настоящему опасны. Дело в том, что целью подобных исследований служит, скорее, имитация, чем достижение подлинного понимания, и они могут легко выродиться в написание программ, лишь самым механическим образом имитирующих отдельные узкие аспекты поведения человека. Именно к этой категории относит свою программу ELIZA Вейценбаум [247], и я не вижу никаких оснований не согласиться с ним. В более дискуссионном плане, но также критически я оценил бы исходя из этих позиций работу Ньюэлла и Саймона, посвященную системам правил подстановки [176], и отдельные части работы Нормана и Румелхарта [180], посвященной долговременной памяти.

А почему все-таки?

Причина состоит в следующем. Если мы считаем целью исследований, выполняемых в рамках информационного подхода, постановку и осмысление конкретных задач обработки информации, то главную роль должны выполнять структуры этих задач, а не механизмы, с помощью которых реализуются их решения. Следовательно, исходя из этого в первую очередь необходимо отыскать задачи, которые мы в состоянии хорошо решать, выяснить, каким образом они решаются, и проанализировать нашу деятельность, опираясь на достигнутое понимание задач. Наиболее продуктивным источником подобных задач служат те операции, которые нам удается выполнять хорошо, легко и, следовательно, бессознательно, поскольку трудно понять, каким образом могла бы обеспечиваться надежность при отсутствии в основе доброкачественного метода.

К сожалению, исследования, посвященные решению задач, по вполне очевидным причинам оказались сконцентрированными вокруг тех задач, которые вполне понятны содержательно, но вызывают затруднения, когда человек пытается их решать. Речь идет о таких задачах, как решение в уме вычислительных и криптоарифметических¹ задач, доказательство геометрических теорем, игра в шахматы, — обо всех тех задачах, качество решения которых человеком существенно зависит от его индивидуальных способностей, и достижение хороших результатов, очевидно, основывается на использовании колоссального объема знаний и опыта.

¹ Например, задачи типа DONALD. + GERALD = ROBERT. Требуется найти цифры, соответствующие каждой из букв.

352

Я утверждаю, что они создают исключительно благоприятные условия, чтобы не приступать к изучению того, каким образом человек справляется с такими задачами. У меня нет сомнений, что, решая в уме вычислительные задачи, мы хорошо справляемся с какими-то задачами, однако последние не являются вычислительными задачами; в результате мы оказьюаемся далеки от понимания хотя бы одного элемента того, что представляет собой изучаемое явление. Поэтому мне кажется, что нам следует в первую очередь заняться более простыми задачами, поскольку именно на этом пути можно рассчитывать на получение реальных достижений.

Если не обращать внимания на эти критические замечания, то Вы будете получать неправдоподобные механизмы, которые могут послужить основой лишь для выводов о том, что они не в состоянии обеспечивать решение тех задач, которые не может решать человек. Как мне кажется, системы правил подстановки прекрасно соответствуют этой характеристике. Если даже рассматривать их как механизмы в рамках их определения, очень многого еще продолжает не хватать. Для использования в качестве языков программирования они плохо сконструированы и с ними неудобно работать — мне трудно поверить в то, что мозг человека может страдать от столь плохих способов реализации на столь важном уровне.

Эта идея имитации - сводится ли она лишь к мышлению в категориях сопоставлений, как Вы заметили выше?

Да, в очень значительной мере это именно так. В сущности, можно было бы провести и другую параллель, на этот раз между системами правил подстановки, используемыми специалистами в области решения задач, и Фурье-анализом, используемым специалистами в области нейрофизиологии зрения. Простые операции, связанные с построением пространственно-частотного представления изображения, могут имитировать ряд интересных особенностей, свойственных, очевидно, зрительной системе человека. В их число входят обнаружение повторяющихся событий, некоторые зрительные иллюзии, концепция отдельных независимых каналов, выделение формы объекта в целом из мелких локальных деталей, а также простой способ обеспечения инвариантности по размерам. Причиной игнорирования специалистами в области анализа изображений пространственно-частотной области служит то обстоятельство, что она фактически бесполезна с точки зрения главной задачи зрения — построения описания, указывающего, что где находится, на основе матрицы яркостей. Интуитивные знания, которыми не располагают специалисты в области физиологии зрения и которые столь важны, относятся именно к тому, каким образом может быть построено подобное описание. В качестве средства обработки информации система правил подстановки воспроизводит^ несколько интересных идей: отсутствие в явном виде обращений к подпрограммам, использование канала связи типа " классная доска" и наличие некоторой разновидности кратковременной памяти.

Однако именно то, что системы правил подстановки обнаруживают эти побочные эффекты (подобно тому, как фурье-анализ " отображает" некоторые зрительные иллюзии), и означает отсутствие у них какой бы то ни было

353

связи с происходящим в действительности. Я предполагаю, в частности, что возможность выполнения кратковременной памятью роли регистра запоминающего устройства, вероятно, является наименее важной из ее функций. Я считаю, что существует несколько " интеллектуальных рефлексов", связанных с обработкой объектов, хранящихся в такой памяти, причем до сих пор об этих рефлексах нам ничего не известно, хотя в конечном счете выяснится, что именно они являются факторами, определяющими работу кратковременной памяти.

Изучение деятельности человека в рамках систем правил подстановки кажется мне напрасной тратой времени, поскольку это занятие эквивалентно изучению некоторого механизма, но не задачи. И снова, механизмы, ради постижения которых предпринимаются подобные исследования, будут раскрыты в процессе изучения тех задач, которые требуют решения, точно так же, как продвижение в области изучения зрения происходит потому, что изучается именно проблема зрения, а не нейронные механизмы зрительной системы.

Что Вы могли бы сказать о памяти человека? Вы высказали предположение, что и в этой области направление исследований было выбрано неправильно. Что Вы имели в виду?

Я упоминал о работе Нормана и Румелхарта, посвященной возможному способу организации информации в долговременной памяти. Опасность в данном случае снова заключается в том, что проблемы ставятся безотносительно четко определенной задачи обработки информации. Как раз наоборот, проблемы ставятся и их решения находятся в категориях механизмов — в данном случае речь идет о механизме, названном " активной структурной сетью", причем он столь прост и универсален, что лишен теоретического смысла. Норман и Румелхарт могли бы заметить, что подобная " ассоциация", возможно, существует, но они не в состоянии были ни указать, из чего эта " ассоциация" состоит, ни утверждать, что для решения задачи х (с которой человек может справиться) память должна быть организована некоторым конкретно определенным образом, причем, если подобная организация имеет место, в качестве побочных эффектов должны возникать некоторые поддающиеся идентификации " ассоциации" определенного типа.

Феноменологическое крыло экспериментальной психологии может выполнить важную работу, состоящую в отыскании нуждающихся в объяснении фактов, в том числе относящихся к долговременной памяти, и, как мне кажется, скажем, Шепард [213], Роек [205] и Уоррингтон [242] весьма преуспели в этом отношении. Экспериментальная психология, однако, подобно экспериментальной нейрофизиологии, будет не в состоянии объяснять эти факты до тех пор, пока в рамках исследований, посвященных обработке информации, не будут выявлены и решены отражаемые этими фактами задачи обработки информации. Я думаю, что это именно то направление, которому нам следует посвятить свою энергию.

Что в таком случае Вы скажете о работе Гантера Стента, посвященной пиявкам? Разве в ее основе не лежит также изучение механизма?

354

Это подразумевалось. Работа посвящена детальному исследованию механизма, с помощью которого пиявка может плавать. Я очень высоко оцениваю эту работу, так же как и работу тюбингенской группы, посвященную домашней мухе, но считаю, что существовавшие в свое время надежды получить на основе эти результатов очень существенные обобщения не увенчались успехом, причем объясняется это снова проблемой уровней. Задачи обработки информации, которые должны решаться нервной системой, определяют то, что она должна делать. Возможно, человек снабжен какими-либо простыми осцилляторами, действующими подобно пиявке, и с очень большой натяжкой можно было бы рассчитывать использовать их в конце концов для понимания некоторых особенностей дыхания. Тем не менее результаты такого рода не объяснят нам, каким образом человек видит.

Наблюдается явно выраженное стремление устанавливать в конечном счете связь объяснения со структурой - в этом, несомненно, проявляется влияние молекулярной биологии. Не думаете ли Вы, что это было достигнуто в данном случае? Или Вы считаете все это предприятие совершенно безнадежным?

Да, я согласен с тем, что это следует сделать для центральной нервной системы, но сомневаюсь в том, что это вообще осуществимо в целом. Барьер сложности слишком высок. Не забывайте, однако, что мы уже приступили к этой работе! Обнаружение пересечений нулевого уровня и избирательность по направлению тематически очень близки к нейронному уровню. Проявляйте больше терпения в ожидании дальнейших результатов! Как уже отмечалось выше, я держу пари, что невозможно понять быстрое преобразование Фурье, рассматривая, каким образом оно реализуется на уровне транзисторов в ЭВМ IBM 370. Только на понимание выражающих его формул мне требуется около 10 минут, не говоря уже о принципиальной схеме, реализующей их. И еще одно замечание в заключение: я не думаю, что эволюционные и генетические программы будут поддаваться пониманию непосредственно в терминах соответствующих механизмов, составляющих их основу. Я предполагаю, что для понимания процесса развития в силу его сложности потребуется в конечном счете некоторая многоуровневая структура.

Есть ли надежда вернуться к непосредственному анализу зрительного восприятия и того, что в действительности происходит, когда Вы используете зрение?

Хорошо, не устроят ли Вас идеи, связанные с первоначальным эскизом?

Я думаю, что удовлетворят. Важнейшим представляется то, что предварительная обработка изображений в зрительной системе в высшей степени связана с манипулированием символами. Действительно, используются утверждения, указывающие, где оканчиваются линии (да, да - я даже принимаю этот язык и меня в данном случае даже не очень беспокоят нейроны! ), а также и такие, которые указывают, что искомые линии и допустимые линии столь же " реальны", как и любые другие. Можно, например, определять ориентацию и тех и других и оперировать ими. Не в этом ли состоит идея?

355

В очень значительной степени именно в этом, и если говорить еще об одной ключевой идее, то следует упомянуть локально-характерные объекты и способность пользоваться приближенными критериями выбора при группировке подобных локально-характерных объектов и отыскании образов-конфигураций (как это было проиллюстрировано с помощью рис. 2.3).

У меня еще осталась легкая неудовлетворенность в связи с представлением пространственных отношений - на изображении, естественно. Я помню обсуждение систем координат, проведенное в гл. 2, однако убедило оно меня не до конца. Каким образом мы можем убедиться в том, что важная пространственная информация не утрачивается ^?

Да, в этом отношении следует проявлять осторожность, поскольку я не думаю, что значительная часть информации, заключенной в пространственных отношениях, переводится в явную форму на очень ранней стадии обработки. Так, например, совершенно очевидно, что отсутствуют врожденные структуры для информации типа " угол, образованный двумя линиями". Этот вид информации не появляется в явном виде в полном первоначальном эскизе; в 2, 5-мерном эскизе также отсутствует информация об угле, образованном двумя поверхностями. Эти величины не относятся к восприятию. Их область действия — представление 3-мерной модели. С другой стороны, всего лишь нескольких пространственных отношений (типа допустимых линий, заключенных между соседними локально-характерными объектами) часто оказывается достаточно для неявной передачи геометрии фигуры в целом. Это может оказаться справедливым даже в случае чрезвычайно неточных измерений длин (допустимо, что они просто упорядочены по значениям).

Яркий пример богатства информации, которую могут дать всего лишь несколько признаков сходства, являют археологические данные Флиндерза Питри. Он оценивал подобие захоронений, обнаруженных в верхнем течении Нила, на основе числа совпадающих характеристик осколков гончарных изделий, найденных в этих захоронениях. Опираясь лишь на эту информацию о сходстве и используя методы типа многомерного шкалирования, удается довольно точно определять время погребения. Этот случай получил очень интересную интерпретацию [119]. Мы же хотим лишь заметить, что в двухмерном случае ситуация характеризуется даже еще большими ограничениями. Я не считаю, что угроза потери информации велика, но я уверен в том, что лишь сравнительно небольшая часть пространственной информации переводится в явную форму на ранних этапах обработки изображений в зрительной системе.

Итак, мы получаем полный первоначальный эскиз, после чего вступают в действие все описанные в гл. 3 процессы, для того чтобы снабдить нас информацией о поверхности? И, грубо говоря, все это действие разворачивается в полярных координатах, привязанных к сетчатке, быть может, с небольшими различиями в зависимости от того, какой именно процесс реализуется?

Да, это действительно так, причем информация о поверхности, приносимая каждым из этих процессов, объединяется в 2, 5-мерном эскизе, по-преж-

356

нему используется система координат, привязанная к сетчатке, причем, возможно, более удобная, чем полярные координаты. В истинном смысле чистое восприятие на этом заканчивается. К этому моменту информация уже подготовлена для преобразования в представление в виде 3-мерной модели реального объекта, т. е. в описание, которое затем можно хранить в памяти.

Меня все еще беспокоят этот процесс объединения-увязывания, а также мысль о юм, что изо всего богатства подробностей Вы оставляете всего лишь некоторое описание. Эю выглядит как-то чересчур умозрительно.

Ну, во-первых, данное описание может отличаться произвольной степенью подробности — зто просто вопрос времени и усилий, затрачиваемых на его получение. Другая проблема связана с утверждением о том, что зрительное восприятие сводится к формированию подобных описаний. Да, здесь действительно происходит концептуальный скачок, который я прошу Вас принять. Лично мне не удается обнаружить каких-либо существенных последствий, возникающих из-за того, что эту точку зрения не удается обосновать в общем случае, и, поскольку мы уже достигли, вероятно, понимания 20 — 25% процесса в целом, я искренне считаю, что остальная часть процесса имеет такой же характер. Несомненно, это концептуальный скачок, но я полагаю, что пока эта идея заслуживает право на существование, поскольку анализ зрительного восприятия применительно к формированию конкретных разновидностей описаний позволяет объяснять столь многое столь просто. Не пытайтесь, однако, всегда думать о зрении применительно к нейронному уровню! Это просто невозможно: структура зрения достаточно сложна на верхнем уровне и она исключительно сложна на уровне монтажной схемы.

Оканчивается ли этап непосредственного восприятия воплощением в 2, 5-мерном эскизе результатов тех процессов, которые рассматривались в гл. 3^?

Я думаю, что это подходящий момент для проведения раздела, поскольку вплоть до него факторы, относящиеся к высшим уровням, очень незначительно влияли на эти процессы или вообще не оказывали на них никакого влияния. Эти процессы воспроизводили только ту информацию, которую они порождали — ни больше, ни меньше. Понятие непосредственное восприятие несколько дезориентирующе, так как реализация процессов, о которых идет речь, может требовать определенного времени (возьмите, например, слияние стереограммы, образованной случайными конфигурациями точек), но она не предусматривает досконального анализа (в стиле Джуле-са), т.е. активного осмысленного изучения изображения и сопоставления его частей. Это соответствует случаю стереограммы, образованной случайными конфигурациями точек, поскольку, как мы считаем, при большой продолжительности времени, затрачиваемого на восприятие такой стереограммы, задержка в основном определяется случайными движениями глаз, связанными с попытками обнаружить отправную точку слияния.

Если 2, 5-мерный эскиз изменяется при каждом движении глаз, то он утрачивается при каждом таком движении (за исключением, быть может, малых перемещений исключительно по глубине). Не кажется ли все это Вам ужасно расючительным?

357

Это, несомненно, расточительство, но елей имеется механизм, позволяющий заново обработать соответствующую сцену в естественном масштабе времени, то такая расточительность уже не имеет значения. В сущности, она чуть ли не обязательна, поскольку смысл существования 2, 5-мерного эскиза заключается в объединении и представлении поступающей в процессе восприятия информации, но не в ее хранении, и поэтому возможность сэкономить на вычислительной мощности за счет использования большей памяти здесь реально не используется. Допустим, например, что 2, 5-мерный эскиз всегда имеет разрешение, соответствующее центральной ямке сетчатки, и управляется, как обычно, центральной ямкой сетчатки. В результате память немедленно оказалась бы почти полностью загружена устаревшей информацией (или ничем не загружена). Память же предназначена вовсе не для этого. Прежде чем происходит обращение к чуть ли не любой реальной памяти, должен быть осуществлен переход к какому-то представлению типа 3-мерной модели, обладающему значительно большей устойчивостью, чем привязанный к наблюдателю образ объекта быстротечного мира. Таким образом, представление, объединяющее информацию, поступающую из различных источников, должно быть привязано к сетчатке и должно изменяться, оно должно располагать областью центральной ямки сетчатки, отличающейся высоким разрешением, и точно отображать только поступающую в данный момент информацию.

Эти требования выглядят разумными, однако у меня возникают затруднения, когда я соотношу их с собственным опытом. Проблема заключается в юм, что в этой модели восприятия происходит столько разнообразных событий, в то время как мое собственное восприятие отличается определенной цельностью, единством, которое, как мне кажется, не согласуется с этими идеями или, по меньшей мере, в них не отражается. Каким образом вся эта информация связывается в единое целое? Каким образом можно объяснить цельность зрительного опыта?

Основная идея действительно предполагает, что очень многое осуществляется с помощью практически независимых процессов. На уровне 2, 5-мерного эскиза между этими событиями устанавливается связь, однако только неявная, в то время как следующий шаг посвящается построению привязанных к объекту описаний наблюдаемых форм объектов (которые могут быть представлены с помощью системы координат, привязанной к наблюдателю); описание в данном случае представляет собой некоторый единый объект, построенный просто добавлением соответствующих свойств к основному описанию формы объекта — это делается примерно так же, как при работе писателя, которому нужно расцветить свое изложение (он вводит в текст качественные прилагательные).

Что Вы имеете в виду, говоря о наличии " лишь неявной" связи?

Не более того, что, несмотря на разное действие различных процессов, имеется возможность установить, когда результаты их реализации относятся к одному и тому же видимому объекту. 358

Вы имеете в виду, что если некоторый процесс, относящийся к необработанному первоначальному эскизу, привел к обнаружению яркостного переходила процесс, относящийся к цвету, привел к определению его цвета, то связь между этими двумя видами информации существует лишь в неявном виде? Мне не совсем ясен этот момент.

Это всецело вопрос адресации. В большинстве вычислительных машин информация адресуется посредством указания о том, где ее следует искать. В некоторых вычислительных машинах обращение к порциям данных основывается на указании этих порций. Такая память называется ассоциативной; ее нетрудно организовьтать. В нашем случае мы, возможно, имеем дело с комбинацией этих двух способов адресации, т. е. с чем-то вроде " яркостный переход, расположение которого в зрительном поле приблизительно определяется координатами (х, у), ориентация составляет, скажем, 30° и его яркость соответствует некоторому заданному значению". Такое описание полностью определяет рассматриваемый яркостный переход как применительно к представлению в виде необработанного первоначального эскиза, так и применительно к процессам, относящимся к цвету. Таким способом можно уста-носить связь между этими двумя разновидностями информации, по крайней мере в принципе.

А что, осмелюсь спросить, Вы можете сказать по поводу всех этих полей коры головного мозга? Разве не естественно было бы предполагать, что каждое из них имеет дело с отдельным процессом?

Меня это не удивило бы.

В таком случае то, что Вы говорите, сводится, в сущности, к следующему: вплоть до данного момента каждый из процессов развивается независимо, причем, возможно, в различных полях коры головного мозга (к настоящему времени обнаружено по меньшей мере 10 таких полей, неправда ли? ), и, снабдив каждый из них приближенной информацией, в качестве которой могут использоваться приближенные значения координат и ориентации, Вы точно устанавливаете, о каком видимом объекте идет речь.

Да, это проблема адресации.

И затем Вы, кроме того, получаете точную информацию, соответствующую специализации конкретного поля или процесса — значение цвета или ducwpai нести, например.

Именно так. Кроме того, я считаю в этой связи важнейшим то обстоятельство, что объединение информации производится с помощью операций над символами.

Что собственно Вы имеете в виду?

Это не похоже на наложение трех отпечатков, используемое в полиграфии для получения цветной иллюстрации. Мы никогда не воспринимаем цвет объекта как нечто, размазанное в пределах его границ. Дело в том, что приближенная информация о положении и ориентации используется в качестве адреса. Если необходимо установить точное расположение границы объекта,

359

следует обратиться к необработанному первоначальному эскизу. Если необходимо установить цвет объекта, следует обратиться к процессу, дающему информацию о цвете.

Понятно. Эта идея предполагает, что процесс объединения информации должен быть очень активным, не так ли? До тех пор пока некий механизм не обратит специально внимания на то, что пересечение нулевого уровня х стереоизображения представляет собой коричневую границу, эти две порции информации будут продолжать оставаться разделенными.

Да, я думаю, что пришлось бы специально поинтересоваться цветом пересечения нулевого уровня х. Очевидно, многие из этих операций осуществляются автоматически в процессе движения глаз. В конечном счете именно для этого, в частности, предназначен 2, 5-мерный эскиз, т. е. для преобразования информации о геометрических свойствах поверхности, поступающей от множества процессов, привязанных к сетчатке, в некоторую единую, более удобную для использования и привязанную к наблюдателю форму. В то же время связи с описаниями других свойств поверхности устанавливаются таким об^:разом, чтобы доступ к ним осуществлялся проще; это связано с подготовкой к построению трехмерного описания, привязанного к объекту.

Таким образом, Вы считаете, что подлинное объединение не осуществляется, вероятно, до того момента, пока не начинается построение 3-мерной модели?

Да.

Это выглядит так, как будто бы все цепочки символов, соответствующие всей необходимой информации, тщательно подготовлены и размечены, но их объединение не начинается до тех пор, пока не начинается построение 3-мерной модели.

Причем эти порции информации могут быть очень приближенными либо являться составными элементами очень точной информации. Таким же образом можно предполагать, что и другие свойства задаются приближенно (например, цвет — зеленоватый) или очень точно (например, точно указывается оттенок зеленого цвета).

Каким образом, однако, это согласуется с моим личным опытом восприятия? Он говорит мне о том, что восприятие целостно, а не половинчато, плохо определено и фрагментарно, каким оно предстает в Вашем описании.

Ну, хорошо. Вспомним, во-первых, что зрительные процессы, свойственные человеку, могут протекать чрезвычайно быстро. Время, проходящее между запросом информации, характеризующей какой-то участок зрительного поля, и переводом на него глаз, получением необходимой информации и установлением ее связи с 3-мерной моделью, обычно не превышает половины секунды. Во-вторых, насколько точно Вы в состоянии воспроизвести незнакомую Вам сцену, если взглянули на нее лишь мельком⁷ Довольно неточно! Ее общую организацию и, возможно, одну-две детали. И как только Вы закрываете глаза, все богатство восприятия исчезает, не так ли? Я считаю, что

360

богатство восприятия соответствует доступному в текущий момент, на уровней чистого восприятия, причем то, что Вы в состоянии воспроизвести мгновенно, значительно теснее связано с описанием 3-мерной модели, которое Вы формируете, пока Ваши глаза открыты.

Я начинаю лучше осознавать продуктивность идеи о том, что восприятие -это построение некоторого описания.

Да, именно в этом и состоит суть всей проблемы, и очень важно достичь согласия именно по этому пункту.

Давайте допустим, что Вы правы и, следовательно, 2, 5-мерный эскиз привязывается к сетчатке и человек, обрабатывая его, строит небольшие 3-мерные модели и помещает их в пространственную систему координат, привязанную к наблюдателю. Что происходит, если Вы существенно смещаете взгляд?

Во-первых, точно определенные очертания объекта, который Вы только что рассматривали (допустим, что это была фарфоровая кошка) и для которого Вы только что построили детальное описание, превращаются в пятно на изображении, как только Вы переводите взгляд, для того чтобы рассмотреть соседнюю фигурку (фарфоровую собаку). Если это пятно удается надежно идентифицировать в 2, 5-мерном эскизе, то я должен допустить существование некоторого процесса, поддерживающего связь между ним и 3-мерной моделью, построение которой Вами только что завершено, в результате чего, если пятно перемещается, Вам немедленно становится известно, что именно перемещается.

Но как же, наконец, все это выполняется с помощью нейронов?

Потерпите, пожалуйста, —сейчас мы к этому приступим. Обратите, однако, внимание на то, что с точки зрения информационных процессов принципиальных затруднений это не вызывает.

Трудно, однако, увязать все это с тем, что, как мне представляется, значит " видеть" - непросто все это принять.

Постепенно Вы войдете во вкус. Решающее значение имеет первый шаг: если Вы согласитесь с тем, что зрение - это обработка информации, выполняемая ради построения некоторого описания, то дальше Вы сможете перейти к изучению того, что такое описание на самом деле и как именно его можно строить.

И все-таки мне нелегко согласиться с тем, что Вы столь много внимания уделяете обработке информации. Мозг в конечном счете состоит из нейронов, а не из кремниевых кристаллов. Очевидно, однако, я к этому привыкну. Кроме юго, если зрение - это построение описаний, то реализовываться они должны на нейронном уровне, не так ли? Поэтому нельзя ли рассчитывать на установление нейрофизиологических коррелятов 2, 5-мерного эскиза или какого-то фрагмента 3-мерной модели? Это было бы убедительно.

Было бы просто замечательно, если бы реализация оказалась столь проста — соответствовала бы постулату Барлоу об активности нейронов! Лично

361

мне кажется, что она больше соответствует последнему, чем теории клеточного ансамбля Хебба.

Меня продолжает беспокоить еще одно общее положение - оно относится к временной непрерывности перцептивного опыта. Мне вполне понятно Ваше представление о том, каким образом может поддерживаться непрерывность при движении глаз и т. п., однако Вы оставляете в стороне более крупную проблему чисто временной непрерывности. Почему, когда я смотрю на дерево, я все время вижу его как одно и то же дерево? Вероятно, в каждый момент времени я мог бы начинать строить для него новую 3-мерную модель и в этом случае я должен был бы воспринимать пятно, представлявшее старое дерево как новое. Тем не менее этого не происходит. Можете ли Вы это прокомментировать?

Неизменность видимого мира (непрерывность объектов во времени) является исключительно важным аспектом зрения; я думаю, допущение этой неизменности стало просто одним из наших рефлексов, сформировавшихся в процессе развития. В сущности, вся обработка зрительной информации в целом основывается на выявлении и использовании условий непрерывности (одним из примеров здесь служат процессы установления соответствий, рассматривавшиеся в гл. 3).

Возьмем еще одно общее положение. Вы рассматриваете лишь форму. Как в таком случае обстоят дела с распознаванием в случае, когда задача состоит в отнесении к одному классу двух объектов, имеющих различную форму, но выполняющих одну и ту же функцию (например, два стула различной конструкции)?

Наша теория не может сказать ничего относительно распознавания на семантической основе, присвоения объектам имен или функций, хотя, несомненно, это направление имеет для распознавания в реальном мире почти столь же большое значение, как и определение формы [244]. Я считаю, что проблема понимания того, что имеется в виду, когда говорят о семантике некоторого объекта, исключительно интересна, но я считаю также, что она действительно чрезвычайно сложна и в настоящее время в значительно меньшей степени поддается решению, чем проблемы, возникающие в связи со зрительным восприятием.

Если общая схема, описываемая Вами, верна, нельзя ли сделать какие бы то ни было заключения, касающиеся живописи и рисования^ опираясь на знания о юм, что делает зрительная система с изображениями, поступающими на ее вход? Могут ли эти знания, например, помочь при обучении живописи и рисованию?

Возможно, хотя мне бы очень не хотелось сейчас связывать себя какой-то определенной точкой зрения. Тем не менее было бы интересно обратить внимание на то, какие представления предпочитают, а иногда и разрушают различные художники. Пуантилисты, например, экспериментируют в основном с образом; остальная часть схемы обработки зрительной информации остается неизменной, причем во всех других отношениях картина имеет самый

362

обычный вид. Пикассо же, с другой стороны, совершенно определенно разрушает почти полностью уровень 3-мерных моделей. Трехмерность его фигур не имеет реалистического характера. Пример художника, работающего в основном на этапе представления поверхности, найти несколько труднее — быть может, это Сезанн?

Если обратиться к другим задачам, например типа тех, которые возникают в связи с естественным языком, насколько универсален оказывается проповедуемый Вами подход? Насколько широко он может применяться? Каковы задачи, при решении которых он может не сработать?

Системы, не обладающие модульностью. Процессы типа тех, с помощью которых собираются цепочки аминокислот, с тем чтобы получить белок, т. е., иначе говоря, сложные системы, элементы которых взаимодействуют между собой, испытывающие многообразные влияния, которыми нельзя пренебрегать. Самой острой проблемой изучения понимания естественного языка является, несомненно, вопрос о степени его модульности и о том, что собственно эти модули собой представляют.

Хорошо, я допускаю, что модульность может оказаться ключевым моментом, но ведь важно, чтобы обеспечивалась и некоторого рода беглость, не так ли? Если некоторый процесс не в состоянии развиваться легко, гладко, без посюроннего вмешательства, если его течение постоянно требует сознательного вмешательства, то может оказаться, что для такого процесса отсутствует " прозрачная " теория и эти свойства приведут его в класс процессов типа формирования белков, теории которых трудны для понимания. Если, однако, возвратиться к естественному языку, то какие модули обнаружены для него?

Этот вопрос неясен; некоторые специалисты утверждают, что естественный язык по своей природе не обладает модульностью и потому должен анализироваться в значительно большей мере гетерархически.

Не напоминает ли это положение ситуацию, существовавшую в период, когда исследования зрения только начинались?

Да, боюсь, что это так. Представляется, однако, что действительно существуют модели, а также и соответствующие правила, возникающие на нижнем уровне, — правила слогообразования, правила просодии и пользующийся наибольшей известностью анализ синтаксиса, выполненный Хомским.

Насколько, однако, можно считать синтаксис отдельным модулем? Разве не утверждают специалисты в области искусственного интеллекта, как, например, Шенк, что синтаксис вовсе не является отдельным модулем?

Согласен, причем очевидно, что синтаксическая расшифровка предложения не может проводиться совершенно независимо от семантического анализа этого предложения. Постепенно, однако, возникает представление о том, что необходимая степень взаимодействия между двумя этими видами анализа мала, а вопросы относительно синтаксиса, на которые требуется получать ответы, оказываются самого простого рода, скажем: относится ли некоторая

363

часть предложения к первой именной составляющей или ко второй? Маркус [140] первым подробно исследовал эти проблемы и показал, что система синтаксического анализа может составить очень хороший модуль. На высших относительно синтаксиса уровнях, однако, в настоящее время имеется лишь самое незначительное число сведений о том, что представляет собой модульность, но я уверен, что такие сведения должны появиться.

Почему специалисты в области искусственного интеллекта столь упорно отвергают традиционные (в стиле Хомского) подходы к синтаксическому анализу? Создается впечатление, что лишь один Маркус принимает их?

Я думаю, что происходит это по двум причинам. Во-первых, легко привести примеры, в которых синтаксический анализ невозможен без сопутствующего семантического анализа. Таким образом, поскольку оказывается, что синтаксис не является подлинно независимым модулем, то исходя из этого специалисты в области искусственного интеллекта хватаются за противоположную точку зрения, согласно которой синтаксис вообще не является модулем. Это неверно: на самом деле синтаксис, очевидно, представляет собой почти модуль, нуждающийся в некотором взаимодействии с семантикой, однако число видов такого взаимодействия чрезвычайно мало.

Вторая причина связана с нашим старым приятелем — проблемой уровней. Теория трансформационных грамматик Ноама Хомского относится к теориям первого уровня, а это означает, что она не имеет никакого отношения к тому, каким образом должно реализовываться структурное распознавание. Эта теория просто определяет правила, указывающие, что должно представлять собой разбиение некоторого произвольного предложения. Хомский выразил эту идею, сформулировав свою теорию как теорию владения языком.

Идея уровней не была, однако, по-настоящему понята специалистами в области вычислительной лингвистики. В самом деле, одно из возражений Винограда против подхода Хомского состояло в том, что трансформационную структуру нельзя инвертировать для того, чтобы превратить ее в систему синтаксического анализа! Такое замечание может принадлежать лишь человеку, которому не удается понять разницу между первым (что и зачем) и вторым (каким образом) уровнями. Эта ошибка не выделяет Винограда из общего рядй, однако все, кто работает в области искусственного интеллекта, совершили ее, а сейчас, по мере того, как использование вычислительной техники становится для лингвистов привычным, они попадают в ту же ловушку. В результате, как я опасаюсь, программы вычислительных машин, предназначенные для работы с естественным языком, дают довольно мало для понимания естественного языка, за исключением работ Маркуса [140], приступившего к созданию настоящей теории второго уровня, описывающей используемый человеком алгоритм синтаксического анализа.

Какие подходы к семантике Вам кажутся наиболее перспективными?

Вероятно, это подход, который я называю проблемой множественности описаний объектов, и подход, связанный с решением проблем референции, вносимых проблемой множественности описаний.

364

Не можете ли Вы осветить эту тему подробнее⁷

Хорошо. Подобно многим другим, работающим в этой области, я думаю, что наше понимание мышления должно основываться по меньшей мере на одном, а возможно, и на нескольких главных принципах, касающихся организации и представления знаний и определяющих, в некотором смысле, что именно важно в общей природе интеллектуальных способностей человека. Эти принципы, которые как будто бы начинают выкристаллизовываться, хотя они еще несколько неопределенны, можно сформулировать следующим образом.

1. Сферы мышления, языка, памяти и восприятия должны быть шире, чем это допускается самыми последними психологическими теориями [168]. Они должны отличаться также очень высокой эластичностью, причем будет нелегко точно учесть это требование.

2. Восприятие некоторого события или объекта должно предусматривать одновременное построение нескольких различных описаний его, охватывающих различные аспекты использования, назначения и сопутствующих обстоятельств соответствующего события или объекта.

3. Различные описания, упоминающиеся в принципе 2, включают как приближенные, так и точные описания. Первые составляют существенный элемент выбора адекватных общих сценариев, необходимых в соответствии с принципом 1, и правильного назначения ролей, выполняемых теми объектами и операциями, которые определяют выбор сценария.

Для того чтобы лучше уяснить эти принципы, рассмотрим пример. Если Вы читаете следующий отрывок:

" Муха яростно билась в оконное стекло. Джон поднял газету.",

то немедленно заключаете, что намерения Джона в отношении этой мухи явно злонамеренны. Если бы он взялся за телефон, то вывод не был бы столь определенным. Все согласны с тем, что " угрожающий насекомому" сценарий, возникающий каким-то образом при чтении этих предложений, в самой приближенной форме порождается информацией о том, что муха яростно бьется в оконное стекло. Подобный сценарий содержит референцию к какому-то предмету, с помощью которого можно раздавить муху на хрупкой поверхности, т. е. описание, указывающее, что газета здесь годится, а телефон — нет. Можно, следовательно, прийти к заключению, что при упоминании газеты (или, в случае зрения, при виде газеты) не только строится ее внутреннее описание (как газеты) и задается приближенное описание 3-мерной модели газеты, определяющее ее форму и оси, но эта газета описывается также и как некоторый легкий и гибкий объект, имеющий протяженность в длину и ширину. Поскольку второе предложение могло бы иметь продолжение: " и сел читать", газета должна быть описана и как предмет чтения; аналогичным образом она должна быть описана как легковоспламеняющийся предмет, как шуршащий предмет и т. д. Поскольку обычно нам заранее неизвестно, какой именно аспект объекта или действия важен, то из этого следует, что на протяжении большей части времени рассматрива-

365

емый объект будет служить источником ряда различных приближенных внутренних описаний. То же самое относится и к действиям. Вероятно, важно отметить, что газете не обязательно ставится в соответствие описание, раскрывающее прихлопывание мухи, чтение или зажигание огня, — просто используется то описание газеты, которое соответствует ее роли согласно действующему сценарию.

Почему Вы считаете, что все должно происходить именно так?

Важность каталога простых приближенных описаний событий и объектов определяется ролью, которую такие приближенные описания играют в построении конкретных сценариев, возможно весьма искусно разработанных, и в обращении к ним, причем роль эта осуществляется примерно тем же способом, каким некоторая универсальная 3-мерная модель животного может в результате соответствующего взаимодействия между изображением информации, заключенной в каталоге моделей, превратиться в конечном счете в очень конкретного Чеширского Кота. То, что выглядит после появления первого предложения немногим более чем враждебные намерения относительно невинной мухи, после появления дополнительной информации о газете превращается во вполне конкретную ситуацию прихлопывания мухи. Еще неизвестно, каким образом это достигается лучше всего и какие именно описания должны ставиться в соответствие различным словам или воспринимаемым объектам.

Что Вы могли бы сказать о других видах обработки информации, осуществляемой мозгом, о таких, например, как планирование поведения и реализация выработанных планов? Не окажется ли проще отыскивать модули на этих направлениях? В конце концов, семантика - это одна из тех областей, в которой способности человека достигли наибольшего развития, и поэтому не столь уж беспочвенно предполагать, что она может оказаться сложной. Я бы попробовал что-нибудь попроще.

Я полагаю, что, вероятно, это отличный совет, и в этой связи мне вспоминается замечательный эксперимент, поставленный Стаммом [219]. Речь идет о так называемой задаче с отсроченной реакцией (см. рис. 7.2): кусочек пищи помещается в одно из двух углублений, опускается экран, после того как время задержки заканчивается, экран поднимается, и животное имеет возможность направиться к тому углублению, в котором, по его мнению, спрятана пища. Известно, что в решении этой задачи участвуют некоторые участки префронтальной коры; при их удалении животное не в состоянии справиться с этой задачей. Стамм воспользовался методом деполяризации, с помощью которого ему удавалось эффективно " отключать" эти участки коры на необходимый ему период времени. Он задался вопросом: когда соответствующий участок префронтальной коры должен находиться в работоспособном состоянии, для того чтобы задание могло быть выполнено? Оказалось, что животному необходимо, чтобы префронтальная кора работала, когда экран опускается и начинается отсчет времени задержки. Если же соответствующий участок префронтальной коры оказывается выведенным из строя в любой другой момент времени, то это сказывается 366

в)

Рис. 7.2. Иллюстрация эксперимента с отсроченной реакцией. На виду у животного кусочек пищи помещается в одно из углублений, после чего между животными и этими углублениями на время помещается экран. После того как экран убирается, животное должно выбрать одно из двух углублений. Если оно делает правильный выбор, то получает пищу

на выполнении задания во много меньшей степени либо вообще не сказывается!

Результаты этого эксперимента можно интерпретировать, например, следующим образом. Любая вычислительная машина, работающая в реальном масштабе времени, должна быть способна формировать планы, подго-^ тавливать их к выполнению при определенных условиях и подготавливать пусковые схемы, обеспечивающие их реализацию. Невозможно каждый раз повторять заново все операции обработки информации, и действительно, структура личности отчасти состоит из тысяч подобных микропланов, каждый из которых предназначен для реализации одного из паттернов поведения человека в соответствии с возникновением определенных условий. Для разработки таких планов должен, однако, существовать какой-то механизм; возможно, в эксперименте Стамма мы встретились с простым примером того, как это происходит. Когда углубления исчезают из поля зрения животного, оно включает в свой набор планов задание двигаться к соответствующему углублению после того, как такая возможность появится. Это простой план, но тем не менее это — план.

Если несколько развить эту идею, то мы убедимся в том, что она подразумевает разделение центральной нервной системы на две части, которые можно определить как орган планирования и исполнительный орган соответственно. Орган планирования вводит планы и их пусковые схемы в исполнительный орган, который, когда приходит время и возникают необхо-

367

димые условия, реализует эти планы. Так ли уж абсурдно предполагать, что в процессе гипноза исполнительный орган становится доступен программированию извне и именно благодаря этому оказывается возможным задавать человеку, находящемуся в гипнотическом состоянии, планы, которые будут реализовываться позже при наступлении предписанных условий? Идея заслуживает обсуждения, по меньшей мере.

Это интересная мысль. Мне до сих пор вообще не приходилось встречать объяснений возможности " программировать" кого бы то ни было, а Ваше предположение выглядит вполне правдоподобным. Что, однако, Вы могли бы сказать относительно " шаблонной" природы программирования? Ведь поведение человека чрезвычайно гибко, не так ли? Несколько затруднительно привести эту особенность в соответствие с возможностью существования некоего набора запрограммированных реакций.

Я думаю, что это полностью зависит от того, сколь велико, разнообразно и искусно организовано сформированное множество паттернов поведения. Если оно содержит широкий набор паттернов и обеспечивает возможность действовать по-разному в лишь слегка различающихся ситуациях, то можно считать, что имеется возможность демонстрировать гибкое поведение и, между прочим, более свободно выбирать паттерны, поскольку при этом будет учитываться соответствующим образом более широкий спектр адекватной информации. Если информация не используется (случайные паттерны) либо используется лишь какая-то отдельная порция информации (форсированные паттерны), то, естественно, нельзя считать, что наше поведение характеризуется гибкостью или свободой.

Очевидно, здесь действительно наблюдается существенная разница. По мере того, однако, как мы приближаемся к утверждению о том, что мозг — это некоторая вычислительная машина, меня все больше и больше тревожит проблема сути человеческих ценностей.

Утверждение о том, что мозг — это некоторая вычислительная машина, верно, но оно вводит в заблуждение. Мозг действительно является высокоспециализированным устройством для обработки информации или, скорее, множеством таких устройств. Отношение к мозгу человека как к устройствам для обработки информации ни в коей мере не выхолащивает и не отрицает человеческие ценности. Если уж поднимать эту проблему, то именно данная точка зрения отражает тенденцию к поддержке этих ценностей и может в конце концов помочь нам понять, что собой в действительности представляют человеческие ценности с информационной точки зрения, почему их природа избирательна и каким образом они вплетены в потенциальную способность человека к социальному поведению и организации, которой оделяют нас наши гены.

СЛОВАРЬ ТЕРМИНОВ

Быстрое преобразование Фурье (БПФ) -fast Fourier transform ( FFT ). Быстродействующий алгоритм цифровой обработки сигнала, предназначенный для выполнения преобразования Фурье на числовой матрице, размерность которой определяется некоторой степенью числа 2. Этот алгоритм был предложен Дж. М. Кули и Т. У. Тьюки. Некоторое время тому назад С. Виноградом был предложен алгоритм, обладающий еще более высоким быстродействием; этот алгоритм называют очень быстрым преобразованием Фурье (ОБПФ) ( VFFT ).

Вергентные движения глаз - vergence eye movements. См. дизъюнктивные движения глаз.

Ганглиозные клетки сетчатки - retinal ganglion cells. Слой нервных клеток, который последним включается в обработку информации, выполняемую сетчаткой. Аксоны этих нервных клеток выходят из сетчатки через так называемое слепое пятно, образуя зрительный нерв. См. ^-клетки и У-клетки.

Гауссиан - gaussian ( G ). Так называемое распределение Гаусса (или нормальное распределение) в двухмерном случае определяется как G (г) = = (1/2тго³)ехр(-г^,/2а²).

Главная ось (модели) - principal axis. Ось трехмерной модели, к которой присоединяется большая часть осей компонентов модели, например ось туловища трехмерной модели четвероногого.

Глубина — depth. Субъективное представление наблюдателя о расстоянии до наблюдаемой поверхности.

Гороптер — horopter. Известно несколько определений гороптера. В данной книге под гороптером понимается поверхность, диспаратность которой при текущем положении глаз равна нулю.

Граничный случай Панума - Panum ' s limiting case. См. рис. 3.19.

Двоичное отображение изображения — bit map. Удобный способ приближенного представления расположения объектов на изображении. Двухмерный массив ставится в соответствие х, д'-координатам изображения, и расположение на нем объектов указывается с помощью занесения 1 в соответствующую ячейку массива.

2, 5-мерный эскиз - 2, 5-с/ sketch. Представление глубины и ориентации наблюдаемых поверхностей, привязанное к позиции наблюдателя и включающее контуры нарушений непрерывности по этим параметрам (см. рис. 3.12).

Дизъюнктивные движения глаз — disjunctive eye movements. Движения глаз, изменяющие относительные направления взгляда двух глаз (делая их более конвергентными или более дивергентными), но не изменяющие среднее направление взгляда глаз.

Диспаратность - disparity. Если два объекта находятся на разных расстояниях от наблюдателя, то относительные расположения их изображений в разных глазах будут отличаться. Соответствующая разность, которую обыч-

369

но измеряют в угловых минутах, называется диспаратностью. Различие по глубине, составляющее около 2, 5 см на расстоянии около 1, 5 м прямо перед наблюдателем, порождает дис-паратность, равную приблизительно Г. Дифференциальные операторы - differential operators. Пространственные дифференциальные операторы типа д/дх и д/ду могут быть при реализации аппроксимированы операторами свертки, рецептивным полям которых будет придана соответствующая форма. Несколько примеров таких операторов приведено на рис. 2.11.

Едва различимое различие (ЕРР) -just noticeable difference ( JND ). EPP-эксперимент предназначен для изучения способности замечать изменение значения некоторого параметра в некотором диапазоне его значений; в процессе выполнения ЕРР-экспери-мента в каждой точке соответствующего диапазона измеряется изменение значения параметра, необходимое для того, чтобы соответствующее изменение могло бы быть обнаружено. Обычно два раздражителя, используемые в эксперименте, налагаются друг на друга.

Зона Панума - Panum ' s area. Диапазон значений диспаратности, в котором удается добиться стереоскопического слияния без использования движений глаз.

Зрительная кора - striate cortex. Часть коры головного мозга обезьяны и человека, в первую очередь воспринимающая зрительную информацию. Названа таким образом из-за наличия так называемой полоски Дженнари ( stria of Gennari ) - полосы нейронной ткани белого цвета, проходящей только через этот участок мозга.

Источник контура - contour generator Геометрическое место точек видимой поверхности, порождающих некоторый контур на изображении поверхности.

Канал пространственной частоты - spatial frequency channel. Канал, пропускающий лишь некоторый ограниченный диапазон пространственных частот. Части зрительной системы человека, осуществляющие предварительную обработку изображений, содержат целый ряд каналов пространственной частоты, эффективная полоса пропускания каждого из которых составляет менее двух октав, т. е. отношение максимального и минимального значений частот, пропускаемых каждым каналом, меньше, чем 4.1.

Карта отражательной способности — reflectance map. Набор контуров, отражающих связь яркостей изображения с ориентацией поверхности, причем не всегда это соответствие оказывается взаимно-однозначным. Несколько примеров таких контуров приведено на рис. 3.76 - 3.79.

Контур поверхности - surface contour. Изображение контура, расположенного на видимой поверхности.

Конъюнктивные движения глаз - conjunctive eye movements. Движения глаз, изменяющие среднее направление взгляда двух глаз.

Кооперативный алгоритм — cooperative algorithm. Нелинейный алгоритм, предусматривающий использование строго определенным образом взаимодействия сугубо локальных операций для достижения глобальной упорядоченности. Назван алгоритм по аналогии с так называемыми кооперативными явлениями, известными в физике (например, моделью ферромагнетизма, предложенной Изингом, сверхпроводимостью и фазовыми переходами). Кооперативные алгоритмы имеют много общего с этими явлениями.

Кривая равной яркости (изолиния яркости) - isoluminance contour. Карта отражательной способности обычно сортоит из^- кривых равной яркости, представленных в р, q -координатах (в пространстве градиентов).

Локально-характерный объект (двухмерный признак изображения) -place token. Характерный объект, указывающий " важное" место на изображении. Объекты такого рода характеризуются местоположением на изображении; кроме того, им могут приписываться и некоторые другие свойства. Считается, что эти объекты формируются на этапе предварительного анализа пространственной организации изображения.

Мир игрушечных кубиков - block world. Сцены, образованные кубиками с белыми матовыми плоскими гранями, расположенными на темном фоне. Такие сцены широко использовались в значительном числе ранних работ, посвященных проблемам машинного зрения.

Модуляционная передаточная функция (МПФ) - modulation transfer function ( MFT ). Фурье-преобразование некоторого фильтра или функции. МПФ интересна тем, что позволяет, просто взглянув на ее график, определить, какие частоты соответствующим фильтром пропускаются, а какие — подавляются.

Наклон (отклонение) поверхности -slant. Угол, под которым некоторая плоскость наклонена относительно фронтальной плоскости наблюдателя или отклоняется от нее. Этот угол называют также наклонением ( dip ).

Наклонение - dip. См. наклон поверхности.

Наружное коленчатое тело (НКТ) -lateral geniculate body ( LGB ). Основные клеточные ядра зрительного пути, расположенные между глазом и мозгом. Входные сигналы поступают в НКТ через зрительный нерв, состоящий из аксонов ганглиозных клеток сетчатки. Аксоны, исходящие из НКТ (их называют оптическими разветвлениями) у человека и обезьяны входят в зрительную кору.

Ограничивающие контур - occluding contour. Конгур на изображении, образованный ограничивающим яркост-ным переходом.

Оператор Лапласа (лапласиан) — Laplacian. Формально определяется как V² = = д²/дх² + д²/ду² и представляет собой изотропный дифференциальный оператор наименьшего порядка. Применяется к двухмерному распределению. Результат этой операции представляется графиком, имеющим очертания мексиканской шляпы. Он записывается как

V²G(r) = -1пт*(1-г²/2т²)ехр(-г²/2т²)

(см. рис. 2.9). Описание — description. Описание некоторого конкретного объекта возникает в результате применения к нему некоторой схемы представления.

Ось компонента модели - component axis. Вспомогательная ось трехмерной модели, например ось шеи в трехмерной модели четвероногого.

Ось модели - model axis. Ось, которая ставится в соответствие трехмерной модели и определяет протяженность формы объекта, представляемой моделью в целом.

Отношение присоединения - adjunct relation. Удобное средство задания относительного положения пары осей трехмерной модели (обычно используется для указания связи оси компонента с главной осью модели) (см. рис. 5.4 и 5.5).

Первоначальный эскиз - primal sketch. Представление двухмерного изображения, обеспечивающее перевод в явную форму количественных и позиционных характеристик изменений яркости на изображении. Это представление имеет иерархический характер: на нижнем уровне непроизводные элементы представляют исходные изменения яркости и их локальную геометрическую структуру, а непроизводные элементы верхних

371

уровней отражают группировку и взаимное расположение объектов, выделяемых на низших уровнях (см. рис. 2.7).

Повышенная острота зрения - hyperacidity. Человек в состоянии справляться с разнообразными заданиями с точностью, порядок значений которой меньше размеров колбочек сетчатки глаза, поставляющих соответствующую информацию. Диаметр колбочек центральной ямки сетчатки составляет приблизительно 27" и, тем не менее, при решении ряда задач достигается точность порядка 5", а острота стереоскопического зрения может достигать даже 2". Считается, что задачи такого рода относятся к диапазону повышенной остроты зрения.

Поле 17 - area П. - Зрительная кора.

Потенциал действия - action potential. Самоподдерживающийся биоэлектрический потенциал, который распространяется вдоль аксона, обеспечивая тем самым передачу сигнала от одной нервной клетки к другой через синапс. Механизм проведения такого сигнала был объяснен А. Л. Ходжки-ным и А. Ф. Хаксли.

Представление — representation Представлением некоторого множества объектов S служит некоторая формальная схема их описания в сочетании с правилами, указывающими, каким образом данная схема применяется к любому из объектов множества.

Представление трехмерной модели - 3- d model representation. Представление форм объектов, привязанное к объекту и предусматривающее использование объемных непроизводных элементов различных размеров, упорядоченных в виде некоторой модульной структуры иерархического характера (см. рис. 5.3).

Пространственная частота - spatial frequency Фурье-преобразование некоторого изменяющегося во времени сигнала сводится к представлению

372

этого сигнала в виде суммы синусоидальных и косинусоидальных составляющих, каждая из которых соответствует своей временно¹» частоте. Если же сигнал изменяется не во времени, а в пространстве (как, например, это имеет место в случае отдельного изображения), то составляющими, с помощью которых Фурье-преобразование представляет такой сигнал, оказываются его пространственные частоты, причем их можно рассматривать как ориентированные синусоидальные решетки.

Пространство градиентов - gradient space. Математический объект, позволяющий представлять ориентацию некоторой поверхности в трехмерном пространстве с помощью точки графика, построенного в двухмерной системе координат (их обычно обозначают как р, ^-координаты) (см. разд. 3.8 и, особенно, рис. 3.73).

Простые клетки - simple cells. Класс нервных клеток зрительной коры, обладающих чувствительностью к ориентации. Обнаружены Хьюбелом и Уиселом, которые определили их как простые клетки в силу линейного характера ответа этих клеток на раздражители, попадающие в их рецептивные поля.

Разность двух гауссовских распределений (РГР) - difference of two Gaussians ( DOG ). Функция, образованная разностью двух гауссовских распределений. Считается, что такие функции описывают форму рецептивных полей ганглиозных нервных клеток сетчатки и форму рецептивных полей, используемых в четырех канальной модели предварительной обработки изображений в зрительной системе, предложенной Уилсоном. Форма таких функций очень близка к форме функции V²G(cm. рис. 2.16).

расстояние —distance Этим термином обычно обозначают истинное расстояние в трехмерном пространстве, отде-

ляющее наблюдателя от наблюдаемой поверхности.

Ретинекс - retinex Термин, введенный Эдвином Ландом для обозначения обработки изображения, заключающейся в удалении всех плавных изменений яркости (таких, которые могут вызываться изменениями освещения) и сохранении всех резких изменений яркости (таких, которые могут вызываться изменениями отражательной способности).

Родопсин - rhodopsin Чувствительный к свету зрительный пигмент, содержащийся в палочках — рецепторах глаза.

Ряд Вольтерра - Volterra series. Математический объект, используемый для представления одного класса нелинейных систем. При условии, что функция достаточно гладкая, т. е. не имеет нарушений непрерывности, порогов или точек разветвления, такую функцию можно представить в виде суммы одночленов, например как

fix, у) = ах + Ьу + сху + dx ² y + ... Что касается конкретного примера, связанного с системой управления полетом комнатной мухи, то в данном случае существенны лишь члены низшего порядка.

Саккада - saccade Конъюнктивные движения глаз могут осуществляться плавно либо в виде некоторого заранее программируемого баллистического скачка, внутреннее программирование которого занимает около 160 мс; этот скачок называется сак-кадой. Кроме того, дизъюнктивные движения глаз всегда являются гладкими и их осуществление непрерывно контролируется с помощью обратной связи по диспаратности, образованной текущим и искомым значениями вергентного угла.

Свертка (*) - convolution. Формально свертка двух функций fix ) и g ( x ) определяется как/*#(х) = ff ( x ') X Xg ( x — x ') dx '. При работе с изображениями ее смысл можно легко

объяснить, используя рецептивные поля. Пусть точке изображения с координатами (х, у) соответствует " взвешенное" рецептивное поле и пусть его организация имеет центрально-периферический характер. Это поле обеспечивает линейное суммирование вкладов, вносимых каждой частью изображения при " взгляде" на нее через рецептивное поле, т. е. точки, расположенные в центре, берутся с большими положительными весами, а точки, расположенные на периферии, - с небольшими отрицательными весами. Результатом этой операции является значение свертки изображения с функцией, представленной весами рецептивного поля, соответствующее данной точке (х, у). Таким образом, для того чтобы вычислить свертку на всем изображении, т. е. определить ее значения во всех точках изображения с координатами (х, у), необходима процедура, требующая больших вычислительных затрат

Синапс - synapse. Соединение нервных клеток, связывающее аксон одной клетки и дендрит (сому — тело клетки) другой. Большая часть синапсов имеет химическую природу. Это означает, что сообщения передаются через них с помощью выделения какого-либо химического продукта на окончание аксона; некоторая часть синапсов, однако, имеет электрическую природу.

Сложные клетки - complex cells. Класс нервных клеток зрительной коры, обладающих чувствительностью к ориентации. Эти клетки были обнаружены Хыобелом и Уиселом. Сложность клеток этого типа по сравнению с простыми клетками состоит в том, что их ответ не является линейной функцией пространственных раздражителей, попадающих в их рецептивные поля, однако эти клетки не обнаруживают определенной чувствительности к концам яркостных переходов и полос.

373

Тахистоскоп — tachistoscope. Устройство, которое используется в психофизических экспериментах для краткосрочного предъявления испытуемому зрительных раздражителей.

Точки пересечения сигналом нулевого уровня - zero - crossing. Точки, в которых значение функции изменяет знак.

Трехмерная модель - 3- d model. Основной элемент, используемый при построении представления трехмерной модели. Она задает: ось модели, определяющую общую протяженность формы объекта; относительные размеры и пространственную организацию нескольких осей компонентов модели; указатели для форм, связанных с этими осями (см. блоки, изображенные на рис. 5.3).

Форма объекта — shape. Геометрия реальной поверхности объекта.

Фронтальная плоскость - frontal plane. Плоскость, расположенная перпендикулярно линии прямой видимости наблюдателя.

Функция отражательной способности — reflectance function. Эта функция ставится в соответствие некоторой поверхности и указывает, какая часть падающего на поверхность света отражается при различных условиях наблюдения и освещения (см. рис. 3.75 и разд. 3.8).

Эксцентриситет — eccentricity. С помощью этого термина обычно обозначают угловое расстояние от центральной ямки сетчатки.

W-клетки, ЛГ-клетки, У-клетки - W cells, X cells, Y cells. Три класса ганглиоз-ных клеток сетчатки. Разделение Х-клеток и У-клеток было введено К. Инрот-Кугеллом и Дж. Д. Робсоном, а существование И^-клеток было установлено позже. Эти классы были выделены как анатомически, так и физиологически. У-клетки обладают телом наибольшего размера, рецептивным полем наибольшего размера и встречаются реже остальных типов (их доля среди общего числа гангли-озных клеток составляет около 4 %). Они обладают высокой скоростью проведения, их ответы имеют фазный характер, в них проявляются эффекты смещения и Маклуэйна, они не

/ обладают чувствительностью к цвету и значительно реже встречаются на периферии. Я-клетки меньше У-клеток, обладают меньшими рецептивными полями и встречаются чаще, чем У-клетки (около 60 % ганглиозных клеток сетчатки составляют.У-клетки). Они обладают средней скоростью проведения и их ответы имеют тонический характер; эти клетки не подвержены воздействию эффектов смещения и Маклуэйна, часто проявляют чувствительность к цвету и сравнительно часто располагаются в центральной ямке сетчатки. Размеры W-клеток очень малы, они обладают малой скоростью проведения и составляют около 40 % общего числа ганглиозных клеток. Эти нервные клетки, деятельность которых трудно регистрировать, часто обладают избирательностью по направлению и другими довольно специфическими свойствами. Многие из этих нервных клеток проецируются в верхнее двухолмие.

СПИСОК ЛИТЕРАТУРЫ

1. Adrian, E. D. 1928. The Basis of Sensation. L o nd o n: Christ o phers (Reprint ed New

Y o rk. Hafner, 1964).

2. Adrian, E. D. 1947. The Physical Background of Perception. Oxf o rd: Clarend o n

Press.

3. Agin, G. 1972. Representati o n and descripti o n o f curved o bjects. Stanf o rd Artificial

Intelligence Pr o ject Mem o AIM-173 Stanf o rd, Ca.: Stanf o rd University.

4. Anstis, S. M. 1970. Phi m o vement as a subtracti o n pr o cess. Vision Res. 10, 1411-1430.

5. Attneave, F. 1974. Apparent m o vement and the what-where c o nnecti o n. Psychologia

17, 108-120.

6. Attneave, E, and G. Block. 1973- Apparent m o ti o n in tridimensi o nal space. Percept.

& Psycbopbys. 13, 301-307.

7. Austin, J. L. 1962. Sense and Sensibilia Oxf o rd: Clarend o n Press.

8. Barl o w, H. B. 1953 Summati o n and inhibiti o n in the fr o g's retina / Physiol, (bond.)

119, 69-88.

9. Barl o w, H. B. 1972. Single units and sensati o n: a neur o n d o ctrine f o r perceptual

psych o logy? Perception 1, 371-394.

10. Barl o w, H. B. 1978. The efficiency o f detecting changes in rand o m d o t patterns.

Vision Res. 18, 637-650.

11. Barl o w, H. B. 1979- Rec o nstructing the visual image in space and time. Nature 279,

189-190.

12. Barl o w, H. В., С. Blakem o re, and J. D. Pettigrew. 1967. The neural mechanism o f

^ bin o cular depth discriminati o n/ Physiol, (bond.) 193, 327-342.

13. Barlow, H. В., R. M. Hill, and W. R. Levick. 1964. Retinal gangli o n cells resp o nding

selectively t o directi o n and speed o f image m o ti o n in the rabbit. / Physiol, (bond.) 173, 377-407.

14. Barl o w, H. В., W. R. Levick. 1965. The mechanism o f directional selective units in

rabbits retina/. Physiol, (bond.) 178, 477-504

15. Beck, J. 1972. Surface Color Perception. Ithaca, N.Y.: C o rnell University Press.

16. Berry, R. N. 1948. Quantitative relati o ns am o ng vernier, real depth, and stere o sc o pic

depth acuities/ Exp. Psychol. 38, 708-721. 17Binf o rd, Т. О. 1971. Visual percepti o n by c o mputer. Paper presented at the IEEE Conference o n Systems and C o ntr o l, December 1971, Miami.

18. Bish o p, P.O., J. S. C oo mbs, and G. H. Henry. 1971. Resp o nses t o visual c o nt o urs

Spati o -temporal aspects o f excitati o n in the receptive fields o f simple striate neurons/ Physiol, (bond.)219, 625-657.

19. Bl o mfield, S. 1973. Implicit features and stereoscopy. Nature, New Biol. 245, 256.

375

20. Blum, H. 1973. Biological shape and visual science, part 1. / Tbeor. Biol. 38,

205-287.

21. Bouguer, P. 1757. Histoire de lAcademie Royale des Sciences, Paris; and Traite

d'Optique sur la Gradation de la Lumiere (Ouvrage posthume de M. Bouguer)., I'Abbe deLacaille, Paris, 1760. 22. Braddick, O. J. 1973 The masking of apparent motion in random-dot patterns. Vision Res. 13, 355-369.

23. Braddick, O. J. 1974. A short-range process in apparent motion. Vision Res. 14,

519-527.

24. Braddick, O. J. 1979 Low - and high-level processes in apparent motion. Phil. Trans.

R. Soc. bond В 290, 137-151

25. Brady, M. 1979. Inferring the direction of the sun from intensity values on a gen-

eralized cone. Proc. lnt Joint Con/. Art Intel., 1JCA1-79, 88-91.

26. Braunstein, M. L. 1962. Depth perception in rotation dot patterns: Effects o f nume-

rosity and perspective. / Exp. Psychol. 64, 415-420.

27. Breitmeyer, В., and L. Ganz. 1977. Temporal studies with flashing gratings: Infer-

ences about human transient and sustained channels. Vision Res. 17, 861-865.

28. Brindley, G. S. 1970. Physiology of the Retina and Visual Pathway. Physiological

Society Monograph no. 6. London: Edwin Arnold.

29. Brodatz, P. 1966. Textures. A Photographic Album for Artists and Designers. New

York- Dover.

30. Campbell, F. W. C. andj. Robson. 1968. Application of Fourier analysis to the visibility

of gratings/ Physiol, (bond.) 197, 551-566.

31. Campbell, F. W. С 1977. Sometimes a biologist has to make a noise like a mathe-

matician. Neurosciences Res. Prog. Bull. 15, 417-424.

32. Carey, S., and R Diamond. 1980. Marurational determination of the developmental

course of face encoding. In Biological Bases of Mental Processes, D. Kaplan, ed., 1-7. Cambridge, Mass.: MIT Press.

33. Chomsky, N. 1965, Aspects of the Theory of Syntax. Cambridge, Mass.: МП " Press

34. Chomsky, N., and H. Lasnik. 1977. Filters and control. Linguistic Inquiry 8, 425-504.

35. Clarke, P. G. H., I. M. L. Donaldson, and D. Whitteridge. 1976. Binocular mechanisms

in cortical areas I and II of the sheep/ Physiol, (bond.) 256, 509-526.

36. Clocksin, W. F. 1980. Perception of surface slant and edge labels from optical flow:

A computational approach. Perception 9, 253-269.

37. Corbin, H. H. 1942. The perception of grouping and apparent motion in visual

space. Arch. Psychol. Whole No. 273.

38. Crick, F H. C, D. Marr, and T. Poggio. 1980. An information processing approach

to understanding the visual cortex. In The Cerebral Cortex, Ed. E O. Schmitt and F. G. Warden. (The Proceedings of the Neurosciences Research Program Colloquium held in \Hoods Hole, Mass., May 1979 ) Cambridge, Mass.: МГГ Press.

39. Dev, P. 1975. Perception of depth surfaces in random - dot stereograms: A neural

model. Int. J. Man-Machine Stud. 7, 511-528.

40. DeValois, R. L. 1965- Analysis and coding of color vision in the primate visual system.

Cold Spring Harbor Symp. Quant. Biol. 30, 567-579

376

41. DeVal o is, R L, I, Abramov, and G. H. Jac o bs. 1966. Analysis o f resp o nse patterns o f

LGN cells. / Opt. Soc. Am. 56, 966, 977.

42. DeVal o is, R L., I. Abram o v, and W. R Mead. 1967. Single cell analysis o f wavelength

discriminati o n at the lateral geniculate nucleus in the macaque. / Neurophy-. siol. 30, 415-433 -

43. Dreher, B. and K. J. Sanders o n. 1973. Receptive field analysis: Resp o nses t o m o ving

visual c o nt o urs by single lateral geniculate neur o ns in the cat./. Physiol, (bond.) 234, 95-118.

44. Enroth-Cugel, С and J. D. R o bs o n. 1966. The c o ntrast sensitivity o f retinal gangli o n

cells o f the cat. / Physiol (bond.) 187, 517-522.

45. Evans, R M. 1974. The Perception of Color New Y o rk: Wiley.

46. Felt o n, Т. В., W. Richards, and R A. Smith, Jr. 1972. Disparity pr o cessing o f spatial

frequencies in man/ Physiol, (bond.) 225, 349-362.

47. Fender, D., and B. Julesz. 1967. Extensi o n o f Panum's fusi o nal area in binocularly

stabilized vision. / Opt. Soc. Am. 57, 819-830.

48. Fbrbus, K. 1977. Light s o urce effects. МЛГ A. I Lab Mem o 422.

49. Fram, J R, and E. S. Deutsch. 1975 On the quantitative evaluati o n o f edge detecti o n

schemes and their c o mparis o n with human perf o rmance. IEEE Transactions on Computers C-24, 616-628.

50. Freuder, E. С 1974. A c o mputer visi o n system f o r visual rec o gniti o n using active

kn o wledge. МГГ A.I. Lab Tech. Rep. 345

Sl.Frisby, J. P., and J. L. Clarw o rthy. 1975. Learning t o see c o mplex rand o m-d o t stereograms. Perception 4, 173-178.

52. Frisby, J. P., and J. E. W. Mayhew. 1979. D o es visual texture discriminati o n precede bin o cular fusi o n? Perception 8, 153-156.

53.Galambos, R, and H. Davis. 1943- The resp o nse o f single audit o ry-nerve fibres t o ac o ustic stimulati o n./ Neurophysiol. 7, 287-303

54. Gibs o n, J. J. 1950. The Perception of the Visual World. B o st o n: H o ught o n Mifflin.

55. Gibs o n, J. J. 1958. Visually c o ntr o lled l o c o m o ti o n and visual o rientati o n in animals.

Brit. J. Psych. 49, 182-194.

56. Gibson, J. J. 1966. The Senses considered as Perceptual Systems. B o st o n. H o ught o n

Mifflin.

57. Gibs o n, J. J. 1979. The Ecological Approach to Visual Perception. B o st o n. H o ught o n

Mifflin.

58. Gibs o n.J. J., and E. J. Gibs o n. 1957. C o ntinu o us perceptive transf o rmati o ns and the

percepti o n o f rigid m o ti o n/ Exp. Psychol 54, 129-138.

59. Gibs o n, E. J.J. J. Gibson, O. W. Smith, and H. Fl o ck. 1959 M o ti o n parallax as a

determinant o f perceived depth/ Exp. Psychol. 8, 40-51.

60. Gibson, J. J., P. Olum, and F. Rosenblatt. 1955 Parallax and perspective during

aircraft landings. Am. / Psychol. 68, 372-385.

61. Gilchrist, A. L. 1977. Perceived lightness depends o n perceived spatial arrangement.

Sicence 195, 185-187.

62. Glass, L. 1969. M o ire effect fr o m rand o m d o ts. Nature 243, 578-580.

63. Glass, L., and R Perez. 1973- Percepti o n o f rand o m d o t interference patterns. Nature

246, 360-362.

377

⇐ Предыдущая 22 23 24 25 26 27 282930 31 Следующая ⇒

Последнее изменение этой страницы: 2019-04-09; Просмотров: 79; Нарушение авторского права страницы