Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ИНФОРМАЦИЯ, ПОДЛЕЖАЩАЯ ПРЕДСТАВЛЕНИЮ



Зрение, как мы уже убедились, служат источником нескольких видов информации о форме объекта. Наиболее непосредственную информацию о фор--ме дают стереопсис и движение, но почти столь же эффективны и контуры поверхности, зарегистрированные на отдельном изображении; кроме того, нам встречались примеры и других, менее эффективных способов передачи информации о форме объекта. Часто оказывается, что отдельные части сцены доступны для изучения одними из методов, а другие части — другими. Сколько бы ни были отличны эти методы, все они обладают двумя важными общими свойствами: имеют дело с информацией, извлекаемой из изображения, а не с априорными занятиями о формах наблюдаемых объектов и информация, получение которой они обеспечивают, относится к глубине или ориентации поверхности в произвольных точках изображения, а не к глубине или ориентации, характеризующим некоторые конкретные объекты.

Рассматривая стереоскопическое изображение какой-либо сложной поверхности, например истлевшей рассыпающейся газеты или " лиственного" куба Иттелсона [104], представляющего собой коробку, к стенкам которой прикреплены листья, направленные прямо к наблюдателю, мы без труда определяем ориентацию любого участка поверхности, а также и то, ближе или дальше от наблюдателя расположен выбранный участок поверхности по сравнению с соседними участками. Тем не менее запоминается форма поверхности плохо, несмотря на то что воспринимается она очень четко. Более того, если поверхность содержит элементы, расположенные почти параллельно линии прямой видимости, их ориентация, воспринимаемая при наблюдении одним глазом, может отличаться от ориентации поверхности, воспринимаемой при наблюдении двумя глазами.

Читатель может убедиться в существовании такого явления, воспользовавшись комнатой с текстурированным потолком. Если рассматривать такой потолок через узкую трубку одним глазом, то очень скоро начнет казаться, что любая часть потолка, видимая через трубку, ориентирована под прямым углом относительно линии прямой видимости. Это впечатление является очень устойчивым, несмотря на то что Вы совершенно ясно сознаете его ложность.

Эти наблюдения позволяют нам сделать несколько простых заключений.

1. Каждой точке поверхности, присутствующей на любой сцене, соответствует по меньшей мере одно внутреннее представление глубины или ориентации поверхности либо в той и другой.

281

2. Поскольку ориентация поверхности может ставиться в соответствие формам объектов, которые незнакомы наблюдателю, представление ориентации, возможно, предшествует разбиению сцены на отдельные объекты.

3. Поскольку воспринимаемая ориентация произвольного элемента поверхности может изменяться в зависимости от того, ведется ли наблюдение одним или двумя тазами, то, вероятно, представление ориентации поверхности почти полностью определяется процессами восприятия и на него лишь в незначительной степени влияет конкретное знание того, какова ориентация рассматриваемой поверхности на самом деле. С этим же может оказаться связанной и та особенность, что человек способен воспринимать поверхность намного лучше, чем запоминать результаты ее восприятия.

4. Кроме юго, представляется вероятным, что одно и то же представление ориентации поверхности может отражать влияние различных источников информации.

Для того чтобы наиболее эффективно использовать эти различные и часто взаимно дополняющие процессы порождения информации, их необходимо каким-то способом объединить. Соответствующая информационная проблема: как это сделать наилучшим образом? Ее естественным решением служит отыскание некоторого представления зрительно воспринимаемой сцены, обеспечивающего воспроизведение в явном виде именно той информации, которую могут давать эти процессы.

К счастью, физическая интерпретация искомого представления очевидна. Все эти процессы позволяют получать информацию, характеризующую глубину или ориентацию поверхностей, присутствующих на некотором изображении, а эти характеристики являются строго определенными физическими величинами. Нам, следовательно, требуется способ, позволяющий переводить эту информацию в явную форму, хранить ее соответствующим образом, и, возможно, вводить в представление любое физическое условие, выполняющееся для тех значений глубины и ориентации поверхности, которые могут принимать эти характеристики у поверхностей, встречающихся в реальном физическом мире.

В табл. 4.1 приводится перечень тех форм воспроизведения информации, получение которых из изображения может обеспечить различные процессы, действующие на предварительном этапе обработки информации в зрительной системе. Интересно отметить в связи с этим, что, хотя процессы типа ciepeon-сиса и движения в принципе позволяют получать информацию о глубине непосредственно, более вероятно, что реально они воспроизводят информацию о локальных изменениях глубины, например, с помощью измерения локальных изменений значений диспаратности. Контуры поверхности и затенение обеспечивают получение более непосредственной информации об ориентации поверхности. Кроме того, данные, характеризующие наложение, яркость и размеры, могут служить информацией о нарушениях непрерывности по глубине. Основной фнукцией нашего искомого представления, следовательно, является не только воспроизведение в явном виде информации о глубине, локальной ориентации поверхности и нарушениях непрерывности по этим характеристикам, но также формирование и хранение некоторого глобально-

282

го представления глубины, совместимого с локальными данными, поступающими по указанным информационным каналам. Мы называем такое представление 2, 5-мерным эскизом и в следующем разделе опишем одну из его возможных реализаций.

Таблица 4.1. Наиболее естественные формы воспроизведения информации об изменениях геометрических свойств поверхности, которую позволяют получать процессы предварительной обработки информации в зрительной системе

Процесс, мехпнизм, лежащий в его основе

Естественная форма воспроизведедая информа-

 

даи

Стереопсис

Диспаратность, т. е. δ r, ∆ r и s

Избирательность по направлению

∆ r

Восстановление структуры по

r, δ г, ∆ к и s

движению

 

Оптический поток

? r и s

Ограничивающие контуры

∆ r

Другая информация о наложении и

∆ r

загораживании

 

Контуры ориентации поверхности

∆ s

Контуры поверхности

s

Текстура поверхности

Вероятно, r

Контуры поверхности

∆ r и s

Контуры текстуры

δ s и ∆ s

Примечание, r — относительное значение глубины (в прямоугольной проекции); δ rнепрерывные или малые локальные изменения r; ∆ r — нарушения непрерывности по r; S — локальная ориентация поверхности; δ S — непрерывные или малые локальные изменения S; ∆ s — нарушения непрерывности по S.

4.5. 2, 5-МЕРНЫЙ ЭСКИЗ В ОБЩЕМ СЛУЧАЕ

Для того чтобы дать пример какого-либо представления, которое можно использовать в качестве основы для более подробного рассмотрения его устройства, я начну с описания первоначального варианта представления, ориентированного на наблюдателя (в этом смысл термина эскиз) и использующего непроизводные элементы поверхности только одного (малого) размера. Этот вариант предусматривает представление нарушений непрерывности контуров поверхности, причем его внутренняя информационная структура развита в степени, достаточной для хранения в совместимом виде описаний глубины, ориентации поверхности и нарушений непрерывности поверхности.

Для представления глубины можно воспользоваться скалярной величиной г — расстоянием от соответствующей точки поверхности до наблюдателя. Нарушения непрерывности поверхности можно представлять с помощью ориентированных элементов прямых. Как мы уже убедились, ориентацию поверхности можно представлять как некоторый вектор (р, q ) двухмерного

283

Рис. 4.2. Второй пример 2, 5-мерного эскиза (первый см. на рис. 3.12), в данном случае имеющего вид куба» Ориентация поверхности представляется стрелками, как и в случае, иллюстрируемом рис. 3.12 Ограничивающие контуры изображены сплошными линиями, а нарушения непрерывности по ориентации поверхности - точечными линиями. Глубина на рисунке не показана, хотя считается, что данное представление позволяет получать приближенное впечатление о глубине

пространства, что эквивалентно покрытию изображения иголками. Длина каждой из таких иголок определяет отклонение (или наклон) поверхности в данной точке, так что нулевая длина соответствует поверхности, расположенной перпендикулярно вектору, проведенному от наблюдателя в эту точку, причем длина иголки увеличивается по мере отклонения поверхности от наблюдателя. Ориентация иглы определяет наклонение поверхности, т. е. направление отклонения поверхности. Этот способ представления проиллюстрирован рис. 4.2; он аналогичен заданию пространства градиентов в каждой точке поля зрения.

В принципе связь глубины и ориентации поверхности очевидна: первая является просто интегралом от второй, взятым по областям, ограниченным нарушениями непрерывности поверхности. Таким образом, можно получить представление, информационная структура которого обеспечивает совместность хранения двух переменных — глубины и ориентации поверхности. Следует, однако, отметить, что в любой схеме такого рода нарушения непрерывности поверхности требуют специального подхода (подобно кривым, ограничивающим области интегрирования). Более того, если данное представление имеет активный характер и обеспечивает непротиворечивость, главным образом посредством локальных операций, то кривые, обозначающие нарушения непрерывности поверхности (например, контуры, источниками которых являются ограничивающие контуры), не должны иметь никаких разрывов, с тем чтобы была невозможна " утечка" интегрирования через какую бы то ни было точку границы объекта. Интересно, что этим свойством обладают субъективные контуры и что они тесно связаны с субъективными изменениями яркости, которые часто ставятся в соответствие изменениям воспринимаемой глубины. Если система обработки зрительной информации, имеющейся у человека, включает некоторое представление, напоминающее 2, 5-мерный эскиз, то было бы интересно узнать, входят ли в него субъективные контуры.

Подводя итоги обсуждения 2, 5-мерного эскиза, отметим, что его полезность определяется тем, что он обеспечивает представление в явном виде информации об изображении, причем в форме, хорошо соответствующей той информации, которая может порождаться процессами предварительной обработки информации в зрительной системе. В таком случае, формулируя цели 284

предварительной обработки информации в зрительной системе, мы можем в качестве первостепенной цели указать построение этого представления. Так, например, в качестве конкретной цели можно было бы назвать определение ориентации поверхности на некоторой сцене, контуры которых в первоначальном эскизе соответствуют нарушениям непрерывности поверхности и, следовательно, должны быть представлены в 2, 5 мерном эскизе, и контуры которых в первоначальном эскизе отсутствуют и, следовательно, должны быть включены в 2, 5-мерный эскиз таким образом, чтобы обеспечивалась непротиворечивость со структурой трехмерного пространства. Такая постановка позволяет обойти все трудности, возникающие в связи с категориями фигура и фон, область и объект, т. е. трудности, неизбежные в рамках подхода, основанного на сегментации изображения. В рамках же описанного подхода, идет ли речь о тоновой матрице яркостей, о первоначальном эскизе, об отдельных модулях предварительной обработки информации в зрительной системе или, наконец, о собственно 2, 5-мерном эскизе, всегда требуется лишь определение свойств поверхностей, присутствующих на изображении. Это схематическое изложение общей идеи порождает множество вопросов, касающихся деталей, и некоторые из них мы обсудим в следующих разделах. Предупредим, однако, читателя, что ему не следует рассчитывать на получение очень точных ответов. Наши знания начиная с этого момента становятся значительно менее конкретными, чем это было до сих пор. К сожалению, я в состоянии сообщить лишь нечто, мало выходящее за пределы некоторой концептуальной схемы, в рамках которой следует ставить эти вопросы. Она тем не менее также обладает определенной ценностью, несмотря даже на то, что не может удовлетворить нашу потребность в получении окончательных ответов. Итак, имеет смысл придать этому описанию несколько более точную форму, чем оно имело до сих пор в процессе обсуждения 2, 5-мерного эскиза.

4.6. ДОПУСТИМЫЕ ФОРМЫ ПРЕДСТАВЛЕНИЙ

До сих пор психофизика всерьез и специально 2, 5-мерным эскизом не занималась, и потому нам очень мало известно о нем, причем неизвестно даже, существует ли он на самом деле, в том смысле, как это предполагается в рамках нашего подхода к зрению. Основные вопросы тем не менее сформулировать нетрудно. Что именно представляется и каким образом? Какой именно должна быть система координат (даже сказав, что она должна быть привязана к наблюдателю, Вы оставляете еще много возможностей для выбора)? И возможно, самый трудный вопрос: какого рода обработка инфор-мации.выполняется в самом представлении -либо для того, чтобы обеспечить его собственную внутреннюю непротиворечивость, либо для того, чтобы обеспечить его совместность с той организацией, допустимость которой определяется трехмерностью структуры реального мира?

Первый вопрос звучит следующим образом: какая именно информация о поверхности воспроизводится в явном виде? Представляются ли, например, и глубина г , и ориентация поверхности s, или в действительности в представление вводится лишь г, а ориентация поверхности определяется при возникновении необходимости с помощью локального дифференцирования? Либо

285

Рис. 4.3. Эксперименты со стереограммами с большими значениями диспаратности. носги, при котором он в сосюянии одновременно добиться слияния как переднего плана,

ляют2° (в), 2, 25° (б),

лишь ориентация поверхности представляется в явном виде, а глубина определяется каким-то образом с помощью локального интегрирования? Эту возможность принять значительно труднее, но она определенно отлична от предыдущей.

Наилучший довод в пользу представления в явном виде какой-либо функции типа расстояния от наблюдателя дает теория сгереопсиса. Максимальный диапазон значений диспаратности, одновременно поддающихся восприятию без возникновения диплопии, остается одним и тем же в четырех достаточно различающихся случаях. Во-первых, при стабилизации изображения1 Фендер и Джулес [47], предъявляя стереограммы, образо-

1 Изображения удерживаются на сетчатке в фиксированном положении, так что движения глаз не оказывают никакого влияния.

286

Читатель можег попытаться самостоятельно определить наибольшее значение диспарат-так и фона. При наблюдении с расстояния 20 см диспаратности этих стереограмм сосгав-2, 5° (в) и 2, 75° (г)

ванные случайными конфигурациями точек, получали фигуру с размерами порядка 2°. Во-вторых, при отсутствии какой бы то ни было стабилизации (т. е. при нормальных условиях наблюдения) получен приблизительно такой же диапазон. При использовании сложных стереограмм, предложенных Джулесом [113, например, рис. 4.5-3], и наблюдении с расстояния около 20 см диапазон значений диспаратности имеет приблизительно тот же порядок; если же смотреть на эти стереограммы со значительно более близкого расстояния, то все они оказываются вообще " не видны". В-третьих, в настоящее время кажется маловероятным, что максимальный диапазон одновременно воспринимаемых диспаратностей существенно зависит от их распределения. Читатель, воспользовавшись рис. 4.3, может непосредственно убедиться в том, что фигура с размерами порядка 2°, которая воспринимается при стабилизации изображения и при обычных условиях наблюдения стереограмм с непрерывно изменяющимися диспаратностями, сохраняется

287

также и в случае стереограмм с единственной диспаратностью. И, в-четвертых, в условиях " любительского" эксперимента, проводимого с помощью собственных пальцев и реальных поверхностей, Вы получите аналогичную фигуру.

Из этих примеров следует, что фигура с размерами порядка 2° для максимального диапазона одновременно воспринимаемых диспаратностей характеризует, очевидно, общий случай (при условии, что имеется достаточно пространства.для крайних значений диспаратности) и что эта фигура не зависит от движения глаз. Трудно понять, каким образом буферное запоминающее устройство, в котором хранится только ориентация поверхности, могло бы реализовывать подобное ограничение, и поэтому я считаю, что значения глубины (быть может, только приближенные значения) в какой-то форме запоминаются, причем значения, которые запоминаются, соответствуют значениям диспаратности порядка 2 - 2, 25°.

Вторая группа доводов в пользу явного представления глубины в той или иной форме связана со значением нарушений непрерывности по глубине. Определенные процессы предварительной обработки информации в зрительной системе могут давать информацию о таких нарушениях непрерывности, причем некоторые из них - лишь в качественном виде. Наиболее значительной, вероятно, является роль процессов, связанных с наложением, некоторыми границами на текстурах, границами диспаратности, а также с избирательностью по направлению (см. табл. 4.1). О важности субъективных контуров свидетельствует четкость их восприятия. Если глубины расположения двух поверхностей очень сильно различаются, то субъективно мы, по-видимому, прекрасно отдаем себе отчет в этом, несмотря даже на то, что их ориентации абсолютно одинаковы.

Доводы обоих типов указывают на наличие некоторой формы представления глубины. В этой связи возникает одна интересная проблема: соизмерим ли диапазон значений одновременно воспринимаемых глубин в случае видимого движения с возможностями восприятия посредством стереозрения.Ни один из приведенных доводов не предполагает, однако, что информация о глубине должна храниться с высокой точностью, как должно было бы быть в случае формирования первоначального представления. В отдельном случае не составляет труда, опираясь на информацию, полученную при анализе движения или стерео пейсе, определять, расположена ли некоторая точка впереди другой точки. Если же, однако, мы попытаемся сравнить расстояния, отделяющие нас от двух поверхностей, которые располагаются в различных частях поля зрения, то хорошего результата мы не получим: человек выполняет такое сравнение значительно менее точно, чем сравнение ориентации таких поверхностей.

В результате возникают сомнения в том, что глубина является основной представляемой переменной, что ее значения, принадлежащие определенному диапазону, запоминаются точно и что она подвергается дифференцированию при необходимости определить ориентацию поверхности. Кроме того, еще более веские доводы свидетельствуют против такой возможности. Дело в том, что многие из процессов, перечисленных в табл. 4.1, порождают информацию об ориентации поверхности непосредственно, а не опосредованно — через информацию о глубине. Наиболее очевидными примерами служат процессы, связанные с контурами поверхности, затенением и контурами, характеризующими нарушения непрерывности по ориентации поверхности. В сущности, однако, и стереопсис, и процесс восстановления структуры по движению лучше приспособлены для получения информации о локальных измене-288

ниях, чем об абсолютных значениях глубины: стереопсис — в связи с тем, что, по-видимому, мозгу редко бывает известно точное абсолютное значение угла конвергенции глаз и он обычно работает с изменениями этих значений; что касается процесса восстановления структуры по движению, то, поскольку соответствующий анализ проводится локально и предусматривает использование ортогональной проекции, в результате воспроизводятся лишь локальные изменения глубины. Таким образом, существуют серьезные основания считать, что оба указанных процесса очень хорошо приспособлены для получения информации об ориентации поверхности, и, вероятно, правильнее видеть их назначение именно в этом, а не в том, чтобы в первую очередь определять расстояние до наблюдателя.

И наконец, ориентация поверхности может определяться очень точно: с точностью до 1-2° во всем диапазоне допустимых ориентации [221, приложение В]. Вывод об использовании человеком явного представления ориентации поверхности не основывается целиком на убедительных данных Стивенса, но, учитывая слабые возможности человека по определению глубины, я полагаю, что это — важный факт, и потому, если бы такого представления не существовало, это потребовало бы специального объяснения.

Вывод, который я делаю на основании изложенных доводов, заключается в том, что человек, по-видимому, использует внутреннее представление величины s к г, причем, если величина s может представляться весьма точно, то величина г представляется лишь со значительным приближением. У человека также могут иметься средства для более точного представления локальных различий по глубине, служащих дополнением к используемому человеком представлению ориентации поверхности.


Поделиться:



Последнее изменение этой страницы: 2019-04-09; Просмотров: 74; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.032 с.)
Главная | Случайная страница | Обратная связь