Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


ГЛАВА 2 ПОЛУЧЕНИЕ ПРЕДСТАВЛЕНИЯ ИЗОБРАЖЕНИЯ



ФИЗИЧЕСКИЕ ОСНОВЫ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЯ

В ЗРИТЕЛЬНОЙ СИСТЕМЕ

Мы не можем развивать строгую теорию предварительной обработки изображений в зрительной системе — теорию первых этапов зрительного процесса — до тех пор, пока не будет определено назначение этой теории. Как уже отмечалось, цель в самом общем виде состоит в синтезе полезных стандартизированных описаний форм и поверхностей, образующих Изображение. Пришло время сформулировать наши цели более определенно [145, 148].

Значения яркостей изображения определяются следующими четырьмя факторами: 1) геометрическими свойствами; 2) коэффициентами отражения видимых поверхностей; 3) освещением сцены; 4) позицией наблюдателя. На изображении все эти факторы проявляются совместно, причем некоторые изменения яркости порождаются одними, некоторые — другими, а некоторые представляют результат их комплексного воздействия. Задача предварительной обработки зрительной информации заключается в сортировке изменений яркости в соответствии с вызвавшими их причинами с тем, чтобы затем получить представления, в которых четыре приведенных фактора учитывались бы независимо друг от друга.

Можно, вообще говоря, считать, что эта цель достигается в два этапа. Во-первых, соответствующие представления строятся на основе изменений яркостей и структур, обнаруженных на изображении. Эти построения включают такие процедуры, как обнаружение изменений яркости, представление и анализ локальных геометрических структур и обнаружение эффектов, связанных с освещением, — источников подсветки, бликов и прозрачности. В результате выполнения этого первого этапа обработки появляется представление, называемое первоначальным эскизом. Во-вторых, к первоначальному эскизу применяется ряд процедур, что обеспечивает получение некоторого представления (все еще привязанного к сетчатке) геометрии видимых поверхностей. Это второе представление — представление видимых поверхностей — называют 2, 5-мерным эскизом. Как первоначальный эскиз, так и 2, 5-мерный эскиз строятся в системе координат наблюдателя, и использование термина эскиз отражает именно эту особенность их структур. 54

Необходимость представления пространственных отношений, получение которого неизбежно сопровождается осложнениями, связанными с определением того, что должно быть представлено в явном виде, а что можно оставлять в неявном, порождает задачи, типичные и даже специфичные для зрения. Так, например, читателя не должно вводить в заблуждение (особенно если он не имеет математической подготовки) понятие " система координат", поскольку это понятие значительно более общее, чем может ему представляться. Из утверждения о привязанности к сетчатке представлений, используемых на этапе предварительной обработки зрительной информации, вовсе не следует автоматически, что некоторая декартова система координат, градуированная в минутах (единицах измерения угла), наложена тем или иным способом на зрительную кору и, как только зрительная система обнаруживает линию или яркостный переход, им некоторым образом ставятся в соответствие значения координат х и у, которые затем соответствующим образом передаются по нервной системе. Несомненно, такой процесс можно считать одним из способов получения представлений. Никто, однако, не может серьезно относиться к предположению о том, что он используется в зритель- " ной системе человека. Существует множество других возможностей реализации этой схемы в зрительной системе человека. Например, правдоподобным кажется использование некоторого (неявного) анатомического отображения, приблизительно воспроизводящего пространственную организацию сетчатки в сочетании с некоторым представлением, в явном виде определяющим локальные отношения (точка А отстоит на угол 5'от точки В по направлению 35°).

Существенной особенностью привязки к координатам сетчатки является то обстоятельство, что пространственные отношения при таком представлении соотносятся с двухмерными отношениями, определенными на сетчатке наблюдателя, а не с трехмерными, действующими в среде наблюдателя, и не с двухмерными, определенными на сетчатке какого-то другого наблюдателя, и не с трехмерными, заданными относительно некоторой внешней опорной точки, например горной вершины. Утверждение типа " точка А изображения расположена ниже точки В изображения" является утверждением, относящимся к системе координат сетчатки. Утверждение типа " кисть руки расположена ниже и левее груди" является утверждением, относящимся к Вашей индивидуальной трехмерной системе координат — системе координат наблюдателя. Утверждение типа " у этого кота кончик хвоста находится выше и слева от его туловища" является утверждением, относящимся к системе координат данного кота. Все эти примеры иллюстрируют вполне добротные способы приближенного задания пространственных отношений, хотя ни один из этих способов не предусматривает использования наборов чисел. Каждый из координатных систем можно поставить в соответствие количественные характеристики (как если бы, скажем, использовались координаты х, у, z), что, однако, никак не означает обязательности именно такой реализации. Необходимо иметь это в виду.

Хотя значительно удобнее сформулировать цель предварительной обработки информации в зрительной системе, разделив четыре отмеченных выше

55

фактора (геометрические свойства, коэффициенты отражения, освещение и позиция наблюдателя), важно ясно представлять, к каким это приводит упрощениям. Наиболее существенным, вероятно, оказывается упрощение, связанное с достаточно жестким разграничением между коэффициентом отражения поверхности и ее геометрическими свойствами. В действительности эти два понятия взаимосвязаны, и их разделение может оказаться достаточно произвольным, что требует проявления определенной осторожности при использовании. Хорошей иллюстрацией некоторых из возникающих трудностей такого рода может послужить поле созревающей пшеницы. При рассмотрении с близкого расстояния отдельные колосья пшеницы образуют отражение поверхности и ситуация является достаточно очевидной. При рассмотрении же издали четкость изображения недостаточна для различения колосьев; видимую поверхность образует поле в целом, и функция, характеризующая ее отражательную способность, может оказаться в данном случае очень сложной, поскольку отображает существенные вариации, которые наиболее естественно считать пространственными (см., например, [21, 230]).

С точки зрения теории восприятия, вероятно, не столь уж нереалистичная аппроксимация — рассматривать в качестве некоторой поверхности пшеничное поле, находящееся на определенном расстоянии от наблюдателя, или кошачью шубку. Тайлер, в частности, обнаружил, что мы не в состоянии увидеть на стереоскопическом изображении гофрирование поверхности, если пространственная частота рифления превышает пороговое значение, составляющее около четырех периодов на угловой градус [231].

В дополнение к указанным трудностям отметим, что редко освещенность сцены поддается описанию в простых категориях. Дело в том, что рассеянное освещение, отражения, наличие нескольких источников освещения (лишь некоторые из которых видны) и взаимное освещение поверхностей отраженным светом часто вкупе создают очень сложные условия освещения, возможно, вообще не поддающиеся аналитическому описанию. Наше грубое давление на четыре фактора тем не менее находит применение. При условии, что для наблюдателя вариации по глубине поверхности, отражающей свет, малы по сравнению с дальностью визирования, мы будем считать наблюдаемый объект некоторой отражающей поверхностью и, следовательно, полагать возможным описывать соотношение между падающим на нее и отражаемым ею светом с помощью некоторой функции отражательной способности р, которая при определенных освещении и позиции наблюдателя может обладать довольно сложной пространственной структурой.

И наконец, приведем одно общее соображение относительно принятого нами стиля изложения. Представления, о которых идет речь, необходимы нам в качестве практически полезных описаний различных аспектов реального мира. Поэтому структура последнего играет существенную роль как в определении характера используемых представлений, так и в определении характера процессов, привлекаемых для их получения и оперирования ими. Важную часть теоретического анализа составляет выявление физических

56

ограничений и допущений, используемых при определении > 1редставлений и соответствующих процессов, и мы будем проявлять особую тщательность в этом отношении.

Получение представления изображения

С точки зрения информационного подхода наша основная цель теперь заключается в определении некоторого представления картины изменений коэффициента отражения на некоторой поверхности, пригодного для выявления изменений геометрической организации изображения, отражающих изменения коэффициента отражения собственно поверхности, изменения ориентации поверхности и изменения расстояния от поверхности до наблюдателя. Если речь идет о некоторой гладкой поверхности, то изменения ориентации, а также, возможно, и расстояния вполне могут явиться источником изменений яркости изображения. Если поверхность текстурирована, то, например, ориентации и размеры мельчайших элементов, образующих текстуру поверхности (ими могут служить просто длина и ширина элементов), и характеристики, подсчитанные по небольшому участку поверхности, который представляют плотность и размещение этих малых текстурных элементов, являются существенной информацией об изображении.

Таким образом, мы может указать, что наше представление вообще должно содержать. Оно должно включать своего рода " характерные объекты", которые надежно и однозначно могут выделяться на изображении и которым могут ставиться в соответствие значения таких признаков, как ориентация, яркость, размеры (длина и ширина) и местоположение (для характеристик плотности и размещения). Чрезвычайно важно, чтобы эти выделяемые " характерные объекты" соответствовали реальным физическим особенностям наблюдаемой поверхности; используемые нами пятна, линии, границы, группы и тому подобные объекты не должны оказываться артефактами процессов получения изображения, поскольку в противном случае все выводы относительно структуры поверхности, сделанные на основе структуры этих объектов, будут совершенно бессодержательными. Поэтому нам следует обратиться к общим свойствам функций отражательной способности поверхностей, так как из них мы сможем почерпнуть существенные сведения о том, каким образом необходимо структурировать представления изображений на этапе предварительной обработки зрительной информации.

Основные физические допущения

Поверхности как реальные объекты

Наше первое допущение заключается в том, что вполне целесообразно вообще оперировать исключительно поверхностями (вспомним приводившиеся выше примеры с пшеничными полями и кошачьей шубкой). Сформулировать это допущение можно следующим образом, весь видимый мир можно рассматривать как некоторую композицию гладких поверхностей, функции отражательной способности которых могут отличаться сложной пространственной структурой.

Иерархическая организация

Наше второе допущение связано с организацией указанной пространственной структуры. Для объяснения его смысла целесообразно воспользоваться несколькими примерами Как мы уже отмечали, точнее всего считать, что кошачья шубка состоит из отдельных волосков, каждый из которых характеризуется собственной функцией отражательной способности. На следующем уровне рассмотрения предполагается, что эти волоски расположены плотно и параллельно, образуя тем самым некоторую поверхность. И, кроме того, на " построенную" таким образом шубку наложена структура еще более высокого уровня — организация окраски и разметки поверхности. Аналогичной организацией обладает речная поверхность. Основной уровень организации соответствует в этом случае гладкой воде, спокойствие которой нарушают случайные возмущения, вызванные различными выступающими неровностями типа камней или иных препятствий. На эту поверхность налагается рябь, ориентация которой определяется порывами ветра, и по ней направляемые течением реки плывут куски водорослей и других растений. Аналогичные структурные уровни можно обнаружить у многих поверхностей — живых изгородей, тканей, плетенных из тростника изделий, коры дерева, древесины, камней и т д. (обратите внимание на изображения поверхностей, приведенные на рис 2.1).

Эти примеры показывают, что признаки, несущие ценную информацию, могут относиться к любому уровню организации реального мира, а следова-

Рис 2 1 Примеры изображений поверхностей Обратите внимание на то, что различные типы пространственной организации возникают на различных масштабных уровнях практически независимо Способность отличать эти типы организаций является важной особенностью предварительного этапа обработки зрительной информации [29]

58

Рис 2 2 Наблюдаемую часть пространственной организации рисунка " в елочку" (типа приведенного здесь) составляют вертикальные полосы Их нельзя восстановить с помощью методов, основанных на фурье-преобразовании, однако эта задача легко решается методами классификации [29]

тельно, в еще большей степени они сказываются на изображениях из-за нали чия дополнительных преобразований, используемых в процессе получения изображения Таким образом, о каких бы характерных объектах, выделяемых на изображении, ни шла речь, необходимо, чтобы они давали возможность определять в явном виде признаки изображения в широком диапазоне размеров Более того, важно отдавать себе отчет в том, что нельзя установить простого соответствия между этими уровнями организации и результатами полосовой фильтрации пространственных частот изображения с помощью фильтров, настроенных на различные частоты1. Хотя некоторые типы организации можно выделить таким образом, многие из них указанному обнаружению не поддаются (как, например, вертикальные полосы на изображении, приведенном на рис. 2.2).

Итак, мы в состоянии сформулировать наше второе физическое допущение пространственная организация функции отражательной способности некоторой поверхности часто порождается совместным воздействием целого ряда различных процессов, каждый из которых относится к отдельному уровню Таким образом, любое представление, в котором используются неоднородности, имеющиеся на изображении подобных поверхностей, для определения изменений глубины и ориентации поверхностей должно обеспечивать учет изменений значений признаков, поставленных в соответствие характерным объектам изображения, размеры которых могут изменяться в широком диапазоне Другими словами, непроизводные элементы нашего представл.ения должны обеспечивать работу на ряде различных уровней

Фильтры этого типа позволяют очищать изображение от всех пространственных частотных составляющих, лежащих за пределами некоторого заданного диапазона частот

59

Подобие

Наше третье допущение имеет несколько иной характер. Предположим, что мы уже располагаем некоторым представлением, включающим непроизводные элементы разного размера. Интуитивно кажется очевидным, что такие непроизводные элементы должны храниться как-то отдельно, т. е. сравнение крупномасштабного дескриптора с другими крупномасштабными дескрипторами должно происходить проще, чем с мелкомасштабными. И, кроме того, может показаться очевидным и то, что характерные изображения или дескрипторы, обладающие иными полярными различиями, скажем очень сильно отличающейся или даже противоположного знака контрастностью, должны храниться отдельно.

Действительно, можно найти некоторое физическое обоснование того, почему следует поступать именно таким образом; это, в частности, явно следует из приведенных нами выше примеров. Обратим внимание, что на разных уровнях организации, выделяемых в меховом покрове животного, на речной поверхности, на древесной коре, в структуре ткани и т. п., процессы, порождающие функцию отражательной способности, относительно независимы на своих масштабных уровнях, однако объекты, являющиеся результатом осуществления каждого из этих процессов, визуально похожи друг на друга значительно больше, чем на какие-либо иные объекты, находящиеся на той же самой поверхности. Так, например, любой отдельный волосок кошачьей шубки обладает существенно большим сходством с соседними волосками, чем с полосами, образованными совокупностями тысяч волосков. Подобие в данном случае можно оценивать различными способами, однако вполне достаточно простого критерия, основанного на учете локального контраста, размеров (длина и ширина), ориентации и цвета (обсуждение общих свойств критериев различия можно найти в монографии Джардина и Сибсона [105]).

Это обстоятельство может служить для нас средством отбора объектов изображения в процессе назначения непроизводных элементов для построения его представления. Существенно (и это можно сформулировать в качестве нашего третьего физического допущения), что объекты, появляющиеся на некоторой поверхности в результате некоторого процесса порождения отражательной способности, действующего на некотором определенном масштабном уровне, обычно обладают большим сходством по размерам, локальному контрасту, цвету и пространственной организации между собой, чем с другими объектами этой же поверхности.

Рисунок 2.3 иллюстрирует это подобие. Как указывал Гласе [62], для порождения таких конфигураций необходимо на некоторое множество точек наложить то же самое множество точек, но немного повернутое или слегка " раздвинутое" (рис. 2.3, а). Этот эффект сохраняется, если в качестве характерных объектов используются квадратики (рис. 2.3, б), а также для пар, объединяющих характерные объекты, устроенные совершенно по-разному (рис 2.3, в). Если же характерные объекты разнятся достаточно сильно (рис. 2.3, г), то никакой определенной конфигурации не видно. Гласе и Суиткес [64] показали, что эффект исчезает, если точки обладают полярной контрастностью или окрашены в противоположные цвета. Стивене [220, рис. 51, а] 60

Рис. 2.3. Эти изображения получены с помощью положения некоторой случайной конфигурации характерных объектов на ту же конфигурацию, но слегка повернутую или " раздвинутую". В качестве характерных объектов могут использоваться точки, маленькие квадратики (а) или квадратики большего размера (б). Конфигурация вовсе не обязательно должна включать только одинаковые характерные объекты. На рис. 2.3, в одно из множеств образовано квадратиками, а другое - фигурами, обозначенными четырьмя точками; единственное требование - все характерные объекты должны обладать подобием. На рис 2.3, г одно из множеств состоит из довольно крупных квадратиков, а другое - из мелких точек. Эти характерные объекты слишком сильно отличаются друг от друга, чтобы на этом изображении можно было увидеть " раздвинутую" структуру

показал, что не удается обнаружить никакой организации при наложении трех множеств точек — исходного, повернутого и " раздвинутого". Если, допустим, повернутое множество оказывается существенно ярче двух остальных, то наблюдается организация, порожденная парами более тусклых точек. Все это доказывает, что в основе данного явления лежит сопоставление фор-

61

мализованных описаний свойств локальных характерных объектов изображения, а не, скажем, измерения, осуществляемые непосредственно на изображении с помощью, например, простой клетки Хьюбела и Уисела.

Пространственная непрерывность

Характерные объекты, возникающие на некоторой поверхности в результате действия какого-то одного процесса, помимо того, что они обладают " внутренним" подобием, часто образуют определенную пространственную организацию, принимающую вид кривых, прямых и, возможно, более сложных конфигураций. Принципиальной особенностью здесь является то обстоятельство, что подобная " разметка" часто порождает на поверхности гладкие контуры, и, следовательно, характерные объекты соответствующего изображения должны обладать таким же свойством. Пространственная непрерывность очень хорошо воспринимается человеком. Мы сразу видим коллинеарность объектов, изображенных на рис. 2.4 [145, рис. 10], несмотря на то, что все объекты, расположенные вдоль прямой, различны: в качестве одного объекта использовано пятно, другого — небольшая группа точек, третьего — конец стержня и т. д. Все объекты, однако, имеют приблизительно одинаковую величину. Еще один прекрасный пример приведен на рис. 2.5 [159, рис. 7]. Изображенная на нем конфигурация содержит очень много непрерывных структур, каждая из которых как бы пытается выделиться и подавить другие.

Непрерывность нарушений непрерывности

Одним из следствий когезионной способности материи является факт существования объектов материального мира в определенных границах. Эти границы порождают нарушения непрерывностей по глубине и ориентации поверхностей, обнаружение которых входит в нашу задачу, причем важной особенностью таких границ является то, что они часто на изображениях оказываются гладкими. Можно, в сущности, считать, что геометрическое место раз-

Рис. 2.4. Дополнительная иллюстрация к понятию " локально-характерный объект -двухмерный признак изображения". Хотя все подгруппы, образующие данную конфигурацию, определены по-разному, совершенно очевидно, что все они коллинеарны. Отсюда следует, что каждая группа порождает локально-характерный объект - двухмерный знак, причем их коллинеарность определяется практически независимо от способа задания локально-характерных объектов при том условии, что они представляют достаточно

подобные объекты (сравнение с рис. 2.3, г) [145] 62

рывов по глубине или ориентации поверхности почти везде гладко. Возможно, именно это физическое ограничение определяет полезность механизма гладких субъективных контуров (см. рис. 2.6 и разд. 4.8).

Непрерывность движения

И наконец, не следует забывать об исключительной важности для зрения движения, ибо оно присутствует повсеместно. Движение наблюдателя или некоторого материального объекта может порождать движение на изображениях этого объекта. Если последний обладает жесткостью, то перемещения изображения соседних точек поверхности объекта аналогичны. Таким образом, перемещения частей объекта, расположенных на его изображении на небольших расстояниях друг от друга, обычно аналогичны. В частности, поле скоростей движения на изображении почти везде изменяется непрерывным обра-

63

Рис. 2.5. Пример действия процессов активной группировки. Эта конфигурация преисполнена бурной активности - создает впечатление, что конкурирующие пространственные организации яростно борются друг с другом Ц59]

Рис. 2.6. Субъективные контуры. Изменения глубины, по-видимому, столь важны для зрительной системы, что она стремится сделать их явными везде, в том числе и там, где отсутствуют непосредственные зрительные данные, подтверждающие наличие таких изменений

зом, и если оказывается, что оно имеет нарушения непрерывности не в какой-то изолированной точке, то это означает наличие во внешнем мире некоторого реального нарушения целостности (жесткости) формы объекта (типа границы объекта). Так, при наличии любого нарушения непрерывности движения более чем в одной точке, например вдоль некоторой прямой, следует считать, что имеет место граница объекта.

Об общих свойствах представления

Смысл и важность указанных физических ограничений заключаются в том, что, несмотря на определяющую роль в тех изображениях, с которыми мы работаем, изменений яркости, реальности материального мира налагают на эти исходные изменения яркости широкий спектр пространственных организаций, действующих на разных масштабных уровнях и практически независимо друг от друга. Соответствующая организация проявляется в структуре изображения, и, поскольку она содержит важные сведения относительно структуры видимых поверхностей, представления изображения, используемые на предварительном этапе обработки, должны учитывать ее. Я, в частности, предлагаю делать это с помощью набора локально-характерных объектов — двухмерных признаков изображения, которые в определенной мере соответствуют отрезкам яркостного перехода или границы, характеризующимся определенным направлением, или точкам нарушения непрерывности по таким направлениям, полосам (приблизительно параллельным парам яркост-ных переходов) или их концам, пятнам (полосам, грубо обрезанным с обоих концов): Эти непроизводные элементы можно определять как вполне конкретным образом (исходя просто из нарушений непрерывности по яркости), так и достаточно формально. Так, пятно можно задать, опираясь на некоторое множество точек, а границу — исходя из определенных (но отнюдь не любых) изменений текстуры или объединив в некоторую линию ряд локаль-64

Рис. 2.7 Схематическое представление описаний изображения, относящихся к различным масштабным уровням и в целом составляющих первоначальный эскиз. На нижнем уровне исходный первоначальный эскиз точно воспроизводит изменения яркости изображения и, кроме того, представляет концы, обозначенные на рисунке зачерненными кружками. На следующем уровне для групп объектов изображения формируются характерные объекты, отличающиеся определенной ориентацией. На очередном уровне различие направлений ориентации групп объектов, расположенных в левой и правой частях изображения, позволяет провести границу между этими частями изображения. Сложность первоначального эскиза определяется степенью пространственной организации изображения на различных масштабных уровнях

65

но-характерных объектов — двухмерных признаков изображения, определяемых, в свою очередь, достаточно сложным образом (см. пример, приведенный на рис. 2.4).

На рис. 2.7. проиллюстрирована общая концепция, лежащая в основе схемы представления, назьшаемой первоначальным эскизом [145]. Основные положения этой концепции состоят в следующем:

1. Первоначальный эскиз на разных масштабных уровнях строится из непроизводных элементов одного и того же типа — некоторое пятно характеризуется практически одними и теми же местоположением, длиной, шириной и ориентацией независимо от того, на каком уровне оно определено; непроизводные же элементы, однако, могут задаваться на изображении разнообразнейшими способами — от самых конкретных (метка черными чернилами) до весьма формальных (множество точек).

2. Эти непроизводные элементы последовательно формируются конструктивным образом: сначала анализируются и представляются изменения яркости и непосредственно по ним формируются характерные объекты изображения; далее добавляется представление локальной геометрической структуры, характеризующей их расположение; затем эти объекты подвергаются воздействию процессов активного выбора и группировки с тем, чтобы получить характерные объекты более высокого уровня, отражающие крупномасштабные структуры изображения, и т. д.

3. В целом формируемые непроизводные элементы, параметры, которые ставятся им в соответствие, и точность их измерения определяются таким образом, чтобы структура изображения, учитываемая и отображаемая с их помощью, обеспечивала получение информации относительно реальной геометрической структуры видимых поверхностей. В результате возникает

довольно сложная проблема достижения компромисса между возможной точностью различения и ценностью получаемой в результате информации. Так, при изменении ориентации поверхности проекции их направлений на изображении действительно изменяются, но, вообще говоря, в очень незначительной степени, и обычно, вероятно, эти изменения оказьюаются меньше типичного разброса направлений ориентации, характерного для реального распределения разметки поверхностной структуры. Это означает, что, за исключением специальных случаев, не имеет смысла использовать очень мощные средства для обнаружения едва различимых изменений направления ориентации. С другой стороны, поскольку даже очень малое относительное смещение служит неопровержимым свидетельством разделенности двух поверхностей, следует с очень большим вниманием относиться к относительным смещениям.

Процессы получения первоначального эскиза делятся на три основных этапа: 1) определение точек пересечения сигналом нулевого уровня [155, 157, 150]; 2) формирование исходного первоначального эскиза [145, 150, 84]; 3) получение полного первоначального эскиза [145].

66

2.2. ОПРЕДЕЛЕНИЕ ТОЧЕК ПЕРЕСЕЧЕНИЯ СИГНАЛОМ НУЛЕВОГО УРОВНЯ И ИСХОДНЫЙ ПЕРВОНАЧАЛЬНЫЙ ЭСКИЗ

Определение точек пересечения сигналом нулевого уровня

Первый из описанных выше трех этапов посвящен обнаружению изменений яркости. Основу этого процесса составляют два следующих положения: 1) поскольку изменения яркости изображения могут относиться к различным масштабным уровням, для того, чтобы оптимизировать процесс их обнаружения, необходимо применять операторы, обрабатывающие фрагменты изображения различных размеров; 2) резкое изменение яркости приводит к возникновению пика или впадины первой производной, что эквивалентно пересечению нулевого уровня второй производной, как это показано на рис. 2.8 (пересечением сигналом нулевого уровня называется та точка, в которой соответствующая функция меняет свое значение с положительного на отрицательное).

Из этого следует, что для эффективного обнаружения изменения яркости необходимо пользоваться фильтром, обладающим двумя существенными свойствами. Прежде всего он должен реализовывать некоторый дифференциальный оператор, вычисляющий первую или вторую пространственную производную изображения. Кроме этого он должен допускать настройку на работу на необходимом масштабном уровне с тем, чтобы фильтры, предназначенные для обработки больших фрагментов изображения, можно было использовать для обнаружения границ на размытых затемненных участках изображения, а фильтры, предназначенные для обработки малых фрагментов изображения, — для обнаружения малых элементов изображения на его хорошо сфокусированных участках.

Марр и Хилдрет [150] показали, что в наибольшей степени этим требованиям соответствует V2 G-фильтр, где V2-оператор Лапласа (сР/Э*2 +< г/ду2), а символ G обозначает распределение Гаусса

G (х, у) = е 22

со средним квадратическим отклонением а. График оператора V2 характеризуется круговой симметрией и имеет форму сомбреро; двухмерное распре-

Рис. 2 8. Иллюстрация понятия " пересечение нулевого уровня". Изменение яркости (а) порождает пик в первой производной (б) и (резкое) пересечение нулевого уровня во

второй производной (в)

67

деление значении этого оператора можно задать через расстояние г от начала координат с помощью следующего выражения:

На рис. 2.9 представлены одномерный и двухмерный варианты этого оператора, а также их фурье-преобразования.

Выбор фильтра типа G определяется в основном двумя моментами. Во-первых, за счет гауссовской части G изображение размыто, на нем эффективно уничтожены все структуры, относящиеся к масштабному уровню, существенно меньшему значения пространственной постоянной σ гауссовского распределения. В качестве соответствующего примера на рис. 2.10 представ-

Рис. 2.9. Представление V2 С-фильтра в виде одномерной (or) и двухмерной (б) функций (значения этих функций соответствуют яркости в каждой точке) и фурье-преобразования одномерного (в) и двухмерного (г) вариантов соответственно [150]

68

Рис. 2.10. Размывание изображений составляет первый этап обнаружения на них изменений яркости. Поскольку на исходном изображении (д) изменения яркости могут отмечаться на значительном числе масштабных уровней, ни один оператор в отдельности не обеспечит выделения всех этих изменений с высокой эффективностью. Эта задача существенно упрощается, если изображение размыто с помощью гауссовского фильтра, поскольку при этом, в сущности, сверху ограничивается допустимый темп изменений яркости. Первый этап процесса обнаружения границы можно рассматривать как разбиение исходного изображения на ряд копий, к каждой из которых применяется гауссовс-кий фильтр, предназначенный для обработки фрагментов определенного (своего для каждого фильтра) размера; соответственно изменения яркости определяются для каждой копии изображения отдельно. Изображение (б) обработано гауссовским фильтром, имеющим а, равную 8 пикселам. Изображение (в) обработано гауссовским фильтром, имеющим а, равную 4 пикселам. Размер изображения 320X320 пикселов [150]

лено изображение, подвергнутое свертке с помощью двух гауссовских фильтров, предназначенных для работы на разных масштабных уровнях. У одного из них пространственная постоянная а равна 8 пикселам (рис. 2.10, б), у другого — 4 пикселам (рис. 2.10, в). Причина выбора в данном случае для размывания изображения гауссовского фильтра, а не, скажем, оператора, график которого имеет вид цилиндрической женской шляпы без полей и с плоским донышком, заключается в том, что гауссовское распределение обладает необходимыми свойствами — оно гладко и локализовано как в пространственной, так и в частотной области и, строго говоря, представляет собой единственное распределение, характеризующееся одновременно оптимальной локализацией в обеих областях. Такие свойства функции размывания, в свою очередь, желательны потому, что при максимально возможной равномерности размывания как в пространственной, так и в частотной области вероятность внесения каких-либо изменений, отсутствующих на исходном изображении, оказывается минимальной.

Второй момент касается дифференцирующей части фильтра V2 • Важнейшее преимущество, которое обеспечивается благодаря ее использованию, — экономичность вычислительной процедуры. Можно взять производные по направлению первого порядка типа д/дх или д/ду, что влечет за собой необходимость отыскивать их локальные максимумы или минимумы по каждой из направлений (как это показано на рис. 2.8, б), либо производные по направлению второго порядка типа д2/Эх2 или Ь2[Ьу2 — в этом случае изменения яркости изображения будут соответствовать тем точкам, в которых они принимают нулевые значения (см. рис. 2.8, в). Все эти операторы, однако, обла-

69

Рис. 2.11. Пространственная организация дифференциальных операторов низших порядков. Операторы типа Э/Эдс допускают приближенную реализацию с помощью фильтров,

рецептивные поля которых имеют вид, представленный на рисунке: а, б — операция Ъ/Ъх, рассматриваемая как измерение разности значений яркости в двух соседних по оси х точках; в — операция Э2/Э*2, рассматриваемая как процедура определения разности двух соседних значений д/Ъх, т. е. рецептивного поля; г, д — рецептивные поля двух других операторов второго порядка Э2\Ъуг и Ъ2/ЪхЪу соответственно; е — рецептивное поле изотропного оператора самого низшего порядка (оператора Лапласа (Э2/Эдс2 + Э2/Э, у2), для которого используется обозначение V2 ), характеризуется

круговой симметрией

дают тем недостатком, что они являются направленными —применение любого из них связано с учетом ориентации нескольких дифференциальных операторов первого и второго порядков (см. рис. 2.11, иллюстрирующий пространственную организацию, т. е. " рецептивное поле" на нейрофизиологическом языке). Использование первых производных требует, в частности, определения значений Ы/дх и М/ду и отыскания локальных максимумов и минимумов амплитуды их суммарных значений, т. е. определения также и знака, и значения величины

[ (э//эх)2 + (э//а^)2 ] - ^.

Применение операторов, реализующих вычисление производных второго порядка по направлению, порождает проблемы еще более неприятные, чем те, которые возникают в связи с производными первого порядка. Единственный способ избежать подобных дополнительных вычислительных затрат — это попытаться применить оператор, не зависящий от направления. Изотропным дифференциальным оператором самого низшего порядка является лапласиан V2, и, как оказалось, этот оператор можно использовать для обнаружения изменений яркости изображения, если размытое изображение удовлетворяет нескольким чрезвычайно слабым ограничениям [150]1. Изображе-

Раэмывание функции яркости изображения / (х, у) с помощью функции гауссов-ского распределения G в математической нотации записывается как G * I (читается: " функция G свертывается с функцией /" ). Соответствующий оператор Лапласа записывается как V2 ( G *Г), причем применение этого оператора к свертываемой функции, а не к результату свертки приводит к получению тождественного результата: v2 (G * Г) -= ( V 2 G ) * L

70

ния, как правило, локально удовлетворяют таким ограничениям, и поэтому при решении реальных задач допустимо пользоваться оператором Лапласа. Итак, практически наиболее удовлетворительный способ отыскания на изображении изменений яркости, относящихся к некоторому определенному масштабному уровню, заключается в предварительной фильтрации изображения с помощью оператора V2 G, пространственная постоянная части G которого выбирается таким образом, чтобы был обеспечен учет того масштабного уровня, к которому относятся искомые изменения яркости, после чего на изображении, полученном в результате фильтрации, отыскиваются точки пересечения нулевого уровня.

Рис. 2.12, 2.13, 2.14. Примеры, иллюстрирующие обнаружение точек пересечения нулевого уровня с помощью оператора V2 G: a — изображение размера 320X320 пикселов; б — результат свертки этого изображения с помощью оператора 42 G при W 2— D ~ 8 (нулевые значения представлены серым цветом); в — положительные (белый цвет) и отрицательные (черный цвет) значения; г —

только пересечения нулевого уровня

71

Рис 2 13

На рис. 2.12 — 2.14 показано, как выглядит изображение, подвергнутое такой обработке. Цифровые значения элементов изображения, полученного в результате фильтрации с помощью оператора V G, могут быть как положительными, так и отрицательными, но суммарное среднее значение равно нулю. Положительным значениям на этих рисунках соответствует белый цвет, отрицательным — черный, а нулевым — некоторый промежуточный уровень серого тона. Как уже отмечалось, существенным свойством оператора V G является то, что точки, в которых график его значений пересекает нулевой уровень, служат индикаторами изменений яркости на изображении, размытом с помощью гауссовской функции распределения с некоторой пространственной постоянной. На приведенных рисунках это прекрасно видно. Так, на рис. 2.12, в представлено изображение, которое после фильтрации было подвергнуто " бинаризации", т. е. всем его элементам с положительными значениями были присвоены значения " +1", а элементам с отрицательными значениями —

72

Рис 2 14

значения " —1" На рис. 2 12, г изображены лишь точки пересечения нулевого уровня. Преимущество бинаризованного представления заключается также в том, что оно указывает знак пересечения нулевого уровня, т. е. позволяет судить о том, какая сторона изображения темнее.

Кроме того, угол, под которым происходит пересечение нулевого уровня, зависит, хотя и не непосредственно, от степени изменения яркости. Это обстоятельство иллюстрируется рис 2.15, на котором представлено исходное изображение с нанесенными на нем точками пересечения нулевого уровня, последние соединены кривыми различной яркости. Кривая тем контрастнее, чем больше угол, под которым происходит пересечение нулевого уровня (измеряется относительно перпендикуляра к направлению сигнала в соответствующей точке)

Для формализации представления точек пересечения нулевого уровня типа воспроизводимых на рис. 2 12 — 2.15 можно воспользоваться нескольки-

73

Рис. 2.15. Иллюстрация представления пересечений нулевого уровня. Яркость линий изменяется в соответствии со значением угла пересечения нулевого уровня, что позволяет легче понять, какие линии представляют наиболее контрастные участки изображения

ми различными способами. Для их представления мы будем пользоваться набором направленных непроизводных элементов, называемыхотрезками пересечений нулевого уровня. Каждый из таких непроизводных элементов служит описанием некоторой части контура, у которой крутизна яркости (скорость изменения значения свертки на отрезке) и локальное направление остаются приблизительно одниковыми. В связи с тем, что это в конечном счете оказывается существенным с физической точки зрения, необходимо выделить те точки, в которых направление пересечений нулевого уровня меняется " разрывно". Кавычки в данном случае необходимы, поскольку на самом деле можно доказать, что изменение направления пересечений нулевого уровня графиком свертки V2C */ни при каких обстоятельствах не имеет разрывов, однако, тем не менее, удается сформулировать определение разрывности, пригодное для использования. Кроме того, небольшие замкнутые контуры представляются пятнышками, каждое из которых также характеризуется ориентацией, средней крутизной яркости и размерами, определяемыми их прогяженностями вдоль большой и малой осей. И наконец, в соответствии с глобальной целью, для того чтобы обеспечить обнаружение изменений яркости в полном диапазоне всех тех масштабных уровней, на которых они возникают на изображении, необходимо использовать операторы, предназначенные для обработки фрагментов изображения нескольких различных размеров.

Биологические следствия

Эта вычислительная схема, характеризующая самые первые этапы обработки зрительной информации, позволяет интерпретировать большое число результатов, полученных в процессе психофизических и нейрофизиологических исследований нижнего уровня зрения, а также может быть источником гипотез относительно общих принципов организации начальной части зрительного пути.

74

Психофизика нижнего уровня зрения

В 1968 году Кампбелл и Робсон поставили несколько экспериментов по зрительной адаптации [30]. Они обнаружили, что контрастная чувствительность испытуемых временно понижается после предъявления им высококонтрастных решеток, причем это понижение зависит от ориентации и пространственной частоты решетки. В результате экспериментаторы пришли к выводу, что зрительный путь содержит некоторый набор " каналов", обладающих избирательностью по ориентации и пространственной частоте.

Это открытие породило подлинный взрыв в области исследования отдельных подробностей структуры этих каналов, кульминацией которых явилась предложенная не так уж давно элегантная количественная модель структуры таких каналов, имеющейся у человека. В основу этой модели были положены данные порогового обнаружения, полученные Уилсоном и Гисом [256] и Уилсоном и Бергеном [155]. Понять эту модель очень легко. Идея, положенная в ее основу, состоит в том, что в каждой точке поля зрения размещаются четыре настраиваемых на пространственный размер фильтра (маски), предназначенные для анализа изображения. Пространственные поля каждого из этих фильтров имеют форму, приблизительно соответствующую разности двух гауссовских распределений (РГР), однако два фильтра, реализующие маски меньших размеров, проявляют в основном тонические временные свойства, а два фильтра, реализующие маски больших размеров, - в основном фазные. Размер маски, соответствующей каналу, растет линейно в соответствии с увеличением эксцентриситета (углового расстояния от центральной ямки сетчатки глаза); каналы обозначаются символами N, S, Т и (/в порядке увеличения размера маски. Канал S обладает наибольшей чувствительностью как по отношению к тонической, так и фазной стимуляции; канал же U отшичается наименьшей чувствительностью, составляющей всего лишь от одной четвертой до одной одиннадцатой чувствительности канала 5. Сам Уилсон не выдвигал никаких утверждений относительно направленности фильтров, но он определил их размеры, используя светлые и темные линии. При использовании таких одномерных раздражителей ширина центральной части рецептивного поля (мы будем обозначать ее символом wl jj ) имеет следующие значения: ЗД' (канал N ); 6, 2 (канал S ); 11, 7 (канал Г); 21 (канал U ). Размеры рецептивного поля растут линейно с увеличением эксцентриситета (приблизительно вдвое при эксцентриситете, равном 4° ). Фактически все психофизические данные, относящиеся к обнаружению пространственных образов, которые.характеризуются порогом различимости менее 16 периодов на градус, допускают интерпретацию в рамках этой модели в сочетании с гипотезой, предполагающей, что в основе процесса обнаружения лежит некая разновидность пространственной вероятностной суммации, осуществляемой в указанных каналах.

Как я считаю, именно V2 С-фильтры составляют основу каналов, существование которых подтверждается психофизическими данными. Оператор V2 G аппроксимирует некоторый полосовой фильтр с полосой пропускания в 1, 25 октавы, соответствующей половине энергии спектра. Такой фильтр можно приближенно представить с помощью РГР, причем наилучшее - с технической точки зрения - приближение достигается в тех случаях, когда пространственные постоянные двух гауссовских распределений, образующих РГР, характеризуются отношением 1: 1.6. Рисунок 2.16 характеризует качество подобной аппроксимации. Оценка Уилсона этого отношения для тонических каналов составляет 1: 1, 75.

Для того чтобы использовать найденные Уилсоном и Бергеном числовые значения величины Wj _£ ) при определении диаметра центральных частей рецептивных полей соответствующих операторов V2 G, необходимо умножить значения первых на > /Т, поскольку измерения Уилсона соответствуют линейной проекции рецептивных полей с круговой симметрией. Таким образом, канал N Уилсона соответствует некоторому У2С-фильт-

75

Рис. 2.16. Наилучшая с технический точки зрения реализация У2С-фильтра (сплошная линия) с помощью разности двух гауссовских распределений (РГР), достигаемая при соотношении тормозной и возбуждающей пространственных постоянных, равном приблизительно 1: 1, 6. РГР представлена на этом рисунке штриховой линией. Обе кривые

имеют очень похожие профили [150]

ру, диаметр центральной части рецептивного поля которого ^2— D ~ ^ ^ =^'^> Ч1° примерно соответствует девяти колбочкам центральной ямки сетчатки глаза. Это значение кажется слишком большим для наименьшего из каналов, и доводы, основанные на теоретическом анализе остроты и разрешающей способности зрения, указывают на существование еще меньшего канала. Диаметр W 2— D центральной части рецептивного поля такого канала должен составлять около Г 20", и из-за дифракции в глазу речь может идти о карликовых ганглиозных клетках, центральные части рецептивных полей которых состоят лишь из одной колбочки [156].

Итак, если считать числовые оценки Уилсона правильными, то они позволяют судить о том, какими размерами исходные операторы типа " центр-периферическое кольцо" должны обладать, для того чтобы обеспечивать возникновение наблюдаемой психофизической адаптации и других феноменов. Вообще говоря, эти цифры можно было бы соотнести с результатами физиологических измерений, и в следующем разделе мы укажем соответствующий способ. И наконец, в этой связи следует отметить, что Кампбелл обнаружил также зависимость адаптации от ориентации (она, кроме того, может зависеть и от направления движения). Эту особенность мы связываем с этапом обнаружения пересечений нулевого уровня, который лучше всего рассматривать на нейрофизиологическом уровне.

2 Физиологическая реализация V G -филътров

С момента появления работы Каффлера [125] известно, что пространственная организация рецептивных полей ганглиозных клеток сетчатки характеризуется круговой симметрией, причем их центральная часть выполняет возбуждающие функции, а периферическая - тормозящие. Некоторые клетки (их называют клетками, реагирующими на

76

появление светлого раздражителя в центре рецептивного поля (КСЦР)') возбуждаются при появлении в центре их рецептивного поля небольшого светлого пятна, а остальные при этом затормаживаются. Родик и Стон высказали предположение [204], согласно которому такая организация является результатом наложения небольшой центральной области возбуждения на значительно больший тормозящий " купол", простирающийся над всем рецептивным полем. Инрот - Кугелл и Робсон [44] представили два таких купола гауссовскими распределениями, получив в результате описание рецептивного поля как некоторой разности двух гауссовских распределений. Кроме того, Инрот — Кугегш и Робсон исходя из временных характеристик их реакции на стимуляцию разделили большие ганглиозные клетки сетчатки на два класса — X и Y. Первые демонстрируют явно выраженную тоническую реакцию, а вторые — в основном фазическую, причем это различие сохраняется и на уровне клеток наружного коленчатого тела. Вероятно, тонические каналы Уилсона соответствуют на физиологическом уровне Л'-клеткам, а фазные каналы — У-клеткам [228].

Таким образом, не столь уж беспочвенным является предположение о том, что Х-гслет-ки сетчатки и наружного коленчатого тела воспроизводят именно значения функции V2 G, причем положительные значения воспроизводятся клетками КСЦР, а отрицательные — клетками, реагирующими на появление темного раздражителя в центре рецептивного поля (КТЦР)а. Для иллюстрации физиологических аспектов этого механизма на рис. 2.17 сопоставляются ответы Л'-клеток, предсказанные с помощью функции V2 G, и опубликованные в научной литературе значения ответов клеток сетчатки и наружного коленчатого тела, идентифицированных нами в качестве Х-клеток, для раздражителей трех видов — яркостного перехода, узкой и широкой полос. Очевидно, что имеет место очень точное качественное совпадение соответствующих результатов. Функции У-клеток будут рассмотрены нами в разд. 3.4.

Физиологический механизм обнаружения пересечений нулевого уровня

С физиологической точки зрения отрезки пересечений нулевого уровня легко выделяются независимо от обнаружения точек пересечения нулевого уровня, ибо выделение таких отрезков на основе обнаружения точек пересечения нулевого уровня — неправдоподобная в физиологическом смысле идея. Причина этого заключается в том, что по одну сторону непосредственно от точки пересечения нулевого уровня располагается положительный локальный максимум изображения, полученного в результате фильтрации ( V 2 G * I ), а непосредственно по другую - отрицательный. Расстояние между этими локальными максимуМи составляет примерно w2 _ ol \ fT, где w 2 _Ј f - ширина центральной части рецептивного поля соответствующего V2 G-фильтра. Следовательно, непосредственно по одну сторону от точки пересечения нулевого уровня наблюдается интенсивный разряд клетки КСЦР и непосредственно по другую - интенсивный разряд клетки КСЦР. Сумма значений ответов этих клеток соответствует углу, под которым происходит пересечение нулевого уровня - высококонтрастные изменения яркости порождают более интенсивный разряд, чем низкоконтрастные. Таким образом, пересечение нулевого уровня может быть обнаружено с помощью какого-либо механизма, обеспечивающе-

1 В отечественной литературе по психофизиологии зрения используется термин " оп-клетки". - Прим. перев.

3 В отечественной литературе по психофизиологии зрения используется термин " off-, клетки". - Прим. перев.

77

Рис. 2.17. Сопоставление предсказанных ответов Л'-клеток КСЦР и КТЦР с результатами электрофизиологических исследований. В первом ряду представлены значения V2 G *1 для изолированного яркостного перехода тонкой полосы (ширина полосы составляет 0, 5 w j _0, где Wj_Ј) - значение ширины центральной возбуждающей части рецептивного поля, спроецированной на некоторую прямую) и толстой полосы (ширина полосы составляет 2, 5 wl _Ј$. Теоретический прогноз был получен с помощью наложения положительных (второй ряд) или отрицательных (четвертый ряд) частей графика V* G */ на График фоновой активности клетки, значения которой невелики (ответ клетки в невозбужденном состоянии). Соответствующие физиологические данные (третий и пятый ряды) заимствованы из [43] (ответы на предъявление края) и [204] (ответы на

предъявление полос шириной 1 и 5°) [158]

78

Рис. 2.18. Механизм обнаружения ориентированных отрезков пересечения нулевого уровня. На рис. 2.18, а Р- рецептивное поле ЯГ-клетки КСЦР наружного коленчатого тела, Q -рецептивное поле А'-клетки КТЦР наружного коленчатого тела. При возбуждении обеих клеток между ними должно происходить пересечение нулевого уровня. Следовательно, если эти клетки, как показано на рисунке, соединены с логическим элементом И, последнее обеспечит обнаружение наличия пересечения нулевого уровня. Если имеется набор пар таких клеток (б), причем каждая пара также соединена со своим логическим элементом И, то полученное в результате устройство будет обеспечивать обнаружение ориентированного отрезка пересечений нулевого уровня, расположенного в пределах границ, указанных приближенно штриховой линией. Идеальным случаем было бы использование логических элементов, воспроизводящих результат суммирования лишь при

возбуждении всех его Р-я (? -входов [ 150]

го соединение клетки КСЦР и клетки КТЦР с логическим элементом И1, как это показано на рис. 2.18, д.

Эту идею несложно использовать и для обнаружения направленности отрезка пересечения нулевого уровня: необходимо просто расположить Х-клетки КСЦР и КТЦР в два столбца, как это показано на рис. 2.18, б. Если связать все тги элементы с логическими элементами И или другими устройствами, обеспечивающими достаточно хорошее приближение их функции, то в результате возникнет устройство, обеспечивающее обнаружение отрезка пересечений нулевого уровня, ориентация которого ограничена двумя штриховыми линиями, изображенными на рис. 2.18, б. Эта идея составляет основу для синтеза модели простых клеток зрительной коры, которая будет приведена в разд. 3.4. Сейчас же достаточно заметить, что подобные устройства способны реагировать на ориентацию и настраиваться на пространственную частоту (с учетом модификаций, вводимых в разд. 3.4, они, кроме того, избирательны по направлению). Как я полагаю, адаптивность именно этих элементов обнаружили Кампбелл и Робсон в своих экспериментах в 1968 году.

1 Простейшее логическое устройство, воспроизводящее положительное выходное значение только при условии положительности всех сигналов, поступающих на его вход.

79

Первое полностью формализованное представление изображения

Использование точек пересечения нулевого уровня является естественным спосо» бом перехода от аналогового (непрерывного) представления, например задаваемого значениями яркостей / (х, у) двухмерного изображения, к некоторому дискретному, т. е. символьному представлению. Замечательным свойством такого преобразования является то, что оно, судя по всему, не сопровождается потерями информации. Это утверждение еще не доказано [157] и основывается на теореме Б. Ф. Логана [134]. Теорема утверждает, что при выполнении определенных условий сигнал, щирина полосы частот которого составляет одну октаву, может быть полностью восстановлен (с точностью до мультипликативной постоянной) по точкам пересечения нулевого уровня, что иллюстрирует рис. 2.19. Хотя доказательство теоремы трудное, оно, в сущности, показывает, что сигнал, ширина полосы частот которого меньше одной октавы, должен пересекать ось х по меньшей мере так же часто, как это должно происходить в соответствии с требованиями теоремы отсчетов1.

Применительно к нашим задачам утверждение теоремы Логана, к сожалению, не обладает достаточной силой, чтобы на ее основании можно было выступать с какими бы то ни было непосредственными заявлениями о зрении. Эта проблема имеет двойственный характер. Во-первых, применительно к зрению пересечение нулевого уровня происходит в двух измерениях и часто нелегко распространить аргументацию теоремы отсчетов с одномерного случая на двухмерный. Во-вторых, оператор v2 G не представляет, строго

Рис 2.19. Сущность теоремы Логана. Если сигнал после фильтрации не имеет общих нулей с его преобразованием Гильберта, то согласно теореме Логана этот сигнал с точностью до некоторой мультипликативной постоянной определяется исключительно точками пересечения им нулевого уровня. Результат Логана имеет существенное значение для нижнего уровня обработки зрительной информации в том отношении, что (при соответствующих условиях) собственно точки пересечения сигналом нулевого уровня содержат очень

важную информацию [157]. а — вероятностный гауссовский сигнал fix ) с ограниченной полосой частот; б — полоса пропускания (в частотной области) идеального однооктавного полосового фильтра; в —

результат фильтрации сигнала f (x)

1 В отечественной литературе эта теорема известна как теорема Котельникова или теорема Котельникова — Шеннона. - Прим перев 80

Рис. 2.20. Изображение, представленное на рис 2 20, а, свертывается с чг G-фильтрами, размеры рецептивных полей которых (w2_Ј) = 2\[Та) равны соответственно 6, 12 и 24 пикселам Эти фильтры приблизительно перекрывают диапазон, в котором действуют фильтры, реализуемые в центральной ямке сетчатки глаза человека. Изображения, полученные в результате пересечений нулевого уровня, представлены на рис. 2.20, б, в и г соответственно. Обратите внимание на то, сколь тонкие детали выделяет фильтр с наименьшим рецептивным полем. В связи с получением такого набора изображений, по всей очевидности, возникнет следующая проблема каким образом всю эту информацию следует использовать для того, чтобы получить некоторое единое описание9 [150]

говоря, однооктавный полосовой фильтр: ширина его полосы пропускания, соответствующая половине энергии спектра, составляет 1, 25 октавы, а чувствительности по уровню 0, 5-1, 8 октавы. С другой стороны, мы располагаем дополнительной информацией, а именно значениями углов, под которыми кривые, соответствующие сигналу, пересекают нулевой уровень - они примерно отвечают контрастности конкретного яркостного перехода на изображении. Очевидно, очень трудно аналитически решить эту задачу, однако Нисихаре (179] удалось экспериментально получить обнадеживающие подтверждения той точки зрения, согласно которой изображение, обработанное с помощью некоторого двухмерного фильтра, поддается восстановлению по его точкам пересечения нулевого уровня и значениям углов этих пересечений

Рисунок 2.20 иллюстрирует тот этап, до которого мы дошли в нашем изложении На нем приведены исходное изображение одной из скульптур Хенри Мура1 и вид, который

1 Хенри Мур - выдающийся современный английский скульптор - Прим. перев.

81

оно принимает на выходе трех каналов, осуществляющих фильтрацию на различных масштабных уровнях. Таким образом, на рисунке представлены пересечения нулевого уровня на исходном изображении после того, как оно было обработано с помощью V2 G-фильтров, в случае когда гауссовские части G характеризуются разными пространственными постоянными Возникает следующий вопрос, что же следует делать со всей этой информацией?

Необработанный первоначальный эскиз

До сих пор я тщательно избегал употребления термина яркостный переход, рассматривая обнаружение изменений яркости и их представления с помощью ориентированных отрезков пересечений нулевого уровня. Дело в том, что термин яркостный переход отчасти несет определенный физический смысл, например он наводит на мысль о реально существующей границе. До сих пор же речь шла исключительно о нулевых значениях сигнала, появляющихся ьа выходе некоторого набора полосовых фильтров, аппроксимирующих процедуру взятия второй производной. Мы не имеем права говорить о них как о яркостных переходах. Если же основания для этого имеются, следует указать, какие именно. Это различие имеет жизненно важное значение для теории зрения, а возможно, и для теорий других систем восприятия, поскольку краеугольным камнем зрительного восприятия является вывод, позволяющий по структуре изображения судить о структуре реального внешнего мира. Это как раз и служит предметом теории зрения, и основные ее проблемы связаны с физическими ограничениями и допущениями, обеспечивающими возможность получения указанного вывода.

Впервые с такими проблемами мы сталкиваемся в задаче, возникающей в связи с рис. 2.20. а именно: каким образом следует объединять информацию, поступающую по разным каналам? Реально используемые в зрительной системе рабочие полосы частот V С-фильтров отстоят друг от друга на октаву или большую полосу частот, и потому у нас нет априорных оснований считать, что пересечения нулевого уровня, полученные с помощью фильтров с рецептивными полями разных размеров, связаны между собой. Существует, однако, физическая причина, благодаря которой они часто действительно связаны. Она является следствием первого из введенных нами в предыдущей главе физических допущений — условия пространственной локализованности [150]. Реальный мир располагает следующими источниками, способными породить изменения яркости на изображении: 1) изменения освещения, в том числе теней, источников видимого света и углов освещения; 2) изменения расстояния от видимых поверхностей до наблюдателя или их ориентации относительно наблюдателя; 3) изменения коэффициентов отражения поверхности.

Решающим в данном сдучае является то обстоятельство, что все эти разновидности изменчивости можно считать (каждую по-своему) пространственно локализованными. Если не учитывать специфические дифракционные картины, то нельзя считать, что внешний мир, воспринимаемый зрительно, построен из зыбких, волнообразных пульсаций — непроизводных элементов, простирающихся над некоторой областью, образуя над ней некоторую суммарную картину (сравните с работой [142, с. 169]). В целом наблюдаемый миробразо-82

ван контурами, складками, царапинами, метками, тенями и оттенками, причем все они пространственно локализованы. Таким образом, отсюда следует, что если различимые пересечения нулевого уровня имеются на изображении, обработанном с помощью V2 (/-фильтра с рецептивным полем некоторого размера, то эти/пересечения должны быть обнаружены в том же месте изображения после обработки исходного изображениями фильтрами с рецептивными полями любых размеров, больших, чем у первого. Если такое положение не сохраняется при фильтрации с рецептивным полем большего размера, то это может происходить по одной из следующих двух причин: либо два или несколько локальных изменения яркости " объединяются" (их значения усредняются) в канале, соответствующем большему рецептивному полю, либо изменения яркости вызываются двумя независимыми физическими явлениями, возникающими в одной и той же области изображения, но на разных масштабных уровнях. Примером первой ситуации служит узкая полоса, края которой точно локализуются каналами, с малыми рецептивными полями; при использовании же больших рецептивных полей этого не происходит. Подобные ситуации можно распознавать по наличию двух близко расположенных пересечений нулевого уровня при использовании каналов с малыми рецептивными полями. Примером второй ситуации служит наложение тени на участок с резким изменением отражательной способности некоторой поверхности, что распознается по смещению пересечений нулевого уровня, получаемых в каналах с большими рецептивными полями, относительно пересечений нулевого уровня, получаемых в каналах с малыми рецептивными полями. Если тень имеет точно такие же положение и ориентацию, что и соответствующий участок поверхности, то позиции точек пересечения нулевого уровня могут оказаться недостаточной информацией для разделения этих двух физических явлений, однако при решении реальных задач такой случай встречается редко.

Итак, реальный физический мир налагает ограничения на геометрическую организацию пересечений нулевого уровня, получаемых с помощью каналов с рецептивными полями разных размеров. Мы можем воспользоваться этим обстоятельством, сформулировав допущение о совпадении в пространстве:

Если некоторый отрезок пересечений нулевого уровня воспроизводится на выходе ряда независимых каналов V2 G -фильтрации, выполняемой с рецептивными полями близких размеров, причем данный отрезок во всех каналах имеет одни и те же позицию и ориентацию, то наличие набора таких отрезков пересечений нулевого уровня свидетельствует о том, что на изображении имеется изменение яркости, вызванное каким-то одним физическим явлением (изменением коэффициента отражения поверхности, освещения, глубины или ориентации поверхности).

Другими словами, если пересечения нулевого уровня, получаемые от независимых каналов с рецептивными полями смежных размеров, совпадают, то их можно относить к одному источнику. Если же пересечения нулевого уровня не совпадают, то они, по всей вероятности, порождаются различными поверхностями или различными физическими явлениями. Это означает, что: 1) минимальное число каналов V G-фильтрации, необходимое для учета реа-

83

лий физического мира, равно двум; 2) если имеется некоторый диапазон размеров рецептивных полей каналов фильтрации, который достаточно рационально разнесен в частотной области и перекрывает необходимый диапазон частотного спектра, то можно сформулировать правила объединения соответствующих пересечений нулевою уровня в некоторое описание, непроизводные элементы которого имеют физический смысл [150].

Хотя такие правила весьма сложны, поскольку они должны учитывать множество частных случаев, общий принцип их построения вполне очевиден. При условии, что пересечения нулевого уровня, соответствующие каналам с большими рецептивными полями, " представляются" тем, что удается обнаруживать с помощью каналов с меньшими рецептивными полями (либо благодаря наличию взаимно однозначного соответствия этих пересечений с пересечениями нулевого уровня в каналах с меньшими рецептивными полями, либо благодаря тому, что первые являются размытыми усредненными копиями вторых), все эти данные характеризуют физические реальности, которые и составляют приблизительно наблюдаемое по каналам с меньшими рецептивными полями и, быть может, несколько сглаженное в результате снижающего шум и усредняющего воздействия каналов с большими рецептивными полями. Для того чтобы определить, имеет ли такое " представление" место в действительности, необходимо выявить те конфигурации, в которых-пересечения нулевого уровня, полученные с помощью каналов с малыми рецептивными полями, расположены близко друг от друга. Дело в том, что при этом каналы с большими рецептивными полями могут " обмануться". Отсюда и вытекает необходимость обнаружения и выделения пространственных конфигурации типа узких полос и пятен.

Рис 2 21 Необработанный первоначальный набросок, полученный с помощью двух каналов                                                  —»-а, б — пересечения нулевого уровня для изображения, приведенного на рис. 2.12, е помощью фильтров, у которых w 2_ q равно 9 и 18 пикселам соответственно; поскольку канал с большим рецептивным полем не дает ни одного пересечения нулевого уровня, которое не соответствовало бы пересечению нулевого уровня, полученному с помощью канала с малым рецептивным полем, расположение яркостных переходов в едином описании также соответствует представленному на рис. 2.21, fir; в, г к д — символьное представление признаков, приписанных к местоположениям яркостных переходов, представленным на рис. 2.21, а (в — пятна; г — локальные ориентации отрезков яркостных переходов, д — полосы). Эти диаграммы представляют лишь пространственную информацию, содержащуюся в признаках. Типичными являются следующие полные описания непроизводных элементов

ПЯТНО                                    ЯРКОСТНЫЙ ПЕРЕХОД        ПОЛОСА

(ПОЗИЦИЯ 146 21)              (ПОЗИЦИЯ 184 23)                 (ПОЗИЦИЯ 118 134)

(ОРИЕНТАЦИЯ 105)            (ОРИЕНТАЦИЯ 128)               (ОРИЕНТАЦИЯ 128)

(КОНТРАСТНОСТЬ 76)       (КОНТРАСТНОСТЬ - 25)      (КОНТРАСТНОСТЬ - 25)

(ДЛИНА 16)                           (ДЛИНА 25)                              (ДЛИНА 25)

(ШИРИНА 6)                           (ШИРИНА 4)                              (ШИРИНА 4)

Непроизводные элементы, которые характеризуются этими описаниями, отмечены стрелками Размещающая способность анализа изображения, приведенного на рис. 2.12, примерно соответствует тому, что увидел бы человек, рассматривая его с расстояния около

двух метров [150]

84

Если же пересечения нулевого уровня, соответствующие каналам с большими рецептивными полями, не представляются теми пересечениями нулевого уровня, которые выявляются каналами с меньшими рецептивными полями, то необходимо ввести новые элементы описания, поскольку каналы с большими рецептивными полями регистрируют воздействия каких-то иных физических явлений. Такие ситуации могут возникать по ряду причин, скажем когда неясная тень или сфокусированная сетка накладываются на расфокусированное изображение ландшафта или когда мы видим, как водяной жук скачет по ряби на поверхности пруда, а водоросли, растущие на его дне, создают расфокусированный фон.

Описание изображения, к построению которого ведет такой подход, называют необработанным первоначальным эскизом [150, 84]. В нем используются такие непроизводные элементы, как яркостные переходы, полосы, пятна и концы, причем каждому из них ставятся в соответствие признаки, характеризующие его ориентацию, контрастность, длину, ширину и местоположение на изображении. Соответствующий пример приведен на рис. 2.21. Его можно рассматривать как некоторое бинарное отображение (рис. 2.21, а), определяющее точное местоположение на изображении отрезков яркостных переходов и указывающее для каждой точки этих отрезков локальную ориентацию, а также характер и степень изменения яркости (рис. 2.21, г). Непроизводные элементы — пятно (рис. 2.21, в), полоса (рис. 2.21, д) и разрыв (непрерывности), или конец, - можно выделять на изображении в явном виде точно таким же образом. Представление некоторой длиной прямой задается, например, с помощью конца, нескольких отрезков одинакового направления, за которыми следует другой конец, как это показано на рис. 2.22, а. Ширина, контрастность и направление, вообще говоря, определены для всех точек прямой, хотя с практической точки зрения было бы вполне достаточно задавать эту информацию для соответствующим образом определенного интервала выборки. Если ширина прямой оказывается больше диаметра w наименьшего из используемых рецептивных полей, то для каждой из ее сторон строятся независимые описания яркостных переходов. Если линия изгибается, ориентация будет постепенно изменяться по ее длине (рис. 2.22, б).Если в некоторой точке линии имеется разрыв непрерывности по ориентации, то его положение определяется некоторым указанием на наличие конпа или разрыва непрерывности (рис. 2.22, в).

Необработанный первоначальный эскиз представляет собой очень богатое описание изображения, поскольку содержит, в сущности, все информацию, имеющуюся в пересечениях нулевого уровня, полученных с помощью нескольких каналов (двух — в примере, приведенном на рис. 2.21). Важность этого представления заключается в том, что оно является представлением изображения, непроизводные элементы которого с высокой степенью вероятности непосредственно отражают физическую реальность.

Субъективно Вы воспринимаете существование необработанного первоначального эскиза (и полного первоначального эскиза, описанного в разд. 2.5), но не воспринимаете пересечения нулевого уровня, из которых этот первоначальный эскиз построен. Для того чтобы увидеть, что каналы с больши-

86

Рис. 2.22. Необработанный первоначальный эскиз, задающий представление прямой в виде конца, нескольких направленных отрезков и второго конца (а). При замене прямой на гладкую кривую направление соответствующих внутренних отрезков будет постепенно изменяться (б). Если направление прямой резко изменяется, то ее представление должно включать явное указание о том, что имеется разрыв непрерывности. Следовательно, при использовании такого представления сохранение гладкости и непрерывности предполагается до тех пор, пока обратное не утверждается в явном виде.

*1                             б)

Рис. 2.23. Пример, показывающий, что человек в состоянии воспринимать не собственно пересечения нулевого уровня, а лишь те описания, которые им порождаются в необработанном первоначальном эскизе-а — портрет Авраама Линкольна, подвергнутый Л. Д. Хармоном дискретизации и квантованию (никакие сознательные усилия не позволяют нам увидеть изображение Линкольна, если мы только не расфокусируем изображение или как-то не скосим глаза, несмотря на то, что каналы с большими рецептивными полями обеспечивают получение пересечений нулевого уровня, дающих приближенное представление изображения лица Линкольна); б, в, г — пересечения нулевого уровня, полученные с помощью оператора y 2 G с рецептивными полями трех размеров, использованных при обработке изображения на

рис. 2.20.

ми рецептивными полями сообщают Вашему мозгу, Вам приходится прищуриваться или каким-либо иным способом расфокусировать изображение. Только так, например, Вы сможете увидеть изображение Авраама Линкольна на его портрете, подвергнутом Л. Д. Хармоном дискретизации и квантова-

87

e )                                                       ж)

нию (рис. 2.23), и прямые, пересекающие по диагонали шахматную доску (рис. 2.24). Хотя каналы с большими рецептивными полями " видят" эти объекты, как показано на рис. 2.23, то, что они видят, адекватно представляется пересечениями нулевого уровня, получаемыми с помощью каналов с меньшими рецептивными полями. Ситуация, однако, изменяется при удале- 88

Рис 2 24 Вся энергия фурье-спектра изображения шахматной доски (бесконечного размера) приходится на диагонали, а по горизонтали и вертикали она равна нулю Тем не менее можно убедиться в том, что на рис 2 24, а вертикальная, горизонтальная и диагональная организации в равной степени поддаются наблюдения, в то время как на рис 2 24, б диагональные конфигурации выглядят несколько отчетливее остальных. На рис 2 24, в, г и д приведены результаты анализа, основанного на использовании пересечений нулевого уровня, которые получены с помощью операторов V2 G с рецептивными полями, размер которых ^2- D P3196" 12, 24 и 48 пикселам соответственно, исходное изображение состоит из квадратов со стороной, равной 24 пикселам, так что диапазон изменения размера рецептивного поля простирается от половинного до двойного значения длины стороны квадрата В первом столбце приведены результаты использования процедуры свертки Во втором столбце представлены пересечения нулевого уровня, причем значения углов, под которыми эти пересечения происходят, передаются как яркости (положительный и отрицательный контрасты- яркостями светлого и темного тонов) В третьем столбце все пересечения нулевого уровня имеют одинаковые яркости, и наконец, четвертый столбец содержит поперечные сечения результатов процедуры свертки в окрестности контуров пересечений нулевого уровня Рис 2 12, д и е иллюстрирует описания, полученные с помощью каналов с рецептивными полями, соответственно много меньших и много больших размера квадрата изображения шахматной доски; эти описания следует сопоставить с тем изображением шахматных досок (рис 2 24, а и б), которые Вы воспринимаете Обратчте, в частности, внимание на то, что пространственная органи-—, ----- зация изображения на рис 2 24, б воспринимается как диагональная

нии частот средней части спектра в результате обработки портрета Линкольна. После этой операции процессы, обеспечивающие объединение пересечений нулевого уровня, которые соответствуют каналам разного размера, не обнаруживают связей между тем, что " видят" каналы с меньшими рецептивными полями, и тем, что " видят" каналы с большими рецептивными полями. В результате и те и другие порождают непроизводные элементы необработанного первоначального эскиза Именно поэтому, как установили Хармон и Джулес [76], Вы видите изображение Авраама Линкольна за ясно различимыми квадратами, на которые разделено изображение Первоначальный эскиз предполагает, что информация двух различных типов порождается двумя различными физическими явлениями, и в резучьтате мы видим и то и другое

Методологическое отступление

Интересно, что зрительная система придает такое значение этому пространственному, основанному на использовании физических ограничений подходу Она явно не допускает восприятия необработанных пересечений нулевого уровня как таковых Очевидно, требуются еще и дополнительные данные типа совпадения с пересечениями нулевого уровня, соответствующими другому каналу Считается, кроме того, что пересечения нулевого уровня служат исходной информацией для процесса установления соответствия между изображениями стереопары (см. гл. 3). В этом случае также объединяется исходная информация, поступающая по двум кайалам, но относящимся к разным глазам. Аналогичные положения справедливы и для анализа, основанного на избирательности по направлению движения, которое, очевидно, определяется на уровне пересечений нулевого уровня (см. разд. 3.4). Однако

89

и в этом случае, вероятно, возможность их использования зависит от наличия дополнительной информации — на этот раз, когерентности локальных перемещений в поле зрения. Вывод состоит в том, что собственно пересечения нулевого уровня не являются достаточной информацией. Этот вывод имеет решающее значение для данного подхода в целом, а именно: зрительная система старается иметь дело лишь с физически реальными объектами и для построения новых описаний, которые снова допускают физическую интерпретацию, используют правила, в основе которых лежат ограничения, определяемые физической структурой реального мира.

Это означает, что при формулировании теоретических положений необходимо проявлять исключительную тщательность, поскольку, судя по всему, природа была чрезвычайно внимательна и точна в процессе развития зрительной системы человека. В этом отношении очень полезно располагать в качестве основы тремя в явном виде определенными уровнями представления. Сформулировав информационную теорию некоторого процесса, Вы наводите существенный и конструктивный порядок в соответствующей области. После этого исчезает возможность говорить о некотором механизме, как будто бы имеющем нечто общее с исследуемой задачей, утверждая, что этот механизм действует как соответствующий процесс. Теперь требуется точно установить, что именно действует, и быть готовым привести необходимые доказательства. Установление соответствия между изображениями стереопары, например, похоже на множество других процедур, но не идентично ни одной из них. Эта процедура похожа на корреляцию, но не является ею. И если она трактуется как корреляция, то выбранные методы ненадежны. Задача синтеза стереоскопического изображения сводится к установлению соответствия между объектами, имеющими определенные физические прототипы, поскольку законы физики гарантируют возможность нахождения соответствия лишь между такими объектами, которые являются отображениями некоторых реальных физических объектов, занимающих вполне определенное положение в реальном пространстве материального мира. Для пикселов тонового изображения это условие не выполняется, следовательно, использование корреляции по уровням яркости не дает искомого результата.

Аналогичным образом поиск структуры изображения с привлечением представлений, относящихся к нескольким масштабным уровням, проиллюстрированный на рис. 2.7 и рассматриваемый в следующем разделе, имеет сходство с методами фильтрации изображения с помощью различных полосовых фильтров. Кампбелл, например [31], для определения мелких деталей изображения танка, скажем, его регистрационного номера, предложил использовать фильтр верхних часют, а для получения его общих очертаний, свидетельствующих о том, что на изображении действительно имеется танк, — изображение, пропущенное через фильтр нижних частот. В данном случае дело снова обстоит таким образом, что, как и в случаях корреляции по уровням яркости и стерео пейса, эта концепция, основанная на территории фурье-преобразований, выглядит похожей на искомую, но не является ею. Структура реального физического мира не дает нам оснований для заключения, скажем, о том, что изображение, пропущенное через фильтр нижних частот, 90

содержит важную информацию о физической и пространственной организации реального мира на этом масштабном уровне. Шахматная доска, изображенная на рис. 2.24, поможет нам разобраться в том, почему это так. Одна из важных особенностей организации этого изображения заключается в том, что черные и белые квадраты образуют не только строки и столбцы, но и диагонали. Несомненно, использование фильтров, полоса пропускания которых выбрана в низкочастотной области спектра, может дать нам информацию относительно диагональной организации изображения, но отнюдь не о горизонтальной и вертикальной, а механизмы, предназначенные для выделения горизонтальных и вертикальных конфигураций (с помощью введения обобщенных признаков-квадратов и установления характера их группировки), обеспечат также и выделение диагональных конфигураций. Таким образом, подход, основанный на использовании фильтрации, не является ни необходимым, ни достаточным.

Другой пример связан с рисунком " в елочку", который приведен на рис. 2.2. Вертикальная структура, образованная этими полосами, наглядно демонстрирует разновидность пространственной Организации, причем последнюю нельзя выделить методами, основанными на фурье-преобразованиях, поскольку энергия спектра в вертикальном направлении равна нулю. Такая пространственная организация, однако, легко выявляется с помощью методов, реализующих пространственный физический подход; отправной точкой в этом случае служит некоторое представление изменений яркости на исходном изображении, после чего используются процедуры группировки, в которых в качестве основных критериев применяются подобие, пространственная близость и тип конфигураций, которые, требуется получить [145]. Мейхью и Фрисби [164] одними из первых оценили важность этого обстоятельства в экспериментах, по изучению способности человека решать задачи, связанные с различением текстур, и получили дополнительные данные в подтверждение его справедливости. Позже мы еще вернемся к их работе.

И наконец, рассмотрим некоторые данные, свидетельствующие о выявлении на этом этапе концов, и их значение. Я считаю, что сейчас уместно заняться этими данными, поскольку, хотя яркостные переходы, полосы и пятна — это достаточно очевидные объекты, концы имеют существенно более представительный и абстрактный характер. Читателю, таким образом, могут потребоваться дальнейшие доказательства того, что эти объекты действительно порождаются на достаточно низком уровне.

На рис. 2.25 приведено несколько соответствующих примеров. Мы определили конец как некоторое нарушение непрерывности ориентации пересечений нулевого уровня или как точку, в которой заканчивается полоса. На рис. 2.25, а-в представлены примеры случаев, когда концы объединяются и когда трудно предложить метод, позволяющий это установить без определения явно истинных позиций нарушений непрерывности. Еще интереснее рис. 2.25, г [113, рис. 3.6—3], поскольку объекты, соответствие которых устанавливается в этой стереопаре, представляют собой, очевидно, малые разрывы непрерывности в горизонтальных прямых, причем стереоскопичность для этих изображений сохраняется даже в случае мельчайших нарушений непре-

91

г)

Рис, 2.25. Примеры выделения концов: а, б — субъективные контуры, построенные при объединении тех точек, в которых линии обрываются; в — точки нарушения непрерьшности по направлению, образующие прямую; г — концы или нарушения непрерывности небольших Горизонтальных прямых на изображениях, образующих стереопару (сопоставляются, очевидно, в процессе поиска соответствий, что приводит к получению изображения квадрата, обладающего некоторой глубиной) (145]

рывности — менее 20* Таким образом, подобные концы используются не только для стереопсиса (точно так же, как мы субъективно воспринимаем их существование), но, судя по всему, является стандартной практикой даже в тех случаях, когда нарушения непрерывности относятся к диапазону повышенной остроты зрения (меньше размера рецептора сетчатки). Поразительным механизмом является зрительная система человека!


Поделиться:



Последнее изменение этой страницы: 2019-04-09; Просмотров: 59; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.364 с.)
Главная | Случайная страница | Обратная связь