Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Следствия, касающиеся измерений на трехцветных изображениях



Согласно физиологическим' данным некоторые оппонентные цветочувствительные клетки сетчатки обезьяны обладают рецептивными полями " комбинированного" характера, например с красночувствительной центральной часхыо и зеленочувствительной периферией [67, 1701 - Q ^я по всему, нет оснований для того, чтобы оспаривать собственно эти данные, однако мне в принципе очень трудно представить существование подобных нервных клеток и включить их в V2 G-схему, развитую нами в гл. 2.

Дело в том, что нервная клетка, обладающая таким рецептивным полем (пример подобного рецептивного поля для удобства приведен на рис. 3.85, а), воспроизводит сложную комбинацию пространственной и цветовой информации. Ее выходом не служит ни собственно результат v2 G-процедуры для одного цветового канала (как это имеет место в случае, представленном на рис. 3.85, б, где рецептивное поле реализует V2 G-npo-цедуру для красного канала), ни чисто цветовая информация, характеризующая соотношение значений сигналов, получаемых по двум каналам для одной точки изображения, как это происходит в случае рецептивного поля, представленного на рис. 3.85, е. В сущности, на рис. 3.85, в представлен даже не оператор, реализующий метод нулевого среднего: выходной сигнал не похож на вторую производную, а его пересечения нулевого уровня бессмысленны. При использовании такого рецептивного поля необходимо особое внимание обращать на изменения значений выходного сигнала. Так, например, если подобному рецептивному полю с зеленочувствительной центральной частью и красно-чувствительной периферийной частью предъявляется лужайка, то разряд будет происходить по всей лужайке, причем несколько более интенсивным он будет в наиболее насыщенных зеленых участках. Мне кажется, что такой способ плох не только с чисто " технической" точки зрения, но и противоречит нашему опыту в той части, что в нервной системе обычно кодируются не собственно абсолютные значения, а их изменения. Другими словами, этот способ является нарушением второго принципа Барлоу [9], предусматривающего экономичное кодирование информации, содержащейся в раздражителях в нервной системе.

Для того чтобы сформулировать разумное предположение относительно того, какую информацию воспроизводят эти нервные клетки, мне кажется целесообразным объединить соображения двух типов. Во-первых, следует учесть, что для использования анализа, основанного на V2 G-преобразовании, требуется идентичность спектральных характеристик центральной и периферийной частей рецептивного поля, за исключением того, что их знаки должны быть противоположны. Это необходимо для того, чтобы имело смысл использовать пересечения нулевого уровня.

268

Рис. 3.85. Возможные варианты организации цветовых рецептивных полей. Предполагается, что пространственная организация полей соответствует разности двух гауссовских

распределений: а — так называемое красно-зеленочувствительное оппонентное рецептивное поле; б — рецептивное поле с красночувствительной центральной частью и красночувствительной периферийной частью; в — красно-зеленочувгтвнтельное оппонентное рецептивное поле с идентичными пространственными распределениями для обоих цветов; г — рецептивное поле, воспринимающее только яркость (сумму красного и зеленого сигналов); д — рецептивное поле, воспринимающее только разность цветов (разность красного и зеленого сигналов); е — двухмерное рецептивное поле, организация которого соответствует представленной на рис. 3.85, г; ж — двухмерное рецептивное поле, организация которого соответствует представленной на рис. 3.85, д. (Обозначения- R —красный, G — зеленый.)

Во-вторых, следует воспользоваться идеей разделения обработки информации о светлоте и яркости и информации о цвете. Яркостные границы точно соответствуют изменениям суммы сигналов, поступающих по красному и зеленому каналам (мы можем записать ее как ( R + G ) ). Для обнаружения этих границ следует применить к суммарному сигналу оператор V 2 G, как это показано на рис. 3.85, г. Кроме того, согласно гипотезе, выдвинутой нами в предыдущем разделе, для обнаружения цветовых изменений следует выделять относительные количественные изменения красного и зеленого цвета. Это может быть осуществлено с помощью применения V2 G-процедуры к разности красного и зеленого сигналов (R - С), как это показано на рис. 3.85, д.

Нервная клетка первого типа, рецептивное поле которой приведено на рис. 3.85, е, обладает не очень высокой цветочувствительностью, поскольку раздражителем, вызывающим максимальный ответ, для нее служит белое пятно, расположенное в центре, а заторможена эта клетка может быть с помощью любой комбинации красного и зеленого

269

раздражителей в центральной и периферийной частях рецептивного поля. Единственным требованием при этом является уравновешенность эффективных яркостей.

Второй тип клетки обладает совершенно иными свойствами. Для нее оптимальным раздражителем служит красное в центральной части рецептивного поля в сочетании с зеленым в его периферийной части, и, следовательно, эта клетка принимает облик оппо-нентной цветочувствительной клетки. Такая клетка наилучшим образом будет отвечать на изменения цвета и не будет давать вообще никакого ответа на предъявление чисто белого пятна в центре рецептивного поля при условии, что красная и зеленая составляющие сбалансированы в белом цвете должным образом. Такая клетка будет отвечать на появление цветовых границ и не будет отвечать на появление никаких иных границ. Для того чтобы такая клетка не реагировала на небелые границы светлоты (например, на границу между двумя красными участками, различающимися лишь долями, но не качеством отражаемого ими света), величины R и G должны выражаться в логарифмических единицах. Эта клетка, таким образом, будет действовать как детектор чисто цветовых изменений. Отметим также, что и операторы V 2 G нечувствительны к линейным градиентам.

Резюме

Итак, изложенный подход основывается на отделении яркости от светлоты и цвета, за которым следует разделение оценивания светлоты (доли отражаемого света в среднем) и цвета (спектрального распределения). Локальные изменения можно определять по пересечениям нулевого уровня на свет-лотном изображении ( R + G ) и цветовом изображении (используя ( R - G ) и (В - G ), где В — синий цвет).

Основные нейрофизиологические выводы, следующие из этого, состоят в том, что ни в каких рецептивных полях не должны объединяться цветовые и пространственные изменения, как это показано на рис. 3.85, а; наоборот, должны существовать рецептивные поля типов, представленных на рис. 3.85, г (для восприятия изменений светлоты и яркости) и на рис. 3.85, д (для восприятия цветовых изменений). Отрезки пересечений нулевого уровня могут З'ттем выделяться аналогичным образом по результатам измерений обоих т4Пов, что дает возможность определять яркостные контуры по данным первого типа и контуры цветовых переходов по данным второго типа.

ЗЛО. ЗАКЛЮЧЕНИЕ

В данной главе мы познакомились с некоторыми из поразительно разнообразных способов кодирования в изображениях информации о поверхностях и рассмотрели, каким образом такую информацию можно реально извлекать из изображений (насколько это сегодня представляется возможным). Как мы в настоящее время полагаем, в различных процессах, обеспечивающих восстановление информации о поверхностях по изображениям, используются различные представления исходных данных. Простейшие из этих процессов (например, процесс, основанный на принципе избирательности по направлению) используют в качестве представления исходной информации пересечения нулевого уровня, а для более сложных (например, оперирующих текстурой поверхности), возможно, требуются самые сложные варианты полного первоначального эскиза. Итоги нашего обсуждения подведены в табл. 3.2.

270

Таблица 3.2. Процессы, механизмы и объекты, обеспечивающие получение информации о поверхности иа основе информации, содержащейся в изображении, и возможные представления исходной информации, используемые ими

Процесс, механизм, лежащий в его

Возможное представление исходной информации

основе, или объект анализа

 

Стереопсис

Главным образом ПНУ с учетом движения глаз,

 

причем в качестве вспомогательного средства ис-

 

пользуется ППЭ

Избирательность по направлению

ПНУ

Восстановление структуры по

ППЭ для установления соответствий; при рас-

движению

смотрении более тонких характеристик, возмож-

 

но, только НПЭ

Оптический поток

ППЭ (? ) (если этот процесс вообще использу-

 

ется)

Ограничивающие контуры

НПЭ, КГ

Другие граничные признаки

НПЭ

Контуры ориентации поверхности

НПЭ, КГ

Контуры поверхности

НПЭ, КО, СХОИ

Текстура поверхности

НПН, СХОИ

Контуры текстуры

КГ

Затенение

КО, НПЭ (возможно, и другие)

Примечание. КГ — контуры границы, полученные с помощью процессов разделения и нелинейного укрупнения характерных объектов изображения; ППЭ — полный первоначальный эскиз = НПЭ + СХОИ + КО + КГ; СХОИ — сгруппированные характерные объекты изображения, полученные в результате применения процесса объединения к полному первоначальному эскизу; КО — ко> уры освещенности (тени, блики и источники света); НПЭ — необработанный первоначальный эскиз (яркостные переходы, пятна, тонкие полосы, нарушения непрерывности и концы); ПНУ - пересечения нулевого уровня, нарушения непрерывности и концы.

Другой интересной особенностью этих процессов, помимо того, что все они используют несколько отличающиеся друг от друга представления исходной информации, является то, что для их благополучного функционирования необходимо введение несколько отличающихся друг от друга допущений о внешнем мире. Как мы имели возможность убедиться, при использовании информации, содержащейся лишь в изображении, структура поверхности всегда оказывается существенно недоопределенной и искусство задания соответствующего процесса заключается именно в точном указании того, какую именно дополнительную информацию можно безболезненно привлечь в форме допущений о свойствах внешнего мира; это и порождает достаточно сильные ограничения, необходимые для успешного функционирования процесса (скажем, условия единственности и непрерывности в стереопсисе, требование жесткости при анализе движения и т.д.). Значительная доля искусства, требующегося для определения таких процессов, необходима для того, чтобы точно и правильно сформулировать эти дополнительные ограничения.

271

Таблица 3.3. Примеры вспомогательны* допущений, неявно используемых в процессах, обеспечивающих извлечение информации о поверхностях из изображений

Процесс, механизм, лежащий в его основе, объект анализа или представление

Неявные допущения

Необработанный первоначальный

эскиз

Полный первоначальный эскиз

Стереопсис

Избирательность по направлению Восстановление структуры по движению Оптический поток

Ограничивающие контуры Контуры поверхности

Текстура поверхности

Яркость и цвет Флуоресценция

Допущение о совпадении в пространстве

Различные допущения относительно пространственной организации функций отражения Условие единственности; условие непрерывности Условие непрерывности направления потока Допущение, предполагающее жесткость обектов наблюдения

Допущение, предполагающее жесткость объектов наблюдения Гладкие и плоские источники контуров

Локальная цилиндричность поверхности; плоские источники контуров

Равномерное распределение и равенство размеров элементов поверхности

Надежность только локальных сравнений

Постоянный источник света

В нашем обзоре речь шла и о процессах, которые мне кажутся определенными удачно, и о процессах, остающихся загадочными и довольно плохо определенными. Основные допущения, использование которых предполагается в отдельных процессах, сведены в табл. 3.3, но читатель должен иметь в виду, что лишь немногие из них очевидны. Эту таблицу, следовательно, надо рассматривать, скорее, как некоторый указатель, позволяющий ориентироваться в современных представлениях, чем как перечень точных формулировок, указывающих, что именно дает этим процессам возможность функционировать.

И наконец, еще несколько слов относительно стратегии исследований в данной области. Как мы видели, наблюдается поразительная разница в том, с какой ясностью и точностью мы в состоянии определять различные процессы. Некоторые из них, подобно стереопсису, восстановлению структуры по движению и избирательности по направлению, отличаются простотой и четкостью, в то время как другие, подобно зрительному восприятию текстур и анализу контуров поверхности, по-видимому, запутаны в силу своей природы. Это положение не объясняется тем, что процессы первого типа требуют для понимания меньших интеллектуальных затрат — в целом это не-так. Скажем, математический аппарат, используемый в связи с процессами стереопсиса или восстановления структуры по движению, не столь прост, как аппарат, связанный со зрительным восприятием текстур. Аналитические трудности возника-272

ют, скорее, при попытках установить, какие допущения о внешнем мире можно безболезненно вводить, чтобы облегчить процесс интерпретации изображений этого внешнего мира. В тех случаях, когда это удается сделать аккуратно, более или менее на основе изучения реального мира, в целом оказывается возможным построить хорошую теорию. В тех же случаях, когда этого сделать не удается, по моему мнению, не следует надеяться на достижение

должного понимания этих процессов, до тех пор пока не будут обнаружены какие-то иные средства устанавливать, какие допущения о внешнем мире можно вводить безболезненно, а какие — нельзя, а также не будет разрешен связанный с этой проблемой вопрос о надежности различных разновидностей информации.

В конечном счете все эти проблемы носят эмпирический характер и относятся не столько к зрительной системе человека (хотя ответы на них должны быть отражены в структуре ее конструкции), сколько к статистической структуре видимого мира. Я думаю, что с этим придется согласиться, если, пытаясь разрешить эти проблемы, занять несколько более " техническую" позицию. По мере того как наши знания о способах реализации этих процессов предварительной обработки информации будут расти, мы будем создавать

быстродействующие устройства, на которых эти процессы будут реализовы-ваться в истинном масштабе времени, и получим возможность таким достаточно прямым способом получать более точные сведения о том, какие приемы практически оправданны, а какие — нет. Изучение зрения представляет собой комбинацию изучения процессов и изучения внешнего мира, проводимых с таких довольно специфических позиций. Нечто в этом роде уже с очень давних пор делает естественная эволюция.

Первым шагом должно стать построение некой единой системы, в которой были бы использованы все те процессы, которые в настоящее время нам понятны, однако очень многое еще предстоит сделать, до того как приступить к попыткам достижения даже такой ограниченной цели. Прежде всего реализация процессов типа построения необработанного первоначального эскиза требует значительных вычислительных возможностей. Даже наиболее быстродействующие универсальные вычислительные машины работают на несколько порядков медленнее, чем требуется для воспроизведения зрения в истинном масштабе времени. И хотя развивающиеся сейчас технологии изготовления сверхбольших интегральных схем в конечном счете позволят использовать необходимые для этого вычислительные мощности, соответствующие датчики и технология в настоящее время отсутствуют, и такое положение будет сохраняться еще в течение некоторого времени. Кроме того, естественно, остается еще одна проблема: что делать с информацией, появляющейся на выходе некоторого устройства, позволяющего реализовывать процессы, подобные описанным в данной главе. Именно этой проблемой мы сейчас и займемся.

273

ГЛАВА 4


Поделиться:



Последнее изменение этой страницы: 2019-04-09; Просмотров: 53; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.03 с.)
Главная | Случайная страница | Обратная связь