Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
М. М. Лукашевич, Р. Х. СадыховСтр 1 из 6Следующая ⇒
М. М. Лукашевич, Р. Х. Садыхов
ЦИФРОВАЯ ОБРАБОТКА СИГНАЛОВ И ИЗОБРАЖЕНИЙ
Лабораторный практикум для студентов специальности I-40 02 01 «Вычислительные машины, системы и сети» всех форм обучения
Версия 4.0
Минск БГУИР 2013 УДК 621.391(076.5) ББК 32.811.3я73 Л 84
Рецензент: ведущий научный сотрудник ОИПИ НАН Беларуси, канд. техн. наук А.А. Дудкин
Лукашевич, М. М.
УДК 621.391(076.5) ББК 32.811.3я73
Содержание
Общие теоретические сведения Основные взаимосвязи между пикселями изображения Важным свойством дискретных изображений являются их окрестные соотношения, поскольку они определяют связную область. Связная область – множество пикселей, у каждого из которых есть хотя бы один сосед, принадлежащий данному множеству. Пиксель p с координатами (x, y) имеет четыре горизонтальных и вертикальных соседних пикселя с координатами: (x+1, y), (x-1, y), (x, y+1), (x, y-1). Эта группа пикселей, называемая четыре соседа р, обозначается через N4(p) (рис. 3, а ). Четыре диагональных соседних пикселя по отношению к пикселю р имеют координаты (x+1, y+1), (x+1, y-1), (x-1, y+1), (x-1, y-1) и обозначаются через Nд(p). Эти четыре точки вместе с четырьмя указанными выше называются восемь соседей р и обозначаются через N8(p) (рис. 3, б). Некоторые из точек N4(p), Nд(p), N8(p) могут выходить за пределы изображения, если (x, y) находится на границе изображения.
Рис. 3: а – 4-связность; б – 8-связность
В общем случае можно выделить три типа связей пикселей: 1) четырехсвязный. Два пикселя p и q с определенными значениями интенсивности являются четырехсвязными, если q относится к группе N4(p). 2) восьмисвязный. Два пикселя p и q со значениями интенсивности из Q, где Q-ряд значений интенсивности, являются восьмисвязными, если q относится к группе N8(p). 3) m-связный (смешанная связь). Два пикселя p и q со значениями интенсивностей из Q являются m-связными, если: а) q относится к группе N4(p); б) q относится к группе Nд(p) и множество N4(p)∩ N4(q) – пустое. Иными словами, это множество пикселей, являющихся четырьмя соседними как по отношению к p, так и по отношению к q со значениями интенсивности из Q.
Лабораторная работа № 1 ГИСТОГРАММА И ГИСТОГРАММНАЯ ОБРАБОТКА. ПОЭЛЕМЕНТНАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ. ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ
Цель работы: исследование методов «низкоуровневой» обработки изображений. Улучшение качества изображения и преобразование его в форму, наиболее удобную для визуального или машинного анализа. Теоретические сведения Фильтрация изображений Множество подходов к улучшению изображений распадается на две категории: методы обработки в пространственной области (пространственные методы) и методы обработки в частотной области (частотные методы). К пространственной области относится совокупность пикселей, составляющих изображение. Функция предварительной обработки в пространственной области записывается в виде
, (1.11)
где f(x, y) – входное изображение, g(x, y) – выходное (обработанное) изображение, h – оператор функции f, определенный в некоторой области (x, y).
Операции такого вида относятся к общему классу операций над соседними элементами. Эти операции являются основным инструментарием при низкоуровневой обработке изображений или обработке изображений в пространственной области. Основным подходом при определении окрестности точки (x, y) является использование квадратной или прямоугольной области части изображения с центром в точке (x, y). Центр этой части изображения перемещается от пикселя к пикселю начиная, например, с левого верхнего угла. При этом для получения g(x, y) оператор применяется для каждого положения (x, y). Хотя используются иногда и другие формы окрестности (например, круг), квадратные формы более предпочтительны из-за простоты их реализации. Один из наиболее применяемых методов пространственной области основан на использовании фильтров (масок свертки, шаблонов, окон). Обычно маска фильтра представляет собой небольшую (например, размерность 3*3) двумерную систему, коэффициенты которой выбираются таким образом, чтобы обнаружить заданное свойство изображения (рис. 1.5, а).
Рис. 1.5: а – маска фильтра; б – коэффициенты маски фильтра
Если величины w1, w2, …, w9 представляют собой коэффициенты, маски пикселя (x, y) и его восьми соседей (рис.1.5, б), то алгоритм можно представить как выполнение следующей операции на окрестности 3*3 точки (x, y):
1.12
Под задачей фильтрации изображений в широком смысле понимают любые процедуры обработки изображений, при которых на вход процедуры подается растровое изображение и на выходе формируется растровое изображение. Однако чаще под «фильтрацией» понимают так называемую помеховую фильтрацию. Главная цель помеховой фильтрации заключается в такой обработке изображений, при которой результат оказывается более подходящим с точки зрения конкретного применения. В общем случае можно выделить линейные фильтры (сглаживающие фильтры, контрастоповышающие фильтры, разностные фильтры) и нелинейные фильтры (медианный фильтр). Приведем краткое описание наиболее распространенных методов фильтрации.
Низкочастотный фильтр – ослабляет высокочастотные компоненты и усиливает роль низкочастотных. Частота в применении к изображениям отражает количество имеющихся в изображении деталей. Резкие перепады яркости, помехи и шумы являются примером высокочастотных элементов в изображении. Сглаживание изображения реализуется с помощью следующих ядер:
Высокочастотный фильтр – ослабляет низкочастотные компоненты в изображении и усиливает роль высокочастотных. Фильтры высокой частоты применяются для выделения таких деталей, как контуры, границы или для повышения резкости изображения. Каждый скачок яркости и каждый контур представляют собой интенсивные детали, связанные с повышенными частотами. Выделение высокочастотных компонент осуществляется с помощью следующих ядер:
Оператор Робертса. Оператор Робертса является примером нелинейного фильтра. Преобразование каждого пикселя перекрёстным оператором Робертса может показать производную изображения вдоль ненулевой диагонали, и комбинация этих преобразованных изображений может также рассматриваться как градиент от двух верхних пикселов к двум нижним. Оператор Робертса используется ради быстроты вычислений, но проигрывает в сравнении с альтернативами из-за значительной проблемы чувствительности к шуму. Он даёт линии тоньше, чем другие методы выделения границ. В обработке участвуют четыре пикселя, расположенные следующим образом (рис. 1.6).
Рис. 1.6. Пиксели, участвующие в обработке оператором Робертса
Отклик оператора Робертса:
. (1.15)
Ядра свертки в данном случае будут выглядеть таким образом:
Свертка для каждого ядра вычисляется отдельно. В качестве отклика данного фильтра выступает величина
, (1.17)
где P и Q – отклик ядер H1 и H2.
Иногда в качестве оператора Робертса берется величина .
Оператор Собеля. Оператор Собеля применяют в алгоритмах выделения границ. Это дискретный дифференциальный оператор, вычисляющий приближенное значение градиента яркости изображения. Результатом применения оператора Собеля в каждой точке изображения является либо вектор градиента яркости в этой точке, либо его норма. Метод усиления края с помощью оператора Собеля рассматривает два различных ядра свертки:
Исходя из этих сверток вычисляется величина и направление краев. Свертка для каждого ядра вычисляется отдельно. В качестве отклика данного фильтра выступает величина
, (1.19)
где P и Q – отклик ядер H1 и H2.
Иногда в качестве оператора Собеля берется величина .
Оператор Превитта. Аналогично оператору Собеля действует оператор Превитта. Детектор границ Превитта является подходящим способом для оценки величины и ориентации границы. В то время как детектор с дифференциальным градиентом нуждается в трудоёмком вычислении оценки ориентации по величинам в вертикальном и горизонтальном направлениях, детектор границ Превитта даёт направление прямо из ядра с максимальным результатом. Метод усиления края с помощью оператора Превитта рассматривает два различных ядра свертки:
Результат работы оператора Превитта есть
, (1.21)
где P и Q – отклик ядер H1 и H2.
Оператор Лапласа. Дискретный оператор Лапласа часто используется в обработке изображений, например в задаче выделения границ или в приложениях оценки движения. Дискретный лапласиан определяется как сумма вторых производных и вычисляется как сумма перепадов на соседях центрального пикселя. Метод усиления края по Лапласу рассматривает целый ряд различных ядер свертки. Приведем некоторые их них:
Как видно, сумма элементов матриц равна нулю, поэтому отклик фильтра может быть отрицательным. В этом случае значение отклика берется по модулю. В результате обработки области с постоянной или линейно возрастающей интенсивностью становятся черными, а области быстро изменяющихся значений интенсивности ярко высвечиваются. Ниже приведем некоторые пространственные процессы, которые не подпадают под категорию свертки и могут применяться для устранения различного вида шума.
Фильтр «гармоническое среднее». Гармоническое среднее ряда вычисляется по формуле
. (1.23)
В процессе фильтрации значение текущего пикселя изображения заменяется на множества значений девяти пикселей, включая текущий и соседние.
Min – фильтр. В процессе фильтрации значение текущего пикселя заменяется на минимальное значение соседних пикселей. Так, например, для ядра размерности 3 будем иметь:
Max – фильтр. В процессе фильтрации значение текущего пикселя заменяется на максимальное значение соседних пикселей (по аналогии с предыдущим фильтром).
Min-Max–фильтр. В процессе фильтрации значение текущего пикселя изображения сначала заменяется на минимальное значение соседних пикселей, а при повторном проходе на максимальное.
Медианный фильтр. Усредненное фильтрование использует значения элементов, содержащихся в области примыкания, для определения нового значения. Фильтр располагает элементы области примыкания в отсортированном порядке и отбирает среднее значение. Так, например, для ядра размерности 3 медианное значение будет пятым:
С помощью методов пространственной обработки изображений можно получить ряд интересных эффектов. Приведем некоторые из них.
Эффект тиснения. С помощью операции свертки можно реализовать преобразование, дающее эффект тиснения на изображении.
(1.24)
Бинарное «псевдополутоновое» изображение. Исходное изображение обрабатывается при помощи маски D2 или D4: если значение пикселя меньше пропорционального значения соответствующего ему элемента маски, то он обнуляется, иначе ему присваивается 255. Маска накладывается на изображение без перекрытия. Маски D2 и D4:
При использовании пространственных процессов могут возникнуть следующие вопросы, связанные с особенностями обработки пикселей: 1. Устранение краевых эффектов; 2. Значение отклика выходит за пределы [0, …, 255].
Для первого вопроса возможны следующие пути решения: · Исключить из преобразования граничные пиксели изображения в этом случае выходное изображение будет иметь меньшие размеры, либо закрасить граничные пиксели, например черным цветом; · Не включать соответствующий пиксель в суммирование, равномерно распределив его вес среди других пикселей окрестности; · Дополнить (достроить) исходное изображение, добавив необходимое количество пикселей по границе. Количество достраиваемых строки столбцов, как правило, зависит от размера ядра. Здесь возможны два варианта: o Доопределить значения пикселей за границами изображения при помощи экстраполяции. Например, считать постоянным значение интенсивности вблизи границы или считать постоянным градиент интенсивности вблизи границы; o Доопределить значения пикселей за границами изображения при помощи зеркального отражения.
Для решения проблем, связанных с выходом значения за пределы [0, …, 255], возможны следующие действия: · Масштабировать полученные значения при положительных откликах фильтра; · При отрицательном отклике фильтра брать либо абсолютное значение (по модулю), либо приводить к нулю.
Также в данном разделе стоит привести возможную «классификацию» шума на изображении: 1. Шум «соль и перец» – случайные белые и черные пиксели; 2. Импульсный шум – случайные белые пиксели; 3. Гауссов шум – колебания интенсивности, распределенные по нормальному закону.
Задание для лабораторной работы ЧАСТЬ 1 Написать программу, выполняющую следующие операции над изображениями (обязательна обработка как цветных, так и полутоновых изображений): 1. Загрузить и отобразить изображение на экране. Реализовать возможность сохранения и вывода на экран обработанного изображения. 2. Вывести гистограмму яркости изображения. 3. Выполнить поэлементную обработку изображения в соответствии с вариантом, выданным преподавателем. Вывести гистограмму яркости обработанного изображения. 4. Выполнить фильтрацию изображения (либо иной пространственный процесс) в соответствии с вариантом, выданным преподавателем. Вывести гистограмму яркости обработанного изображения. ЧАСТЬ 2 Выбрать одну из своих фотографий (изображение студента на данной фотографии приветствуетсяJ), которая требует определенной обработки (например, изменения контраста, яркости и т.д.), выполнить данную обработку. Показать преподавателю исходную фотографию, результат, обосновать необходимость определенной обработки, пояснить алгоритм. Можно использовать один из алгоритмов, приведенный в методичке, либо иной, но в рамках тематики лабораторной работы.
Примечание: Варианты для выполнения лабораторной работы выдается преподавателем. Варианты поэлементной обработки и фильтрации (либо иного пространственного процесса) могут не совпадать.
Рекомендуемая литература Яне, Б. Цифровая обработка изображений / Б. Янс. – М.: Техносфера, 2007.
Контрольные вопросы 1. Гистограммный анализ. Построение гистограммы яркости изображения. 2. Поэлементная обработка изображения: a. Линейное контрастирование; b. Нелинейное контрастирование; c. Препарирование изображения. 3. Фильтрация изображения: методы пространственной области, основанные на использовании фильтров (масок свертки, шаблонов, окон). 4. Пространственные процессы, не подпадающие под категорию свертки. 5. Пути устранения краевых эффектов в процессе пространственной обработки изображений. 6. Классификация «шума» на изображении. Лабораторная работа № 2 КЛАСТЕРНЫЙ АНАЛИЗ В РАСПОЗНАВАНИИ ОБРАЗОВ Цель работы: ознакомиться с интерпретацией многомерных образов в виде кластеров. Освоить статистическое описание образов в многомерном пространстве признаков. Исследовать особенности распознавания образов с использованием различных метрик. Теоретические сведения Выделение связных областей Есть два метода выделения связных областей: · Рекурсивный алгоритм · Итеративный метод (алгоритм последовательного сканирования) Допустим, мы имеем черно-белое изображение. Таковым будем называть изображение, состоящее из точек только двух цветов: цвета фона и цвета объектов. Чаще всего обозначают 0 – фоновый цвет, 1 –цвет объекта. В таком случае выделенные области всегда будут одинаковыми при неизменном типе связности (4- или 8- связном). Рекурсивный алгоритм
Вычисление признаков Геометрические признаки Каждый физический объект обладает набором некоторых свойств, которые позволяют отличить его от других объектов (рис. 2.1).
Рис. 2.1. Различные объекты
Совокупность свойств, описывающих конкретный объект, называется образом данного объекта. Под классом объектов понимается некоторая совокупность образов, называемых элементами класса, обладающая рядом близких свойств. Измеряемые или вычисляемые свойства объектов, позволяющие отличить классы друг от друга, называются признаками. Так на изображении объекты (области) можно отличить, используя следующие признаки: 1. Текстурные признаки; 2. Геометрические признаки; 3. Фотометрические признаки и др. Для каждой области можно подсчитать некий набор простейших числовых характеристик: · Площадь; · Центр масс; · Периметр; · Компактность; · Ориентацию главной оси инерции; · Удлиненность (эксцентриситет). На основе этих характеристик можно классифицировать получаемые объекты (области).
· Площадь – количество пикселей в области (рис. 2.2).
Рис. 2.2. Площадь объекта
. (2.1)
· Центр масс
, . (2.2)
· Периметр – количество пикселей, принадлежащих границе области (рис. 2.3).
Рис. 2.3. Периметр объекта
Периметр зависит от того, какую связность (4-х или 8-ми) используют при определении соседей. Также отличают внутреннюю и внешнюю границу объекта (рис. 2.4). 1. Пиксель лежит на границе области, если он сам принадлежит области, а хотя бы один из его соседей области не принадлежит (внутренняя граница). 2. Пиксель лежит на границе области, если он сам не принадлежит области, а хотя бы один из его соседей области принадлежит (внешняя граница).
Рис. 2.4. Граница объекта
Для распознавания, как правило, интересуют признаки, инвариантные к изменениям масштаба, переносу и повороту. Такими признаками являются удлиненность и компактность.
· Компактность – отношение квадрата периметра к площади (рис. 2.5):
. (2.3)
Наиболее компактная фигура – круг: π.
Рис. 2.5. Компактность фигуры
Дискретный центральный момент области определяется следующим образом: , (2.4) где – центр масс области.
· Удлиненность, нецентрированность (компактность) (рис. 2.6):
. (2.5)
Рис. 2.6. Удлиненность фигуры
· Ориентация главной оси инерции не является инвариантной к повороту, но в ряде случаев предоставляет полезную информацию об ориентации объекта (рис. 2.7):
. (2.6)
Рис. 2.7. Ориентация главной оси инерции объекта
Фотометрические признаки Для каждой области можно подсчитать некий набор простейших числовых характеристик: · Средняя яркость; · Средний цвет (для цветного изображения); · Гистограмма распределения яркостей (или для цветного изображения три гистограммы R, G, B); · Дисперсия (разброс) яркости или цвета.
Кластерный анализ Пусть число признаков равно n, тогда каждый образ можно представить в виде некоторого набора значений признаков или вектора признаков вида:
, (2.7)
где – значение i-го признака данного образа.
В многомерном пространстве, осями координат которого являются отдельные признаки, каждый образ определяется точкой, причем расстояние от этой точки до начала координат и расстояние между точками определяется выбранной метрикой. Каждый класс может характеризоваться некоторой областью в n-мерном пространстве признаков. Эта область определяется степенью отличия образов, относящихся к данному классу, и может задаваться границами, например плоскостями. Область, в которую с наибольшей вероятностью попадают векторы образов данного класса, обычно называют кластером, а процедуру разбиения пространства признаков на области, соответствующие разным классам, – кластеризацией совокупности образов. Если образы, относящиеся к одному классу, имеют различные значения признаков, то для описания класса можно использовать статистические характеристики: вектор средних значений или вектор математических ожиданий по всем признакам и вектор среднеквадратичных отклонений или дисперсий признаков. Для многомерных векторов принято использовать матрицу ковариации, на диагонали которой находятся дисперсии соответствующих признаков. Статистические характеристики признаков класса вычисляются следующим образом. Пусть набор n-мерных векторов, полученных в результате предъявления распознающей системе m объектов, относящихся к одному классу, задан в виде таблицы
тогда
m=(µ1, µ2, …, µn): µi . (2.9)
(2.10)
где i, j =1, …, n – индексы номеров компонент вектора признаков; m – число образов, составляющих данный класс; – значение i-го признака k-го образа; µi - математическое ожидание i-ой компоненты вектора признаков; – дисперсия i-го признака; - коэффициент ковариации i-го и j-го признаков; m – вектор математических ожиданий; Cov – ковариационная матрица. Ковариационная матрица симметрична относительно главной диагонали и, следовательно, необходимо вычислять только половину ее элементов. Ковариация характеризует степень линейной зависимости случайных величин. Если ковариация равна нулю, то величины называются некоррелированными. Таким образом, процесс распознавания включает в себя этап обучения, т.е. определения некоторых характеристик по обучающей репрезентативной выборке образов, отнесенных к известным классам, и собственно распознавание на основе информации, полученной при обучении. Под распознаванием образа понимается отнесение его к тому классу, расстояние до которого от данного образа в пространстве признаков минимально. Для определения расстояния между точками в метрическом пространстве признаков ранее было введено понятие метрики. Методы распознавания можно разделить на две группы. К первой группе относятся методы, основанные на последовательном вычислении расстояний между распознаваемым образом и центрами кластеров в пространстве признаков с той или иной метрикой, например Евклидово расстояние. Образ считается принадлежащим классу, расстояние до которого минимально. Другая группа методов предполагает предварительное разбиение признакового пространства плоскостями или поверхностями более высокого порядка на области, соответствующие известным классам, и определение принадлежности распознаваемого образа одной из областей. Выбор конкретного метода зависит от решаемой задачи. Существует около 100 разных алгоритмов кластеризации, однако чаще используется иерархический кластерный анализ и кластеризация методом k-средних (k-means). Задание для лабораторной работы 1. При необходимости выполнить коррекцию яркости изображения (см. лаб. работу №1). 2. Перевести цветное изображение в бинарное изображение (см. лаб. работу №1). 3. Реализовать пороговую бинаризацию изображения (см. лаб. работу №1). 4. Выделить связные области на изображении (рекурсивный алгоритм или алгоритм последовательного сканирования). 5. Определить свойства объектов, вычислить систему признаков для объектов, представленных на изображении (площадь, периметр, компактность, вытянутость, статистические моменты). Вычисление всех признаков обязательно. Проанализировать, какие из признаков являются наиболее информативными. 6. Используя алгоритм k-means, k-medians либо k-medoids, определить принадлежность объекта к одному из кластеров (классов). Реализация данного алгоритма обязательна.
Тестовые базы: 1. Преподавателем будет выдана тестовая база, в которой будут два класса изображений. 2. По желанию студент может реализовать данный алгоритм для своих изображений.
Рис. 2.6. Примеры тестовых изображений
Контрольные вопросы 1. Геометрические признаки при описании объектов. 2. Фотометрические признаки при описании объектов. 3. Кластерный анализ. 4. Алгоритм k-means. 5. Алгоритм k-medians. 6. Алгоритм k-medoids.
Литература 1. Яне, Б. Цифровая обработка изображений / Б. Яне. – М.: Техносфера, 2007. 2. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. – М.: Техносфера, 2006. 3. Дуда, Р. Распознавание образов и анализ сцен / Р. Дуда, П. Харт. – М.: Мир, 1976. 4. Павлидис, Т. Алгоритмы машинной графики и обработки изображений / Т. Павлидис. – М.: Радио и связь, 1986. 5. Прэтт, У. Цифровая обработка изображений. В 2 т. / У. Прэтт. – М.: Мир, 1982.
Св. план 2010, поз. 56
Учебное издание
Лукашевич Марина Михайловна Садыхов Рауф Хосровович
М. М. Лукашевич, Р. Х. Садыхов
Популярное: |
Последнее изменение этой страницы: 2017-03-11; Просмотров: 795; Нарушение авторского права страницы