Принципы кодирования изображений

⇐ ПредыдущаяСтр 4 из 6Следующая ⇒

При преобразовании цветового ТВ-сигнала из аналоговой в цифровую форму согласно рекомендации МСЭ-Р (Международного Союза Электросвязи) используются частоты дискретизации и формируются цифровые потоки, приведенные в табл.10.1.

Таблица 10.1.

Некоторые основные показатели при кодировании ТВ-сигнала

Компоненты и пара- метры сигнала	Обозначения	Частоты дискретизации и скорости передачи
Сигнал яркости	Y	13, 5 МГц (8 бит× 13, 5= 108 Мбит/с)
Цветоразностный сигнал R – Y	CR	6, 75 МГц (8 бит× 6, 75 = 54 Мбит/с)
Цветоразностный сигнал B- Y	CB	6, 75 МГц (8 бит× 6, 75 = 54 Мбит/с)
Полное число отсчётов в секунду	S	13, 5 + 6, 75 + 6, 75 = =27 М-отсчётов/с
Требуемая полоса частот канала	B_N	135 МГц

Эти данные показывают, что в результате аналогово-цифрового преобразования цветового ТВ-сигнала результирующие потоки битов и требуемые для их передачи полосы частот очень велики, и потому требуется сокращение избыточности (сжатие сигнала). Общепринятым методом сжатия в настоящее время являются алгоритмы стандарта МРЕG-2, позволяющие снизить скорость передачи кодированного сигнала до 5 ÷ 10 Мбит/с.

Структурная схема кодирующего устройства показана на рис.10.13.

Рис.10.13. Структурная схема кодера изображений

В кодере MPEG-2 вначале обрабатываются фрагменты изображения (блоки) размером 8 × 8 пикселей, несущие информацию о яркости или цветности. Яркостные блоки объединяются в макроблоки, состоящие из четырёх блоков и имеющих размер 16 × 16 пикселей. Если с каждым макроблоком связаны по одному блоку цветоразностных сигналов (СR и СB), то такой формат цветовой дискретизации обозначается 4: 2: 0. Если же число цветовых блоков равно четырём (по два блока для каждого из цветоразностных сигналов СR и СB), то имеет место формат цветовой дискретизации 4: 2: 2. Смежные макроблоки группируются вместе и образуют слайс (вырезку из данных массива).

Первичной кодированной единицей изображения является кадр, состоящий из группы слайсов, составляющих активную область изображения. Для сокращения пространственной избыточности в пределах одного кадра при кодировании создаётся I -кадр, содержащий всю информацию, необходимую для декодирования изображения. В случае сбоя в работе или помех в канале передачи I -кадры позволяют возобновить процесс правильного декодирования. Для повышения степени сжатия I -кадры передаются примерно один раз в 12 кадров. В остальное время передаются Р-кадры и В -кадры, значения которых предсказуемы: для Р -кадров – исходя из значений, предшествующих I- и Р -кадров, а для В -кадров – исходя из значений предшествующих и последующих I-кадров и P-кадров.

Чтобы декодер мог правильно восстановить информацию, требуется передавать также дополнительную служебную информацию. Для этого каждый кадр снабжается заголовком, а ряд взаимосвязанных I-, Р- и В-кадров объединяется в группу кадров (GOP), которая также снабжается заголовком. Полученная структура данных называется элементарным потоком данных. В последовательности GОР вначале следуют I- и Р-кадры, а затем В-кадры (рис.10.12), которые реконструируются декодером из ранее принятых I- и Р-кадров. Поскольку последовательность передачи кадров не совпадает с последовательностью их воспроизведения, то на уровне пакетированного элементарного потока добавляются временные метки декодирования (DTS) и представления (PTS), которые несут информацию о необходимых моментах времени декодирования и отображения кадров.

Таким образом, в процессе кодирования создаётся сложная шестиуровневая иерархическая структура: блок – макроблок – слайс – кадр – группа кадров – последовательность кадров (рис.10.13).

Рис.10.13. Иерархическая структура кодирования МРЕG-2

10.6. Компенсация движения и дискретно-косинусное преобразование

Эффективное сжатие видеоинформации основано на двух основных идеях: подавление несущественных для визуального восприятия мелких деталей пространственного распределения отдельных кадров и устранения временной избыточности в последовательности этих кадров. Соответственно говорят о пространственной и временной компрессии.

Пространственная компрессия использует экспериментально установленную малую чувствительность человеческого восприятия к искажениям мелких деталей изображения. Глаз быстрее замечает неоднородность равномерного фона, чем искривление тонкой границы или изменение яркости и цвета малого участка. Из математики известно два эквивалентных представления изображения: привычное человеку пространственное распределение яркости и цвета и так называемое частотное распределение, связанное с пространственным дискретно-косинусным преобразованием (ДКП). Теоретически они равнозначны и обратимы, но сохраняют информацию о структуре изображения совершенно по-разному: передачу плавных изменений фона обеспечивают низкочастотные (центральные) значения частотного распределения, а за мелкие детали пространственного распределения «отвечают» высокочастотные коэффициенты. Это позволяет использовать следующий алгоритм сжатия. Кадр разбивается на макроблоки размером 16х16 (размеру 720х576 соответствует 45х36 макроблоков в кадре), каждый из которых ДКП переводит в частотную область. Затем соответствующие частотные коэффициенты подвергаются квантованию (округлению значений с задаваемым интервалом). Если само по себе ДКП не приводит к потере данных, то квантование коэффициентов, очевидно, вызывает огрубление изображения. Операция квантования выполняется с переменным интервалом – наиболее точно передаётся низкочастотная информация, в то время как многие высокочастотные коэффициенты принимают нулевые значения. Это обеспечивает значительное сжатие потока данных, но приводит к снижению эффективного разрешения и возможному появлению незначительных ложных деталей (в частности, на границе блоков). Очевидно, что чем более грубое квантование используется, тем больше степень сжатия, но и тем ниже качество результирующего сигнала.

Временная компрессия использует высокую избыточность информации в изображениях, разделённых малым интервалом. Действительно, между смежными изображениями обычно меняется только малая часть сцены – например, происходит плавное смещение небольшого объекта на фоне фиксированного заднего плана. В этом случае полную информацию о сцене нужно сохранять выборочно – только для опорных изображений. Для остальных достаточно передавать только разностную информацию: о положении объекта, направлении и величине его смещения, о новых элементах фона (открывающихся за объектом по мере его движения). Причём, эту разностную информацию можно формировать не только по сравнению с предыдущими изображениями, но и с последующими (поскольку именно в них по мере движения объекта открывается часть фона, ранее скрытая за объектом). Математически наиболее сложным элементом является поиск смещающихся, но мало изменяющихся по структуре макроблоков (16х16) и определение соответствующих векторов их смещения. Однако это элемент наиболее существенен, так как позволяет существенно уменьшить объём требуемой информации. Именно эффективностью выполнения этого " интеллектуального" элемента в реальном времени и отличаются различные MPEG-кодеры.

⇐ Предыдущая 1 2 345 6 Следующая ⇒

Последнее изменение этой страницы: 2019-06-19; Просмотров: 219; Нарушение авторского права страницы