Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Лк.№11. 2ч. Сжатие цифрового звука.



Сокращение объема цифровой информации, применяемое, например, при методе МUSICAM, предусматривает отбор по времени и спектру долей сигнала таким образом, чтобы выше порога слышимости помехи, шумы и искажения отсутствовали при слуховом восприятии. Иначе говоря, после обработки в сигнале должны отсутствовать те частотные компоненты и те временные отрезки, которые при слуховом восприятии маскируются, частотные области без сигнала при этом должны быть свободны от информации и, следовательно, от шумов. Величина шага квантования изменяется так, что шум квантования остается неслышимым, т.е. маскируется полезным сигналом.

Погрешности преобразования входного сигнала из аналоговой формы в цифровую возникает при квантовании сигнала на конечное, ограниченное число уровней.

Шум квантования сигнала электросвязи — это разность между квантованными и истинными значениями сигнала электросвязи.

Для ЗС с ограниченной скоростью изменения мгновенных значений условие малости приращений ступенчатой функции, а следовательно, и малых шумов квантования будет выполнено, если частота дискретизации f в несколько раз превышает значение f сигнала.. Повышение частоты дискретизации при соответствующей частоте среза ФНЧ приводит к уменьшению уровня шумов квантования в полосе частот полезного сигнала.

Оно полностью исключает эффект наложения спектров полезного сигнала и продуктов модуляции, что обеспечивает отсутствие комбинационных частот вида + k (f до-Fс) при последующей фильтрации. Отпадает также необходимость применения аналоговых ФНЧ высокого порядка на входе кодера и выходе декодера. Поэтому кодер имеет хорошие переходные характеристики и малое групповое время запаздывания при малой его зависимости от частоты. Однако для реализации выигрыша в величине шума квантования и перехода к стандартному значению частоты дискретизации (48 или 32 кГц) необходимо ограничить полосу частот с одновременным понижением f до до значения f д.

Соотношение амплитуды полезного сигнала и минимального относительного порога слышимости определяет в этом случае величину необходимого шага квантования. Чтобы этот подход имел высокую эффективность, предварительно широкополосный ЗС разделяют фильтрами на узкополосные составляющие, близкие по полосе к критическим полосам слуха, где маскировка наиболее ощутима, так как обработка ЗС в слуховой системе выполняется именно в этих полосах.

Время преобразования это время задержки выходного сигнала tс – для АЦП временной интервал с момента подачи управления и до момента получения на выходе адекватного сигнала.

Оцифрованный звук может храниться, как в сжатом, так и в несжатом виде. Изначально форматы audio CD (CDDA) и super audio CD (DSD), а так же контейнер WAV не предусматривали сжатия данных. Однако, с развитием средств коммуникации и в особенности интернета возникла необходимость в передаче больших объёмов данных, что привело к разработке различных способов их сжатия.

Различают:

 сжатие с потерями (lossy), при котором полное восстановление исходного сигнала невозможно,

 сжатие без потерь (lossless), позволяющее восстановить исходный сигнал в полном объёме.
     Сжатие с потерями разработано на основании алгоритмов сокращения психоакустической избыточности. Психоакустика - это наука, изучающая восприятие звука человеком.

Человек со своими органами чувств, в состоянии принимать огромные потоки информации. Но сознательно он способен обрабатывать лишь около 100 бит/с информации. Поэтому можно говорить о присущей ЗС избыточности. Значительной проблемой при цифровом представлении ЗС является сокращение имеющейся в них статистической и психофизической избыточности. Это позволяет уменьшить скорость цифрового потока при кодировании ЗС до предельно возможной величины, при которой шумы, помехи и искажения остаются еще незаметными на слух даже для высококвалифицированных экспертов. При составлении алгоритмов сокращения психоакустической избыточности (т.е. для исключения из звукового сигнала "лишней" информации) был взят за основу т.н. эффект маскирования. Так, например, вы не будете слышать своего собеседника, если ваш разговор будет идти вблизи проходящего неподалёку железнодорожного состава. Это так называемое частотное маскирование. А, если вам над ухом выстрелить из пистолета, вы несколько микросекунд так же не будете в состоянии различать другие звуки. Это так называемое временное маскирование.

Таким образом, кодек вычисляет, какие частоты в какой момент времени не будут восприниматься вашей слуховой системой и просто удаляет их из сигнала.

Кроме того, сигналы можно квантовать с "возможно меньшим разрешением так, чтобы шумы квантования, изменяясь по величине с изменением уровня самого сигнала, еще не становились бы слышимыми.      

Этот эффект напрямую зависит от частот тихого и громкого звуков: низкочастотные звуки маскируют высокочастотные, но высокочастотные маскировать низкочастотные не могут.          

 Рассмотрим эффект от сжатия с потерями (в MP3 128 kbps) исходного файла в формате PCM 1411,2 kbps (стандартный audio CD). В соответствии с теоремой Котельникова для преобразования аналогового сигнала в цифровой без потери информации необходимо, чтобы частота дискретизации более чем в 2 раза превышала частоту преобразуемого сигнала.

44,1 кГц / 2 = 22 кГц

 Таким образом верхняя граница частоты звука, который может быть записан на audio CD, как раз примерно соответствует верхней границе диапазона слуха здорового человека. Теперь посмотрим, что сделал с этими частотами кодек.

    Срезанными оказались частоты от 16 до 22 кГц. Т.е. исключаются те частоты, которые, по усреднённым расчётам кодека, не могут быть восприняты вами в определённый момент времени.
Сжатие без потерь основано на принципе сокращения статистической избыточности. При помощи различных математических преобразований происходит более рациональное размещение данных в файле, что позволяет уменьшить его размер на 15-20%. Каких-либо преобразований самой частотной структуры звуковой волны при этом не происходит. При таких преобразованиях звука его задержка может составлять от 40 до 50 мксек.

За счет устранения психофизической избыточности можно уменьшить требуемое для высококачественной передачи (записи) цифровых аудиоданных более чем в 10 раз.

Широко используются два способа кодирования звуковой информации:

PCM (импульсно-кодовая модуляция)

ADPCM (адаптивная относительная импульсно-кодовая модуляция)

PCM (Pulse Code Modulation) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. Так записаны данные на всех аудио CD.

ADPCM (Adaptive Delta PCM) – запись значений сигнала в относительных изменениях амплитуд (приращениях), что позволяет упростить данные, чтобы они занимали меньший объем памяти.

Рис. 5.4. Последовательность двоичных сигналов

 

Пропускная способность канала. Пропускная способность канала зависит от полосы частот линии связи и отношения мощностей сигнала и шума. Максимальная пропускная способность канала, настроенного на основе линии с полосой частот Fи отношением сигнал-шум Рс/Рш, составляет (бит в секунду)

(4.1)

Значение (1+ Рс/Рш) определяет число уровней сигнала, которое может быть воспринято приемником. Так, если отношение Рс/Рш>3, то единичный сигнал может переносить четыре значения, т. е. бита информации.

При передаче данных широко используются двоичные сигналы, принимающие значения 0 и 1. Временная диаграмма последовательности таких сигналов, передаваемых по линии связи, изображена на рис.5.4, где сверху указаны значения, переносимые сигналом. Минимальная длительность такта, с которым могут передавался сигналы по каналу с полосой частот F, равна . Если вероятность искажения символов 0 и 1 из-за помех одинакова и равна р, то число двоичных символов, которые можно безошибочно передать по каналу в секунду,

(4.2)

Это выражение определяет пропускную способность двоичного канала. Величина в квадратных скобках определяет долю двоичных символов, которые передаются по каналу с частотой 2F без искажений. Если помехи отсутствуют, вероятность искажения символа и пропускная способность ; если вероятность искажения р=0,5, то пропускная способность С=0. Если по каналу передается сообщение длиной n двоичных символом, то вероятность появления в нем точноlошибок , среднее число ошибок и среднее квадратическое отклонение .

 

 


Поделиться:



Последнее изменение этой страницы: 2019-06-09; Просмотров: 208; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.018 с.)
Главная | Случайная страница | Обратная связь