Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Исследование качества звукопередачи в помещениях
1. Цель работы: ознакомление с методиками субъективной и объективной оценки качества звукопередачи речи (музыки) в гулком помещении.
2. Общие сведения Качество звукопередачи в помещении определяется рядом объективных и субъективных критериев. К числу последних следует, прежде всего, отнести понятность речи, которая оценивается соответствующим количественным критерием – разборчивостью S. Под этим термином чаще всего понимают слоговую разборчивость, которая определяется отношением правильно понятых слогов к общему числу произнесённых, выраженную в процентах[1]: Sсл = mпп / mпр • 100 %, (3.1) где mпп – число правильно понятых слогов; mпр – число произнесённых слогов. Слог представляет собой характерную совокупность фонем (звуковых единиц), обладающую вполне определёнными параметрами и информативностью в результате последовательного сочетания процесса нарастания амплитуды звука, затем некоторого промежутка времени существования её и, наконец, затухания амплитуды. Здесь согласные и гласные звуки неразрывно связаны друг с другом, но гласные звуки, формируемые импульсом воздуха голосовой щели, более продолжительны по времени, обладают большим давлением и могут самостоятельно формировать слоги. Для русской речи гласные звуки под ударением имеют в среднем длительность около 0, 2 с, а неударные – 0, 1 с, с амплитудой давления на близких расстояниях (8...10см) ото рта до 0, 1 Па[2]. Согласные же звуки, образуемые шумами при продувании воздуха в полости рта, имеют меньшую продолжительность и амплитуду давления, участвуя в слоге только в сочетании с гласными звуками. Длительность согласных изменяется в диапазоне от 0, 02 до 0, 15 с при среднем значении около 0, 1 с. Их амплитуды также изменяются в более широких пределах со средним значением порядка 0, 01 Па, определяя тем самым динамический диапазон речевых сигналов. Таким образом, если представить речевой сигнал в виде амплитудно- или частотно-модулированных тональных импульсов, то влияние помещения будет проявляться в изменениях временных, частотных, амплитудных и даже пространственных характеристик первичного сигнала. Особенно заметно это сказывается на временных зависимостях, когда изменяется продолжительность процессов нарастания и затухания амплитуд. Причём в начальные промежутки времени, особенно заметные на слух, в суммарном сигнале будут учитываться, кроме энергетических, когерентные интерференционные добавки за счёт ранних отражений, а в стадии, близкой к установившейся только энергетические составляющие за счёт отражений с большим запаздыванием. Следовательно, информация, передаваемая импульсным сигналом с малой скважностью, будет значительно искажена. Степень влияния отражений на первичный сигнал характеризуется так называемым предельным временем запаздывания (ПВЗ), вызывающим ощущение эха между сигналом и его запаздывающим повторением. За пороговое значение ПВЗ для речевых сигналов принимается промежуток времени, не достигающий 40 мс. Здесь наблюдается качественное “слияние” сигнала и его повторения: не заметны на слух временной разрыв между ними и изменение тембра. При интервалах в пределах от 40... 60 и даже 85 мс замечается изменение тембра реверберационного характера. Однако при разнице в их уровнях порядка 10 дБ изменение тембра не воспринимается. Для интервалов запаздывания примерно 80... 85 мс наблюдается отрыв последующего звука от предыдущего, приходящего к слушателю в одном направлении, т.е. эхо. При этом разборчивость с увеличением интервала запаздывания непрерывно падает, достигая наименьшего значения ≈ 80% при запаздывании около 200 мс для ораторской речи с нормальным темпом и 350 мс для замедленной повествовательной речи. Однако для интервалов времени, больших 200...350мс, разборчивость вновь увеличивается. Этот факт свидетельствует о том, что малозапаздывающие отражения, имеющие наибольшую корреляционную (мультипликативную) связь с сигналом, оказывают наибольшее влияние на разборчивость. А отражения с большим временем запаздывания, которые приобретают ненаправленный диффузный характер, в меньшей степени влияют на разборчивость речи и воспринимаются на слух как некоторая аддитивная помеха, характеризующая больше помещение, чем источник сигнала. Следует отметить, что именно слоговая разборчивость является одним из немногих субъективных критериев качества передачи речи в помещениях, который получил вполне хорошее объективное подтверждение [3]. Так, в зависимости от архитектурно–акустических данных разборчивость находится из соотношения: Sсл(%) = 96 Kнч · Kвч · KN · KТ. (3.2) Здесь коэффициент 96 учитывает предельное восприятие в идеальных условиях. Коэффициенты Kнч и Kвч, соответственно, учитывают имеющееся или необходимое ограничение полосы частот на низких и высоких частотах в тракте звукопередачи. Коэффициент KN зависит от соотношения сигнал/шум в помещении, а KТ по импульсной реакции выражает зависимость разборчивости от ранних отражений и времени реверберации. Зависимость коэффициентов в (3.2) от соответствующих факторов, определённая опытным путём, показана на рис. 3.1 … 3.3. Существенное значение для временных параметров речи имеет частота следования модулированных импульсов (слогов), или темп речи, влияние которого на разборчивость любой речи в помещениях рассматривалось в своё время В.А. Кнудсеном.
Рис.3.1 Рис.3.2 Рис.3.3 Действительно, общий темп речи, определяемый отношением числа лингвистических единиц (слов, слогов), содержащихся в сообщении, ко времени высказывания, для русской речи колеблется от 120 до 400 слогов в минуту (2...7сл/с) при среднем значении порядка 290 слогов в минуту (5сл/c). Установлено, что оптимальным является режим, когда темп предъявления речевой информации равен собственному темпу речи слушающего на родном языке. При медленном темпе усложняется синтетическое обобщение впечатлений, а быстрый темп мешает аналитическому рассмотрению речевого потока. Семантические и эстетические характеристики речи, а также качество любых музыкальных звуков оценивается с помощью значительного количества различных критериев, среди которых можно выделить основные: чёткость, прозрачность, пространственное впечатление и др. Перечисленные критерии являются энергетическими, поскольку определяются соотношением энергий начального и завершающего участков реверберационного процесса помещения. Каждый из критериев может быть определён количественно с помощью соответствующих коэффициентов или индексов, выраженных в децибелах [3]. Так например, индекс чёткости, характеризующий качество звукопередачи речи
; (3.3)
индекс прозрачности, характеризующий качество передачи музыки
; (3.4)
индекс пространственного впечатления, характеризующий гулкость помещения
’ (3.5) где T60 – время стандартной реверберации помещения; r0=rг /r – нормированный, по заданному расстоянию r, радиус гулкости; po – значение звукового давления в данной точке помещения, измеренное микрофоном с круговой характеристикой направленности; pп – значение звукового давления в данной точке, измеренное направленным микрофоном. В последнее время для исследования субъективных характеристик звука в помещении часто используют установку “искусственная голова” (ИГ), с помощью которой можно смоделировать бинауральный приём звуковых сигналов и установить более точно закономерности такого приёма. Поскольку последние основываются на субъективном различении прямого и отражённого звуков, при измерениях необходимо учитывать направление прихода звука. Экспериментально установлено, что боковые отражения вносят наибольший вклад в формирование слухового восприятия, поэтому данный метод предполагает измерять степень взаимной корреляции сигналов на ушах искусственной головы. Приведённые формулы для определения качества звукопередачи в помещении предполагают измерения мгновенных величин звуковых давлений, что требует достаточно сложной аппаратуры. Однако, если использовать гулкое помещение (например, ревербера-ционную камеру), можно применить статистическое приближение (полагая, что переходные процессы подчиняются экспоненциальной зависимости) и численные значения коэффициентов (и индексов) качества звука можно определить расчётным путём с помощью таких характеристик помещения, как время стандартной реверберации T60 и радиус гулкости rг. Значения T60 и rг , соответственно, рассчитываются по формулам: T60 = 0.164 V / α S, (3.6) где V – объём гулкого помещения; А=α S – суммарное поглощение всех поверхностей помещения, , (3.7) где Ф – фактор направленности громкоговорителя; Ω т – телесный угол излучения громкоговорителя. Определив T60 и rг, можно рассчитать значения С50, С80 и R по приближенным формулам (3.3)…(3.5). В настоящей работе предлагается провести артикуляционные измерения разборчивости речи по давлению (через коммутируемые от микрофонов ИГ головные телефоны) и в диффузном поле реверберационной камеры при изменении положения слушателей. 3. Описание установки
Рис.3.4. Структурная схема установки для оценки качества звукопередачи c помощью макета «искусственная голова»: РК – реверберационная камера (объем V=210м3); В1, В2 – вольтметры – предварительные усилители микрофонов «искусственной головы»; УМ –усилители мощности; Т1, Т2 – стереотелефоны; Г – громкоговоритель; ИМ – измерительный магнитофон, С – слушатель; КУ – коммутационное устройство; ИГ – «искусственная голова». Рис.3.5. Схема коммутации микрофонов: М1, М2 – микрофоны; ПК – переключатель на три положения: СФ – синфазное, ПФ – противофазное, СТ – стерео. 4. Методика проведения работы и обработка результатов 1. Включить приборы измерительной установки и дать им прогреться в течение 3-5 мин. 2. Воспроизвести запись одной артикуляционной таблицы с магнитофона и прослушать её при трёх положениях переключателя ПК. Уровень сигналов в головных телефонах одного-двух слушателей установить с помощью регуляторов УМ примерно одинаковым. Такой же уровень должен быть установлен от ГГ в РК. 3. Перемотать пленку с записью в обратном направлении и вновь прослушать ее, через головные телефоны (один-два студента) и непосредственно в реверберационной камере при фронтальном расположении остальных слушателей. Воспроизводимые слоги записываются в таблицу. При этом переключатель ПК должен быть установлен в положение – СТ, а макет «искусственная голова» и слушатели размещены на расстоянии r= rг, 0, 25rг, 4rг от громкоговорителя. При расчете величины rг по формуле (3.6) можно принять Ф=1, а Ω г=4π, 2π , π /2, в зависимости от того, где располагается источник звука, соответственно: в середине (в центре) помещения, на полу, в одной из боковых стен или в углу. Значение А=α S определяется по формуле (3.5) для соответствующих величин Т60, приведенных в табл. 3.1. Таблица 3.1
. Для артикуляционных исследований значения А рассчитываются для частоты 500 Гц, так как на эту частоту приходится максимум усредненной спектральной плотности речевого сигнала [3]. 4. Рассчитать процент артикуляции для каждого слушателя по формуле (3.1) путем сравнения с текстами стандартных таблиц, прослушиваемых через головные телефоны, прилагаемых к работе ( в режиме стерео), и при фронтальном прослушивании в реверберационной камере. Результаты расчетов занести в табл. 3.2 и табл. 3.2а. Таблица 3.2. Результаты прослушивания по давлению (ч/з ГТ)
Таблица 3.2а. Результаты прослушивания в поле РК
5. Выполнить аналогичные прослушивания при r= rг, 0, 25rг, 4rг но уже для других групп слогов, и расчеты при монофоническом синфазном (СФ) и противофазном (ПФ) включениях микрофонов М1 и М2 в макете, при боковом (относительно ГГ) положении слушателей в РК. 6. По результатам расчетов построить график зависимости артикуляции (разборчивости) речевого сигнала от расстояния при разных режимах включения микрофонов в ИГ. 7. Прослушать через головные телефоны запись музыкального сигнала и определить на слух его качество при трех положениях переключателя. Макет ИГ на расстоянии r=rг от громкоговорителя. Уровни сигналов в обоих телефонах одинаковы. Записать в выводах приблизительную оценку качества прослушивания. 8. Рассчитать по формулам 3.3, 3.4, 3.5 и построить частотные зависимости индексов четкости, прозрачности и пространственного впечатления. Для частоты f=500Гц индексы четкости определить также для расстояний 0.25r г , rг, 4rг между излучателем и ИГ. Графики этих зависимостей сравнить с ранее полученными графиками артикуляции в зависимости от расстояния. 5. Содержание отчёта В отчёт необходимо включить: 1) изложение цели работы; 2) схему установки; 3) таблицы рассчитанных процентов артикуляции; 4) расчетные значения индексов четкости, прозрачности, пространственного впечатления; 5) графики зависимости артикуляции для трех положений ПК микрофонов ИГ от расстояния. Аналогичные графики зависимости артикуляции от расстояния в поле РК при фронтальном и боковом положении слушателей; 6)частные и общие выводы по всем пунктам измерений.
6. Контрольные вопросы 1. Какими субъективными критериями оценивается качество воспроизведения речи и музыки? 2. Что такое процент артикуляции и как он зависит от расстояния между источником звука и приёмником (слушателем)? 3. Почему объективные критерии качества речевых и музыкальных сигналов называются энергетическими? Объясните временные интервалы, входящие в выражения для их вычисления. 4. Каковы оптимальные значения индексов чёткости, прозрачности, пространственного впечатления? Каковы при этом соотношения энергий? 5. Объясните зависимость процента артикуляции от режимов включения головных телефонов. Литература 1. ГОСТ 25902-83.Зрительные залы. Метод определения разборчивости речи. – М.: Изд. Стандартов, 1984. 2. Акустика: Учебник для вузов/Ш.Я Вахитов и др. Под ред. проф. Ю.А. Ковалгина.- М.: Горячая линия – Телеком, 2009. 3. Аннерт В., Стеффен Ф. Техника звукоусиления. Теория и практика.- М.: ПКФ «Леруша», 2003. Работа № 4
Популярное:
|
Последнее изменение этой страницы: 2016-05-03; Просмотров: 1123; Нарушение авторского права страницы