Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
К проблеме установочного уровня системы автоматического распознавания речи
Исходя из задач имитации автоматическим устройством процесса рецепции речи, предлагается обратить внимание на наличие в системе рецепции «установочного уровня». Как известно, существуют стереотипные (ритуальные) ситуации квазиобмена информацией, в которых функционируют соответствующие клише. (Здравствуйте, как дела? - Здравствуйте, ничего, спасибо! и т.п.). При обмене такими клише от коммуникантов не требуется, как правило, ни формирования значимой информации «на выходе», ни ее специальной переработки «на входе». Происходит это потому, что невербальная информация (рукопожатие, улыбка или, напротив, суховатый тон) и прежний экстралингвистический опыт общения являются более значимыми, чем вербальная часть. Простой опыт замены сочетаний как дела, на как мола, здравствуйте - на страсти-то, или трости нет, или даже на дроссели на адекватном невербальном фоне покажет отсутствие слухового контроля у адресата, а точнее, его существенное ослабление. Практически узнавание, включая и ложное узнавание клише, происходит при наличии установки коммуникантов на ритуал приветствия с обычными его компонентами. В состав установки входит результат оценки ситуации и ряда привычных звукокомплексов. Процесс прогнозирования в таком случае играет более существенную роль, чем собственно анализ «на входе», который может быть даже полностью вытеснен. Но и в том случае, если анализ вербальной части сообщения производится формально точно, семантическая его интерпретация в целом или отдельных его частей может быть абсолютно ошибочной, не соответствующей намерениям адресанта, если последний имеет установку, существенно отличную от установки адресата. Таким образом, если автоматическое устройство распознания речи должно имитировать реальную человеческую систему распознания (всегда в связи с ситуацией общения), то в этом устройстве (в дальнейшем - АРР) должен быть предусмотрен «блок установки». Учитывая вероятную специфику АРР, этот блок должен иметь «память ситуации», которая накапливается в результате действия «перцептрона» (устройства, воспринимающего реальные ситуации, типизирующего их и передающего в соответствующем коде «памяти ситуаций»). Каждая из наиболее вероятных ситуаций, в которых осуществляется общение, должна быть запечатлена в «блоке установки», в его собственной памяти. В свою очередь, каждый участок памяти должен быть связан с рядом вариантов наиболее вероятных вербальных сообщений, которые необходимо воспринять и дешифровать. Результаты дешифровки информации соотносятся с перцептроном, продолжающим опознавать ситуацию, ее детали, возможные ее изменения. Подтверждение памяти прогноза на уровне установки и ситуации вызывает сигнал, идущий в блок с программой ответных физических действий или в блок вербальных реакций (или в оба блока). Приведем данные некоторых экспериментов, подтверждающие необходимость наличия установочного уровня для эффективного смыслового распознавания вербальных сигналов. В большой группе испытуемых (студенты) в 1-й части эксперимента были проведены кратковременные занятия по анализу предложений на русском и немецком языках. Среди других было и предложение с фрагментом бакланы летят под облаками Экспериментатор привлек внимание студентов именно к этой части предложения, которую испытуемые несколько раз повторили вслух. Через некоторое время испытуемым была предъявлена магнитофонная запись ряда предложений с инструкцией: «Воспринять на слух, повторить вслух, определить синтаксический тип». Среди нормально записанных предложений были и такие, которые в разной степени «зашумливались» и не соответствовали ранее знакомым. Некоторые предложения были совсем новыми, но сохраняли интонационные характеристики ранее знакомых и были равными им по длительности звучания. В других предложениях, ранее знакомых, некоторые слова заменялись синонимами. В-третьих, производились весьма существенные замены, искажавшие смысл. В-четвертых, часть предложения сохранялась прежней, а другая часть полностью заменялась при легком зашумлении или без него. Результаты показали, что испытуемые восприняли знакомые ранее примеры предложений, которые полностью или частично перешли в преддолговременную память. По запечатленным в ней признакам знакомых сообщений испытуемые реализовали соответствующую установку на опознание знакомых предложений. Под влиянием установки избиралась соответствующая стратегия опознания и воспроизведения. Поэтому в 100% случаев запись баклажаны лежат под огурцами опознавалась как бакланы летят под облаками -как в знакомом, так и в новом, дистрибутивном окружении. В 45% случаев существенные (по форме и содержанию) замены игнорировались и воспроизводилась не реальная запись, а ранее услышанное. В 28% случаев ранее запомнившееся предложение воспроизводилось при аудировании записей (сильно зашумленных) совершенно других предложений, обладающих сходными (с прежними) или совпадающими просодическими параметрами. Воспроизведение предполагаемого целого под действительно опознанными частями (целое реально было другим) наблюдалось также довольно часто (10-15% попыток «досрочного опознания» при 8% ложных опознаний). Теорию установки, как нам представляется, хорошо объясняет гипотеза относительно того, что опознание речевого целого производится не поэлементно (звуки, слоги, морфемы), а крупными сегментами или даже целостным текстом. Непосредственное влияние установки на ожидаемый речевой сигнал и даже на инициативное вербальное обращение в плане сформированной установки может быть продемонстрировано на результатах ряда опытов, сходных по методике и по наблюдаемым явлениям. Довольно легко показать, что на стадиях раннего онтогенеза поведение ребенка, включая и речевое, во многом определяется тесной связью с ситуацией, связанной с соответствующей установкой, и вне ее часто вообще не осуществляется. Например, вербальное общение при актуальном восприятии партнера, причем хорошо знакомого, проходит успешно. Если заменить партнера, то ребенок, не имеющий опыта такого рода замен, «стесняется», т.е. чувствует неловкость именно из-за того, что новая ситуация тормозит реализацию знакомой (сформированной) установки. Можно утверждать даже, что ребенок плохо понимает в таких случаях обращенный к нему вопрос, так как именно знакомая ситуация является одним из средств дешифровки смысла речи. Первые опыты ребенка в коммуникации по телефону приводят, как правило, к затруднениям, а иногда к невозможности коммуницироваиия: речь знакомого человека при этом может быть точно опознана по голосу. Очевидно, что АРР, запрограммированная на распознание речевых сигналов в любой их тоновой, силовой и тембровой модификации, будет работать куда эффективнее ребенка, будучи зависимой только от объема вербальной памяти и от ресурсов возможных ответов на опознанные стимулы. Но. возможно, в задачи некоторых АРР входит выдача информации или реализация ответов только определенному партнеру и только в определенной ситуации. Тогда явно необходим блок установочного уровня, работающий в зависимости от показаний перцептрона относительно ситуации общения. Что касается невербальной информации другого типа, т.е. функционирующей в единстве с содержанием и формой информации вербальной, то мы отсылаем читателя для более подробного ознакомления к нашей работе [Горелов 1980]. Здесь же ограничимся беглым изложением некоторых содержащихся в ней положений, которые проиллюстрируем примерами. Невербальный компонент как универсалия речевого акта Термин «паралингвистика» в первой его части нередко используется в том же духе, что и первая часть термина «парапсихология». Мы, однако, попытались доказать, что паралингвистика стала или должна стать неотъемлемой составной частью как общего языкознания, так и любой частной лингвистики. «Речевой акт» (РА) понимается как целенаправленная и адресуемая коммуникативная деятельность, реализуемая во времени и в пространстве с целью обмена значимой (в «специфически-человеческом» смысле) информацией с помощью системы естественного языка в его, например, устной форме. Имеется в виду, что РА осуществляется в обычных условиях, т.е. без опосредования техническими средствами, разрешает взаимонаблюдение участников РА, а также их обычные дистантные характеристики. Определения «целенаправленная» и «адресуемая» относятся к обозначению ".обмен», но не всегда к «информации»; в ряде случаев участники РА порождают и (или) воспринимают не запланированную заранее или 'л процессе порождения информацию. Последняя могла обнаружиться не в связи с желанием участника (участников) РА и даже вопреки такому желанию. Поэтому РА не во всех своих формальных и содержательных составных понимается как «вполне осознаваемый». «С помощью» означает не «исключительно с помощью», не только средствами языка как объекта традиционной лингвистики. «Невербальный компонент» (НВК) РА понимается как несобственно лингвистический знак (в традиционном смысле по существу), так как он отличается от собственно лингвистического знака, во-первых, своеобразием субстанции, своеобразием структуры и особыми, иными, чем лингвистические знаки, возможностями обозначения и способностями сочетания с себе подобными и другими знаками. Вместе с тем НВК способен к выполнению функций лингвистического знака, причем всегда - при наличии намерения участника РА или без такого намерения - выступает в РА. Например: «- Фемистоклюс, - сказал Манилов, обратившись к старшему... Чичиков поднял несколько бровь, услышав такое отчасти греческое имя, которому, неизвестно почему, Манилов дал окончание на юс, постарался тотчас привесть лицо в обыкновенное положение»; «Но Манилов так сконфузился и смешался, что только смотрел на него.— Мне кажется, вы затрудняетесь?.. - заметил Чичиков»; «- А где же Иван Антонович? - Старик тыкнул пальцем в другой угол комнаты. Чичиков и Манилов отправились к Ивану Антоновичу». Если в 1 -м случае мимическое движение (поднял бровь) простая непроизвольная и неадресованная реакция удивления, то второе мимическое движение (постарался привесть лицо в обыкновенное положение) и целенаправлено, и адресовано (Манилову). Информация, содержащаяся в 1-м мимическом движении, не была «считана» Маниловым (Гоголь по крайней мере об этом не пишет), поэтому общий ход РА не нарушается. Во 2-м случае непроизвольная сигнализация Маниловым своего эмоционального состояния «считывается» Чичиковым, общий ход РА (изложение Чичиковым своего дела о покупке «мертвых душ») нарушается. В 3-м случае жест (тыкнул пальцем) полностью заменяет сообщение средствами естественного звукового языка и совершенно адекватно интерпретируется участниками РА, которым данный НВК адресован. Здесь мы имеем дело с условиями порождения конситуативного типа эллиптической конструкции, которая восполняется только при учете экстралингвистических и паралингвистических компонентов РА. Легко показать, что во всех примерах адекватный смысловой анализ ВК возможен лишь с учетом НВК. Нельзя представить себе не только «лингвистику текста» (с ее исследованиям цельности, связности и семантики общего содержания текста), но и традиционное (в духе Э. Бенвениста) рассмотрение предложения как «конечной единицы», подлежащей лингвистическому рассмотрению, без привлечения анализа взаимоотношений между ВК и НВК в РА. Если вполне можно допустить собственно паралингвистические исследования (например, описание типов НВК вне связи их с ВК), то уже взаимоотношения НВК с ВК в РА в компетенции даже «чистой» лингвистики. Актуальна задача рассмотрения и онтологического аспекта НВК, относительно которого есть пока лишь гипотетические, правдоподобные, впрочем, суждения: «Паралингвистическая сущность определенных средств коммуникации связана с развитием ранее нечленораздельных форм общения в животном мире [Колшанский 1974: 78]. Следует указать и на имеющиеся противоречия в оценке паралингвистических и лингвистических (в ранее отмеченном различении) объектов. Например, утверждая, что «язык функционирует в качестве полноценной коммуникативной системы, возникшей и развивающейся как средство, структурно не зависимое от других форм общения», Г.В. Колшанский одновременно признает, что «абстрагирующий характер языка... не устранил тех примитивных форм (биологических) общения, которые были свойственны предкам. Вот почему паралингвистические свойства языка человека в принципе составляют неотъемлемую часть коммуникации. Ни один логический язык не может быть подобием естественного языка не только в плане очищения от возможной многозначности употребления его форм, но и в плане отрыва его от всех присущих ему антропологических паралингвистических форм, сопровождающих речевой акт [Там же: 77]. Как видим, констатация полноценности языковой системы и ее структурной независимости сосуществует вместе с признанием неотъемлемости паралингвистических средств от собственно лингвистических. Откуда же «неотъемлемость? ». Какие основания считать паралингвистические средства РА факультативными и лишь «сопровождающими» ВК? Наши данные [Горелов 1977в: 197-199] свидетельствуют о том, что: а) НВК являются не факультативной, а обязательной частью РА; б) НВК, опережающих реализацию ВК, - около 60%; в) НВК, реализующихся одновременно с ВК, -37%; г) НВК, отстающих от ВК, - 3%. Предварительные эксперименты с применением киносъемок дают основание считать, что в принципе НВК, отстающих от ВК, нет вообще, а НВК «сопровождения» реально манифестируются в своей начальной форме прежде, чем развертывается ВК. Поэтому мы и решились сформулировать следующее положение: «Невербальная внутренняя программа различных модальностей эксплицируется так, что вербальные средства выражения мысли замещают всякие иные средства коммуникации только в том случае, если последние оказываются недостаточными, малоэффективными, менее экономными или просто непригодными для выражения, для достижения коммуникативных целей» [Там же: 177]. Таким образом, предлагается по-новому (сравнительно с традиционным подходом) рассматривать проблему экономии языковых средств в РА, иначе, чем это было раньше, решать вопрос о причинах возникновения эллипсов и всякого рода иных деформаций в ВК. Хотя выше мы уже показали НВК в составе РА, чтобы ответить на принципиальный вопрос о причастности объектов паралингвистики к целям лингвистических исследований, логично начинать рассмотрение НВК с того момента, когда начинается процесс порождения высказывания. В ряде уже указанных выше наших работ мы достаточно подробно освещали проблему внутреннего программирования будущего высказывания. Назовем еще одну нашу работу, специально посвященную обзору исследований по вопросу «глубинных структур» [Горелов 1977а], чтобы в дальнейшем не повторять уже высказанное. Напомним в самых общих чертах положение советской психолингвистики, восходящее к тезису Л.С. Выготского о том, что выражение мысли есть процесс перехода «от мысли к слову», т. е. текст высказывания есть результат вербализации некоторого содержания, сформированного в коде, отличном от языкового (звукового и национально-языкового), либо еще до начала высказывания, либо - в некоторых частях - по ходу вербализации. Эта проблема хорошо известна по работам Н.И. Жинкина (он экспериментально показал, что содержание будущего высказывания конструируется в УПК - в универсально-предметном коде), А.А. Леонтьева, Т.В. Ахутиной, И.А. Зимней и многих других советских и зарубежных исследователей внутренней речи. Невозможно свести УПК, т.е. код, в котором осуществляется наше мышление, к нейроследам в памяти представлений, своеобразным эквивалентам отраженных в сознании и подсознании элементов объективной реальности, которые были представлены в ощущениях и восприятиях. В знаке языка, который в своем большинстве является сугубо условным (хотя можно допустить, что в доисторическом языке господствовали звукоподражания и жестово-звуковые имитации), «отражено» также и межзнаковое отношение, и понятийные уровни разной степени абстракции. Такого рода знаки не могут иметь аналогов в предметном эквиваленте нейрофизиологического кода. Очевидно, эквиваленты представлений, соответствующие референтам класса вещей, качеству и наглядно представляемым действиям, являются фундаментальными и одновременно элементарными единицами УПК. На более высоком уровне этого кода, организованного иерархически, располагаются «следы-схемы», объединяющие элементарные эквиваленты представлений в родовые (а еще раньше - в видовые) образования, которым соответствуют языковые и видовые обозначения. Бесчисленные и разнообразные связи между кодовыми единицами и уровнями образуют системы семантических полей, парадигматических и синтагматических группировок. Отсутствие надежных (не только в деталях, но и в ряде принципиальных, сущностных характеристик) нейрофизиологических данных не позволяет пока уверенно судить о механизмах «кодовых переходов», о которых писал Н.И. Жинкин [1964] и которые необходимо иметь в виду, когда предпринимается попытка описать вербальное и невербальное на стадии, предшествующей РА, т.е. на стадии формирования «глубинных структур». То обстоятельство, что одно и то же содержание может быть выражено разными синтаксическими структурами «на поверхности», причем структурами любого языка, свидетельствует о том, что смысл будущего высказывания на уровне «глубинных структур» имеет свои собственные и единицы, и правила синтаксирования. В одном из опытов мы показывали, как носители разных (неродственных языков) ставились экспериментатором в условия необходимости передачи одной и той же информации средствами «жестового языка», так как не знали, будучи разделенными на специальные пары партнеров по коммуникации, языка друг друга ни в малейшей мере [Горелов 1977г: 297]. Опыт показал некоторые универсальные характеристики невербального, «глубинного» синтаксиса, среди которых: 1) отсутствие обозначения тематического подлежащего (субъекта); 2) постпозиция определения к любому существительному; 3) контактное расположение обозначения действия, прямого дополнения или обстоятельства - вне зависимости (как и в п.1 и 2) от норм, регулирующих «поверхностную» синтагматику. Возможно, что в «глубинном синтаксисе» предложные сочетания могут быть представлены в последовательности типа послелога в тюркских языках: многие испытуемые прибегали к такого рода обозначениям. Всевозможные нарушения норм «поверхностного» синтаксирования объясняются нами рядом причин: а) конфликтом между этими нормами и «глубинным синтаксисом»; б) хезитациями говорящего участника РА в связи с затруднениями в выборе конструкции или слова; в) нарушениями соответствующих связей между готовым замыслом и еще формируемым высказыванием: по ходу высказывания на первое место выходят единицы, соответствующие готовым уже частям содержания, а дальнейшая последовательность языковых знаков зависит от того, готовы ли соответствующие «блоки содержания» и адекватные части вербального; г) «парадигматическая и синтагматическая организация речевого процесса обеспечивается различными мозговыми системами» [Лурия 1975: 15]. Результаты взаимодействия вербального и невербального в РА яснее всего выявляются, конечно, в тексте устного сообщения или в его литературно-художественной модели. Рассмотрим конкретные возможности НВК выступать в роли различных частей предложений. A. НВК в качестве сказуемого: « - Мне тайга не самый страх... Ну не скажи-и... Тайга - она ууу». «— Ну что, не цепляетесь? - спросил он мастера. Тот покачал головой: мол нет». Б. НВК в качестве прямого дополнения: «- Во дворе Николай поднялся к лабазам, кивнул на пудовый шмок: - Отопри! » B. НВК в качестве косвенного дополнения: «- Для кого это ты? Яков подмигнул и посмотрел на сестру». [Ежов и др. 1976]. Г. НВК в качестве обстоятельства образа действия: «- Хорошо поет? - спросил Алексей Соломина. Тот кивнул». Д. НВК в качестве обстоятельства места: «Поп посмотрел на Ерофея и, подмигнув, склонил голову направо, как бы спрашивая - там? Ерофей, тоже молча, утвердительно склонил голову» [Абрамов 1974]. Е. НВК в качестве обстоятельства времени: «- Когда же дед?... Дед... посмотрел в окно, как бы говоря: утром». Ж. НВК в качестве обстоятельства причины и следствия: «- Из-за нее, что ли? - Гена кивнул в ее сторону». 3. НВК в качестве подлежащего: «— Это ты меня нашла? - Она улыбнулась и отрицательно покачала головой» [Козлов 1962). И. НВК в качестве подлежащего и сказуемого. Примеров для данного случая слишком много, чтобы приводить еще один. По этому поводу Ю.М. Скребнев пишет: «Отсутствие обоих главных членов предложения представляет собой широко распространенную синтаксическую черту разговорного подъязыка, использующего в законченных коммуникативных сегментах потенциальные второстепенные члены предложения» [1971: 3]. Определение «потенциальные» здесь весьма примечательно: так как в предложении как в таковом, т. е. в вербальной части высказывания, нет вербально выраженных главных членов, Ю.М. Скребнев логично определяет оставшиеся «коммуникативные сегменты» как «потенциально второстепенные». Невербальные компоненты, таким образом, представляют в нашем рассмотрении информативные образования различной природы и функций. Ввиду того, что любой речевой акт осуществляется в данной схеме (не претендующей, впрочем, на полноту), невербальный компонент предлагается квалифицировать в качестве коммуникативной универсалии. В любом коммуникативном (с использованием естественного языка) акте невербальное и вербальное соотносятся друг с другом в соответствии с принципом дополнительности.
Популярное:
|
Последнее изменение этой страницы: 2016-03-22; Просмотров: 1500; Нарушение авторского права страницы