![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Словари лингвистических терминов.
Словари лингвистических терминов – разновидность отраслевых энциклопедических словарей. Возникновение словарей этого типа относится к концу XIX в. До этого лингвистическая терминология отражалась в более широких справочниках: энциклопедиях, толковых словарях общеупотребительного языка и т.п. Расцвет лингвистической лексикографии относится к 60-м гг. XX в., что связано с появлением новых лингвистических дисциплин, школ и направлений, представляющих новые термины. Особое место среди словарей лингвистических терминов занимает словарь О. С. Ахмановой (1966; 7 000 терминов). Он представляет собой не только обобщение всего предшествующего терминологического опыта, но и новый типсловаря, сочетающий одновременно толкование термина, перевод его на четыре языка, иллюстрации реального функционирования термина и подобное. Сопоставление терминов с терминами следующих языков: английским, французским, немецким и испанским. В качестве пособия для учителей средней школы издан «Словарь-справочник лингвистических терминов» Д. Э. Розенталя и М. А. Теленковой (М., 1975), в котором разъясняются термины лексики, фразеологии, фонетики, графики, орфографии, морфологии, синтаксиса, стилистики, пунктуации применительно к школьной практике.
19. Корпусная лингвистика, ее идеология и основные понятия. Корпус текстов, с одной стороны, это исходный речевой материал для корпусной лингвистики и для других лингвистических дисциплин; с другой стороны, результат деятельности корпусной лингвистики. Конкорданс – список словоформ встречающихся в тексте, расположенных в алфавитном порядке, слово даётся с его словесным окружением. Проблемная область - область реализаций языковой системы, содержащая феномены, подлежащие лингвистическому описанию = множество данных, обработка которых затруднена из-за того, что языковых реализаций слишком много. Она может быть сколь угодно велика или мала — все определяется выбранным объектом анализа, имеет два измерения — языковое и речевое. Речевое представлено речевыми высказываниями (реализациями), а языковое измерение проявляется в существовании потенциальной возможности появления других употреблений, дополняющих массив имеющихся реализаций. Для лингвистического исследования в центре внимания стоит именно языковое измерение, поскольку его следует реконструировать в результате анализа. Корпус данных - сформированная по определенным правилам выборка данных из проблемной области = результат отображения из проблемной области, имеет только одно измерение — речевое, поскольку сам по себе он не обладает потенцией производства своих составляющих. Лингвисту приходится по отдельным результатам деятельности языка делать выводы о функционировании языка как целого, как системы. Единица хранения — это некоторая совокупность естественно-языковых выражений проблемной области, которой сопоставляется одно описание на некотором метаязыке, определяемом процедурой формирования корпуса. На основании описания единицы хранения можно судить о том, какая часть проблемной области представлена в корпусе. Совокупность описаний единиц хранения образует некоторое множество, по которому можно судить о представительности выборки — какие газеты представлены, как формировалась выборка по временному параметру (все газеты какого-то периода и т.д.). Корпус текстов — это вид корпуса данных, единицами которого являются тексты или их достаточно значительные фрагменты, включающие, например, какие-то полные фрагменты макроструктуры текстов данной проблемной области. Динамические и статические корпусы текстов. Первоначально корпусы текстов создавались как статические образования, отражающие определенное временное состояние языковой системы (авторские корпусы — коллекции текстов писателей). Для отражения процессуального аспекта проблемной области была разработана новая технология построения и эксплуатации динамического корпуса текстов. В имеющейся литературе такие корпусы получили также название мониторных. Особенность сборки мониторных корпусов заключается в том, что они не предполагают раз и навсегда заданного набора текстов. В течение заранее фиксированного промежутка времени происходит обновление и/или дополнение множества текстов корпуса. Специфика эксплуатации динамического корпуса состоит в том, что пользователь при проведении исследования может выделить из общего генерального корпуса рабочий корпус, включающий лишь часть текстов генерального корпуса. Для научных и практических целей формируются корпусы параллельных текстов. По своей структуре это подмножество текстов на языке-источнике и одно или несколько подмножеств текстов, которые являются переводами текстов языка-источника на языки-цели (английский текст и его переводы на немецкий, французский). Порог отображения - соотношение между корпусом данных и проблемной областью при пропорциональном сужении. Поскольку корпус данных является сужением проблемной области, то совершенно очевидно, что при «пропорциональном» сужении, являющемся, по-видимому, простейшим случаем реализации принципа репрезентативности, некоторые части проблемной области оказываются вне корпуса данных. Параметризация проблемной области. Сужение проблемной области к исследовательскому корпусу основывается на выделении некоторых характеристик текстов проблемной области, которые релевантны для предполагаемого исследования. Совокупность этих характеристик (их возможные комбинации) образует многомерную матрицу, служащую основой для отбора текстов в корпус. Часто для оценки релевантных параметров проблемной области привлекается экспертная оценка. Требования к корпусу: Важнейшее свойство корпуса — репрезентативность по отношению к проблемной области (способность корпуса текстов отражать все свойства проблемной области, релевантные для данного типа лингвистического исследования, в определенной пропорции, определяемой частотой явления в проблемной области). Другими словами, частота явления в корпусе должна быть близка частоте в проблемной области. Репрезентативность корпуса указывает на то, что единицы проблемной области отражаются пропорционально в корпусе данных, но при определенном пороге некоторые релевантные явления пропадут, исчезнут из корпуса. Полнота требует учета релевантных явлений, даже если это не соответствует идее пропорционального сужения. Требование полноты совершенно необходимо в тех случаях, когда лингвист-конструктор корпуса приблизительно знает, что ему искать. Корпус текстов должен экономить усилия исследователя при изучении проблемной области. В общем случае чем более «экономичен» корпус, тем выше порог отображения. В то же время для исследовательских корпусов экономия не может проводиться в ущерб репрезентативности: статистические пропорции должны быть адекватно отображены, если это не оговорено специально. Система позволяет осуществлять следующие функции: Стандартный просмотр текстов, входящих в состав корпуса (в виде просмотра таблицы базы данных).Выборка и упорядочивание текстов по указанным формальным или содержательным признакам, а также на основе различных их комбинаций. В системе реализован стандартный набор типовых запросов в виде выбора из списка, автоматически переводимых затем на язык SQL; возможен также ручной ввод запросов на SQL.Получение текстовых массивов, являющихся подмножествами исходного корпуса на основе изменяемой случайной выборки и задания процентов от общего корпуса по одному из параметров.Просмотр массивов-подмножеств и их обработку: получение словников и списков контекстов (конкордансов). Информация о наличии корпусов в разных странах ограничена, что существенно затрудняет проведение научных исследований и приводит к дублированию работы. Международная координация усилий в этой области пока еще не налажена. Локальность проектов приводит к возникновению различных форматов представления корпусов текстов.
|
Последнее изменение этой страницы: 2017-03-14; Просмотров: 232; Нарушение авторского права страницы