Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Словари лингвистических терминов.



Словари лингвистических терминов – разновидность отраслевых энциклопедических словарей.

Возникновение словарей этого типа относится к концу XIX в. До этого лингвистическая терминология отражалась в более широких справочниках: энциклопедиях, толковых словарях общеупотребительного языка и т.п.

Расцвет лингвистической лексикографии относится к 60-м гг. XX в., что связано с появлением новых лингвистических дисциплин, школ и направлений, представляющих новые термины.

Особое место среди словарей лингвистических терминов занимает словарь О. С. Ахмановой (1966; 7 000 терминов). Он представляет собой не только обобщение всего предшествующего терминологического опыта, но и новый типсловаря, сочетающий одновременно толкование термина, перевод его на четыре языка, иллюстрации реального функционирования термина и подобное. Сопоставление терминов с терминами следующих языков: английским, французским, немецким и испанским.

В качестве пособия для учителей средней школы издан «Словарь-справочник лингвистических терминов» Д. Э. Розенталя и М. А. Теленковой (М., 1975), в котором разъясняются термины лексики, фразеологии, фонетики, графики, орфографии, морфологии, синтаксиса, стилистики, пунктуации применительно к школьной практике.

 

19. Корпусная лингвистика, ее идеология и основные понятия.

Корпус текстов, с одной стороны, это исходный речевой материал для корпусной лингвистики и для других лингвистических дисциплин; с другой стороны, результат деятельности корпусной лингвистики.

Конкорданс – список словоформ встречающихся в тексте, расположенных в алфавитном порядке, слово даётся с его словесным окружением.

Проблемная область - область реализаций языковой системы, содержащая феномены, подлежащие лин­гвистическому описанию = множество данных, обработка которых затруднена из-за того, что языковых реализаций слишком много. Она может быть сколь угодно велика или мала — все определяется выбранным объектом анализа, имеет два измерения — языковое и речевое. Рече­вое представлено речевыми высказываниями (реализациями), а языковое измерение проявляется в существовании потенциальной возможности по­явления других употреблений, дополняющих массив имеющихся реализа­ций. Для лингвистического исследования в центре внимания стоит именно языковое измерение, поскольку его следует реконструировать в результате анализа.

Корпус данных - сформированная по определенным правилам выборка данных из проблемной области = результат отображения из про­блемной области, имеет только одно измерение — речевое, поскольку сам по себе он не обла­дает потенцией производства своих составляющих. Лингвисту приходится по отдельным результатам деятельности языка делать выводы о функционировании языка как целого, как системы.

Единица хра­нения — это некоторая совокупность естественно-языковых выражений проблемной области, которой сопоставляется одно описание на не­котором метаязыке, определяемом процедурой формирования корпуса. На основании описания единицы хранения можно судить о том, какая часть проблемной области представлена в корпусе. Совокупность описаний единиц хранения образует некоторое множество, по которому можно судить о представительности выборки — какие газеты представлены, как формировалась выборка по временному параметру (все газеты какого-то периода и т.д.).

Корпус текстов — это вид корпуса данных, единица­ми которого являются тексты или их достаточно значительные фрагмен­ты, включающие, например, какие-то полные фрагменты макроструктуры текстов данной проблемной области.

Динамические и статические корпусы текстов. Первоначально корпусы текстов создавались как статические образования, отражающие опреде­ленное временное состояние языковой системы (авторские корпусы — коллекции текстов писателей). Для отражения процессуального аспекта проблемной области была разработана новая технология построения и эксплуатации динами­ческого корпуса текстов. В имеющейся литературе такие корпусы получи­ли также название мониторных. Особенность сборки мониторных кор­пусов заключается в том, что они не предполагают раз и навсегда заданно­го набора текстов. В течение заранее фиксированного промежутка време­ни происходит обновление и/или дополнение множества текстов корпуса. Специфика эксплуатации динамического корпуса состоит в том, что пользователь при проведении исследования может выделить из об­щего генерального корпуса рабочий корпус, включающий лишь часть текстов генерального корпуса. Для научных и практических це­лей формируются корпусы параллельных текстов. По своей структуре это подмножество текстов на языке-источнике и одно или несколько подмножеств текстов, которые являются переводами текстов языка-источника на языки-цели (английский текст и его переводы на не­мецкий, французский).

Порог отображения - соотношение между корпусом данных и проблемной областью при пропорциональ­ном сужении. Поскольку корпус данных является сужением проблемной области, то совершенно очевидно, что при «пропорциональ­ном» сужении, являющемся, по-видимому, простейшим случаем реализа­ции принципа репрезентативности, некоторые части проблем­ной области оказываются вне корпуса данных.

Параметризация проблемной области. Сужение проблемной области к исследовательскому корпусу основывается на выделении некоторых ха­рактеристик текстов проблемной области, которые релевантны для пред­полагаемого исследования. Совокупность этих характеристик (их возмож­ные комбинации) образует многомерную матрицу, служащую основой для отбора текстов в корпус. Часто для оценки релевантных параметров про­блемной области привлекается экспертная оценка.

Требования к корпусу: Важнейшее свойство корпуса — репрезентативность по отношению к проблемной области (способность корпуса текстов отражать все свой­ства проблемной области, релевантные для данного типа лингвистичес­кого исследования, в определенной пропорции, определяемой частотой явления в проблемной области). Другими словами, частота явления в кор­пусе должна быть близка частоте в проблемной области. Репрезентативность корпуса указывает на то, что единицы проблемной области отражаются пропорционально в корпусе данных, но при определенном пороге некоторые релевантные явления пропадут, исчезнут из корпуса. Полнота требует учета релевантных явлений, даже если это не соответствует идее пропорционального сужения. Требова­ние полноты совершенно необходимо в тех случаях, когда лингвист-конструктор корпуса приблизительно знает, что ему искать. Корпус текстов должен экономить усилия иссле­дователя при изучении проблемной области. В общем случае чем более «экономичен» корпус, тем выше порог отображения. В то же время для исследовательских корпусов экономия не может прово­диться в ущерб репрезентативности: статистические пропорции должны быть адекватно отображены, если это не оговорено специально.

Система позволяет осуще­ствлять следующие функции: Стандартный просмотр текстов, входящих в состав корпуса (в виде просмотра таблицы базы данных).Выборка и упорядочивание текстов по указанным формальным или содержательным признакам, а также на основе различных их комби­наций. В системе реализован стандартный набор типовых запросов в виде выбора из списка, автоматически переводимых затем на язык SQL; возможен также ручной ввод запросов на SQL.Получение текстовых массивов, являющихся подмножествами исход­ного корпуса на основе изменяемой случайной выборки и задания процентов от общего корпуса по одному из параметров.Просмотр массивов-подмножеств и их обработку: получение слов­ников и списков контекстов (конкордансов).

Информация о наличии корпусов в разных странах ограничена, что существенно затрудняет проведение научных исследований и приводит к дублированию работы. Международная координация усилий в этой области пока еще не налажена. Локальность проектов приводит к возникновению различных форматов представления корпусов текстов.

 


Поделиться:



Последнее изменение этой страницы: 2017-03-14; Просмотров: 217; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.014 с.)
Главная | Случайная страница | Обратная связь