Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Соотношение теоретической и прикладной лингвистики. Основные задачи и методы прикладных лингвистических работ.



Ответы к государственному экзамену по прикладной лингвистике (2009 г.)

Ситуации и ключевые слова. Ключевые слова и текст. Ключевые слова и поисковый образ документа.

1) Ключевое слово — слово в тексте, способное в совокупности с другими ключевыми словами представлять текст. В вебе используется главным образом для поиска.

2) Ключевые слова - слова или словосочетания, по которым пользователи ищут что-либо в сети интернет.

Набор ключевых слов документа называют поисковым образом документа. Набор ключевых слов близок к аннотации, плану и конспекту, которые тоже представляют документ с меньшей детализацией, но лишён синтаксической структуры.

Когда используют термин «ключевое слово», подразумевают несколько близких, но не сводимых друг к другу понятий:

● Ключевое слово в анализе текста (в том числе, и в поисковых системах) — набор слов, представляющих содержание текста и получаемых лингвистическими и математическими методами (например, анализируя частоту появления слова в тексте).

● В HTML ключевые слова в тексте помечаются с помощью специальных тегов (strong, em, теги заголовков), то есть эксплицитно. Это открывает пространство для злоупотреблений (например, может подтолкнуть автора к выделению как можно большего фрагмента текста, чтобы увеличить число слов, по которым он будет легче находиться). Поэтому поисковые системы ориентируются на ключевые слова, выделяемые в результате анализа, а авторское выделение принимают как дополнительную информацию.

● Ключевые слова могут не присутствовать в тексте, а только подразумеваться в нём. В HTML для задания таких ключевых слов есть элементы HTML meta с атрибутом keywords. Такой путь задания ключевых слов открывает ещё больше возможностей для злоупотребления, поэтому практически не воспринимается поисковыми системами. Однако, их используют другие пользовательские агенты (например, веб-браузеры для поиска по закладкам).

● В микроформатах XHTML ключевые слова, описывающие документ, представлены в виде списка ссылок, каждая из которых должна вести на страницу, содержащую список документов, также содержащих это ключевое слово. Таким образом, возможность злоупотреблений несколько уменьшается, поскольку каждая ссылка должна вести к реальному содержимому. Для таких ключевых слов чаще используются термины «теги», «метки», а на уровне кода реализуются они с помощью микроформата tag-rel.

Как выбрать правильные ключевые слова

Автор: alexandra.com

Перевод: dimok

Выбор правильных ключевых слов самый ответственный этап продвижения сайта в поисковых системах.

Ключевые слова – это слова, которые пользователи вводят в поисковую систему, чтобы найти интересующую их информацию. В отличии от ключевых слов, ключевые фразы подразумевают два и более слов, из которых пользователи конструируют запрос, например, “автомобили” – это ключевое слово, а “грузовые автомобили” – ключевая фраза.

Важно, чтобы ваш сайт находился по правильным ключевым словам и фразам. “Правильные ключевые слова” – это ключевые слова, которые задают ваши потенциальные клиенты.

Высокие позиции в поисковых системах по неправильным ключевым словам не принесут вашему бизнесу клиентов. С другой стороны, вы получите множество новых клиентов, если ваш сайт будет оптимизирован под ключевые слова, которые ищут ваши потенциальные клиенты.

Для того, чтобы найти правильные ключевые слова и фразы для вашего сайта, делайте так:

Шаг 1: Создайте список ключевых слов

Многие люди думают, что они знают свои идеальные ключевые слова. Чаще всего они ошибаются. Причина заключается в том, что очень сложно абстрагироваться от своего бизнеса и постараться выяснить, как думают ваши клиенты.

Помочь в поиске ключевых фраз лучше всего могут ваши клиенты, друзья и другие люди не из вашей компании. Просто спросите у них, как бы они искали то, что вы предлагаете. Для владельцев бизнесов часто бывает сюрпризом то, что их клиенты не говорят на том же языке, что и они.

Шаг 2: оцените получившийся список ключевых фраз

Как только вы составили список ключевых фраз, вам необходимо определить, какие фразы могут дать больше трафика. Вам следует руководствоваться следующими характеристиками:

a) Популярность

Люди должны действительно использовать эти ключевые фразы при поиске. Сервисы типа Wordtracker (в Рунете: статистика запросов Яндекс.Директ) помогают оценить, сколько человек совершают поиск по каждой ключевой фразе.

Чем больше число, тем больше трафика вы можете ожидать от высоких позиций по этому ключевому слову.

Но, не останавливайтесь на этом этапе. Популярность ключевого слова недостаточна, чтобы решить, стоит ли оптимизировать сайт именно под него.

б) Релевантность и специфика

Эти два аспекта столь же важны как и популярность ключевой фразы. Предположим, вы хотите получить высокие позиции в поисковых системах по запросу “автомобили”. Предположим также, что вы всего лишь дилер автомобилей Тойота в Туле.

Несмотря на то, что “автомобили”, скорее всего, намного популярнее, чем “автомобили Тойота” или “дилер Тойота в Туле”, ключевое слово “автомобили” также буду использовать люди, которые ищут и Ауди, и БМВ или даже журнал об автомобилях.

С третьей, более длинной фразой “дилер Тойота в Туле” вы можете быть уверены, что больший процент посетителей будут искать именно то, что вы предлагаете. По многословным фразам, кроме того, легче добиться высоких позиций в поисковых системах, потому что у них конкуренция меньше.

в) Мотивация пользователя

Также важно понять мотивацию пользователя. Когда пользователи ищут “автомобили” или “автомобили Тойота”, возможно, они хотят лишь больше узнать об автомобилях или об автомобилях Тойота. А люди, которые ищут “дилер Тойота в Туле”, заинтересованы в покупке машины.

Даже при условии, что первые два запроса могут иметь большую популярность, последняя фраза принесет лучшие результаты. Даже едва различимая разница между ключевыми фразами может повлиять на качество трафика, который они привлекают. Например, если ключевая фраза содержит слово “бесплатный”, то вряд ли она привлечет вам посетителей готовых что-либо купить.

Поиск правильных ключевых слов крайне важен для ваших кампаний по продвижению сайтов в поисковых системах. Высокие позиции по неправильным ключевым словам могут дать лишь незначительные результаты.

Если вы начнете свою кампанию по продвижению в поисковых системах с этих шагов, вы поразительно увеличите эффективность вашего сайта.

Глобальные информационно-поисковые системы

Пользователи могут попасть на некоторый сайт тремя путями. Во-первых, по заранее известному (например, из рекламы) адресу. Во-вторых, по ассоциативным ссылкам, ведущим с других сайтов. Но большинство из них приходит по ссылкам, генерируемым глобальными информационно-поисковыми системами. Поэтому понимание механизма работы этих систем необходимо для успешного продвижения собственного сайта.

Кроме того, в силу своей популярности, глобальные ИПС задают стандарты поиска (например, в области оформления результатов), и этих стандартов следует придерживаться, разрабатывая внутреннюю поисковую систему своего сайта.

Глобальные информационно-поисковые системы рассматривают всемирную паутину World Wide Web как единую полнотекстовую базу данных. Их задачей является выборка тех документов, которые удовлетворяют информационную потребность пользователя. Пользователь выражает свою информационную потребность посредством поискового запроса, сформулированного на некотором информационно-поисковом языке.

Работа глобальных информационно-поисковых систем проходит в три этапа:

Сбор страниц

Поисковый робот — это программа, осуществляющая автоматическое сканирование Web-ресурсов на предмет появления новых, модификации существующих и удаления старых Web ресурсов. Процесс сбора страниц роботы начинают с определенного количества отправных URL и продолжают его, следуя по ссылкам с этих документов. Отправные URL-адреса либо подаются людьми, претендующими на регистрацию в поисковой системе, либо формируются из доменных имен, перечисленных в соответствующем реестре.

Индексирование страниц

На данном этапе роботы просматривают различные компоненты страницы с целью определить ее назначение. Анализируется заголовок страницы (тег < TITLE> ), содержимое служебных тегов < META> (с помощью которых автор страницы может самостоятельно определить для нее набор ключевых слов), заголовки разделов документа, комментарии к рисункам (атрибут alt тега < IMG> ) и собственно текст документа. Каждый аспект страницы может иметь определенную значимость, также принимается во внимание частота и расположение в фактическом тексте определенных слов.

Не всякое содержимое страницы имеет значение для поисковой системы. Например, существуют стоп-слова — это те слова, которые система игнорирует, поскольку они считаются слишком распространенными, чтобы нести информацию о назначении страницы (например, артикль the в английском языке).

Когда страница проанализирована на предмет наличия всевозможных ключевых слов, она получает определенный рейтинг в сравнении с другими страницами, содержащими те же ключевые слова. Затем поисковый образ страницы, содержащий ее URL и рейтинг ключевых слов, сохраняется в базе данных поисковой системы.

Формирование рейтинга представляет собой одну из наиболее секретных частей работы поисковой системы. Секретность обусловлена: а) конкурентной борьбой поисковых систем и б) попытками надувательства системы недобросовестными пользователями, которые пытаются создать своей странице необоснованно высокий рейтинг.

Почти любая поисковая система учитывает при составлении рейтинга число входящих ссылок. Чем больше других сайтов ссылаются на данную страницу, тем больше будет ее рейтинг. Кроме того, из названий внешних ссылок берутся дополнительные ключевые слова, которые будут характеризовать страницу.

Проблемы поисковых систем

1. Ограничения на индексирование динамических страниц. На крупных специализированных сайтах контент структурирован и распределен по базам данных. Страницы таких сайтов не хранятся на сервере в готовом виде, а генерируются динамически (например, с помощью PHP). (Например, на сайте про кино пользователь вводит в поля формы название нужного фильма или фамилию режиссера.) Поисковые роботы понятия не имеют, какого рода информация может быть введена в поля формы, чтобы получился результат. Поэтому все динамически генерируемые страницы (количество которых все возрастает) остаются вне поля зрения поисковых систем.

2. Недобросовестные действия пользователей. С целью привлечь на свою страницу максимум посетителей, разработчики используют различные приемы обмана поисковой системы. В основном эти приемы сводятся к использованию на странице «фальшивых» ключевых слов в служебных тегах. Эти «фальшивые» слова не отображаются при просмотре страницы в браузере и не имеют никакого отношения к назначению страницы. «Фальшивые» слова подбираются из наиболее востребованных пользователями тематик. Разработчики поисковых систем при индексации страниц должны уделять большое внимание отсечению подобных ресурсов.

3. Индексация страниц с ограниченным доступом. Поисковый робот, перемещающийся по ссылкам внутри ресурса, не способен отличить страницу, предназначенную для бесконечно широкого круга посетителей, от страниц, которые используются, например, только сотрудниками компании. Таким образом, поисковая система может случайно предоставить пользователю доступ к конфиденциальной информации (например, к коммерческой тайне), что служит источником судебных исков против системы.

Существует способ «защитить» свою страницу от индексации поисковым роботом. Для этого используется файл robots.txt, который размещается в корневом каталоге сайта и содержит список запретов всем поисковым системам (или только конкретным) анализировать определенные участки сайта. Аналогичного результата можно добиться с помощью тега:

< META name = “robots” content = “noindex”>

Приведенный тег означает, что данная страница не предназначена для индексирования. Можно так же проинформировать робота, что ему не следует идти по ссылкам с этой страницы:

< META name = “robots” content = “noindex, nofollow”>

Создание системы поиска

Следующая последовательность шагов обобщает процесс добавления к сайту поисковой системы.

1. Выбор объектов индексирования. Далеко не всегда представляется необходимым индексировать все страницы сайта. Обычно присутствует определенная область, в которой пользователю понадобится вести поиск. Ей и следует ограничиться.

2. Выбор метода индексирования информации.

— система автоматически добавляет в индекс все слава, встречающиеся на рассматриваемых страницах;

— система автоматически добавляет в индекс все слова из определенных областей страниц (например, ограничивается заголовками);

— существует специальный словарь с ключевыми словами для поиска и слова из этого словаря сопоставляются конкретным страницам вручную.

3. Выбор модели поисковой системы. Вместо разработки собственного «движка» можно ознакомиться с рынком имеющихся моделей и приобрести ту, которая наиболее подходит для условий, установленных на шаге 1 и 2.

4. Разработка интерфейса поиска.

5. Разработка страницы результатов.

6. Индексирование информации. Поисковая система просматривает весь сайт, имеющийся на настоящий момент и создает его индекс. Может возникнуть необходимость оптимизировать индекс вручную.

7. Интегрирование поисковой системы с интерфейсом поиска.

8. Тестирование и наблюдение.

Интерфейс поиска

Поисковая система (если она есть) должна быть доступной с каждой страницы сайта. При этом есть два варианта доступа:

— На каждой странице сайта в одном и том же месте размещается поле для ввода поискового запроса (и соответствующая ему кнопка Search). Это решение может подойти по стилю не каждому сайту.

Главная проблема — сделать так, чтобы поисковая система не сильно бросалась в глаза, не мешала основной функции страницы (доставке контента), но в то же время моментально находилась бы при необходимости.

— Поисковая система выполнена в виде отдельной страницы сайта, ссылка на которую включена в набор сервисов глобальной навигации.

Поисковая страница (как и страница результатов поиска) должна быть выполнена в стиле всего сайта. Это правило зачастую нарушается, т.к. эта страница, как правило, разрабатывается другими людьми — техническими специалистами.

Лучший дизайн поисковой страницы минималистичен. Обязательные элементы — поле для ввода запроса и кнопка начала поиска.

Если на сайте поддерживается возможность расширенного поиска (или используется собственный язык запросов), она должна быть легко доступна, но не отображаться по умолчанию, чтобы не отпугивать количеством разнообразных опций спешащего пользователя. Идеальный вариант реализуется с помощью JavaScript: при щелчке по кнопке (или ссылке) «расширенный поиск» на странице появляются дополнительные поля.

Если для поиска необходимы инструкции (например, предупредить пользователя, что ключевые слова учитываются только в названиях материалов или научить пользоваться специальным языком запросов), то они должны быть легко доступны, но не отображаться по умолчанию. Пользователь, знакомый с сайтом, не должен отвлекаться. «Инструкции» и «Расширенный поиск» лучше всего реализовать в одном стиле.

Дизайн страницы результатов

Страница результатов должна предоставлять пользователю максимальный объем информации, чтобы он сразу мог определиться, какие результаты ему понадобятся. Её могут составлять следующие элементы:

Исходный запрос. Обязательно. Пользователь не должен вспоминать, какие именно параметры он указал в своём запросе.

Диапазон поиска и найденные результаты. Стоит продемонстрировать общее число просмотренных документов и количество найденных совпадений (например, просмотрено 5000 документов, обнаружено 15 совпадений). Первый параметр даёт косвенную характеристику объему сайта.

Контекст текущего результата. Должен присутствовать индикатор, демонстрирующий, какую часть результатов пользователь просматривает в данный момент (например, 3 страница из 9).

Заголовки страниц или документов. Каждый найденный документ должен быть четко озаглавлен.

Краткое содержание. Можно взять несколько первых строк найденного документа или несколько строк, входящих в окружение искомого термина. Желательно предоставить пользователю возможность опционально отключать этот элемент, поскольку краткое содержание резко увеличивает объем страницы результатов.

Дата и время. Следует показывать как дату создания, так и дату последнего обновления найденных документов.

Тип результата. Если кроме HTML-страниц могут быть выданы данные в виде файлов документов их формат (документ Microsoft Word или Acrobat Reader) должен быть обязательно указан.

Важность результатов (релевантность найденного документа запросу). Может выражаться в неявном виде — путем определенного порядка следования результатов.

Совпадение ключевых слов. Следует указать какие именно ключевые слова совпали — лучше всего путем выделения (цветом или начертанием) их среди окружения. Пользователей сильно раздражает, когда они не могут понять, почему данная страница включена в ответ на их запрос.

Навигация. Среди множества результатов должно быть легко перемещаться. Это можно реализовать с помощью перечня страниц результатов, а так же ссылок «Следующие 10 результатов», «Предыдущие 10 результатов», «Первая страница». Пользователь должен иметь возможность настраивать число результатов на одну страницу.

Уточняющий запрос. Пользователь должен иметь возможность провести дополнительный поиск внутри уже полученного набора результатов.

Основными элементами являются исходный запрос и заголовки найденных страниц. Все остальные должны выглядеть по возможности менее броско, чтобы не мешать пользователю быстро пробегать глазами вниз, оценивая результаты.

Моделирование общения.

Проблематика КЛ часто связывается с моделированием общения, в частности, с обеспечением общения человека с ЭВМ на естественном или ограниченном естественном яз-е. + компьютернные модели общения часто используются для изучения самого процесса общения.

Изучение накопившегося опыта эксплуатации компьютерных систем позволило исследователям по-новому взглянуть на функции и структуру коммуникации. Рассматриваются вопросы: что обеспечивает естественность общения? Каковы условия связности беседы? Когда общение оказывается успешным? В каких случаях возникают коммуникативные неудачи и можно ли их избежать? Какие стратегии общения используют участники коммуникативного действия при достижении своих коммуникативных целей?

Одной из наиболее интересных компьютерных моделей диалога, вызвавшей оживленные теоретические дискуссии, была программа Джозефа Вейценбаума " Элиза" (1й вариант в 1966), программа-имитатор, целью которой является не моделирование мышления в точном смысле, а моделирование речевого поведения – ограниченные программные ресурсы, лингвистический анализ и синтез были сведены к минимуму.

Программама " Элиза" была испытана группой исследователей во главе с М. Макгайром для изучения структуры диалога и особенностей е.-я. коммуникации. В эксперименте с " Элизой" беседовали в течение часа 24 испытуемых. 15 участников (62 %) были уверены, что им отвечал человек, 5 испытуемых (21 %) обнаружили определенные колебания и лишь четверо участников (17%) были абсолютно уверены, что общались с ЭВМ. С лингвистической точки зрения алгоритмы программы " Элиза" включают минимум лингвистической информации.

Во-первых, это комплекс ключевых слов, которые актуализуют некоторые устойчивые коммуникативные формулы (шаблоны).

Во-вторых, способность относительно несложно трансформировать предшествующее высказывание (ex: программа в состоянии переделать предшествующее утверждение в общий вопрос).

Выводы: 1)проявление важнейшей особенности ком-ции на е.я.: е.-я. дискурс очень терпим по отношению к сбоям и ошибкам - он избыточен и помехоустойчив. => ч-к склонен наделять смыслом то, что часто смысла не имеет (испытуемые сами порождают смысл диалога, сами обеспечивают его связность, сами приписывают партнеру коммуникативные интенции).

2) испытуемые старались установить кто перед ними – компьютер или человек (т.е. ролевые характеристики партнера) как можно раньше: 22 участника из 24 уяснили для себя ситуацию не более, чем за 5 реплик. Определение ролей в коммуникации относится к метауровню общения, т.к. это составляет одну из предпосылок успешной коммуникации, предохраняющей общение от многочисленных коммуникативных неудач. Это свойство е.-я. коммуникации можно назвать принципом приоритета метакоммуникативных параметров ситуации общения.

3)связано с существованием различных типов коммун-го взаимодействия между людьми. Успешное взаимодействие между человеком и программой типа " Элиза" возможно только в ситуации, когда происходит так называемое " ассоциативное общение", при котором реплики диалога связаны не столько логическими отношениями типа " причина - следствие", " посылка - заключение", а ассоциациями. Элиза не обладала ассоциативной базой => одна из типичных стратегий " ухода от непонимания", реализованная в программе - смена темы беседы.

4) неуниверсальность правил коммуникативного взаимодействия. Каждый тип коммуникации обслуживается своим набором относительно простых правил, обеспечивающих связность дискурса, его осмысленность для участников. Из экспериментов М. Макгайра с программой " Элиза" следует, что кроме ассоциативного способа общения, выделяется еще " решение задач", " задавание вопросов" и " уточнение понимания".

 

Словари vs. энциклопедии.

Ллингвистические словари:

1) описываются слова – их значения, особенности употребления, структурные свойства, сочетаемость, соотношение с лексическими системами других языков (для двуязычных словарей) и т.д.

2) Словники лингвистических словарей включают все части речи.

3) слово описывается с точки зрения его языковых и речевых характеристик (ему сопоставляется, например, толкование, комплекс грамматических и стилистических помет, данные о происхождении и т.д.)

Энциклопедические словари:

1) описывается область понятий, фактов и реалий; для обозначения этой области иногда используется термин «эктралингвистическая информация».

2) Словники энциклопедических словарей включают преимущественно существительные и именные группы.

3) словарная статья энциклопедии может включать самую различную информацию – прежде всего нелингвистическую, передаваемую в текстовой и изобразительной форме (в виде рисунков, фотографий, диаграмм, карт и пр.)

Еще один тип словарей, сочетающих в себе черты лингвистических и энциклопедических, – это различные терминологические словари. Их можно считать лингвистическими словарями подъязыков конкретных отраслей знания и/или видов профессиональной деятельности (например, техники или экономики), тогда как с точки зрения общелитературного языка содержащаяся в них информация является скорее экстралингвистической.

Данные эксперимента.

Принципиально новым источником лексикографических данных, ис­пользуемым в нашем словаре, является лингвистический эксперимент. Он имеет двоякое назначение. Во-первых, результаты эксперимента, наряду с тек­стовыми и другими данными, являются основанием для выводов о природе рассматриваемых фактов и для соответствующих лексикографических ре­шений. Во-вторых, они определяют характер нормативных указаний о пра­вилах употребления синонимов.

Сущность лингвистического эксперимента, как он практикуется в по­давляющем большинстве современных работ, состоит в следующем. Изуча­емая языковая единица рассматривается в коротком контексте, в котором можно опускать или добавлять какие-то единицы, заменять одни единицы другими, варьировать порядок их следования и т.п. Разнообразные эффек­ты таких преобразований сводятся к следующим типам: 1) продукт преоб­разования либо обладает свойством языковой правильности (так можно сказать), либо нет (так сказать нельзя); 2) если получился правильный объект, он молсет находиться либо в отношении подобия (в частном случае — синонимии), либо в отношении различия (в частном случае — омони­мии) к исходному объекту. Эти эффекты служат основанием для выводов о семантических, синтаксических и иных свойствах языковых объектов их классах и правилах их использования.

 

Основные возможности

10 языков: английский, немецкий, французский, итальянский, испанский, китайский, турецкий, украинский, русский и латинский

Толковый словарь английского языка

Общелексические, тематические и лингвострановедческие словари

Толковый словарь русского языка

Самая современная, постоянно обновляемая лексика

Подробные словарные статьи

Средства для изучения языка

Озвученные дикторами слова

Более 130 дополнительных бесплатных словарей

Установка на компьютер или ноутбук, карманный компьютер и смартфон.

Новые возможности

Новый интерфейс и поиск

В ABBYY Lingvo 12 реализован новый способ показа переводов. Результаты перевода представлены в одном окне в виде списка словарных карточек, найденных в разных словарях. Правая панель обеспечивает удобную навигацию по карточкам.

В том случае, когда нужного слова в заголовках словарных статей не оказалось, автоматически запускается поиск по тексту всех словарей. Нужное слово будет найдено, если оно хотя бы один раз встречается в любом месте любого словаря ABBYY Lingvo.

 

Терминологические тезаурусы. Специфика связей между терминами одного подъязыка и ее отражение терминологическими тезаурусами. Исследование системности терминов в «Тезаурусе по теоретической и прикладной лингвистике» СЕ. Никитиной (1978).

 

Подготовка исходного текста

Некоторые требования к тексту в целом таковы. Первое - в нем не должно быть переносов. Если вам достался текст с переносами, не отчаивайтесь: многие редакторы (например, Лексикон) могут автоматически переформатировать текст так, что переносы уберутся (а целостность слов, конечно, сохранится). Второе - длину строки надо сделать не более 70 знаков (включая, естественно, пробелы, знаки препинания и прочие символы). Изменить длину строки, если она слишком большая, также можно в редакторе. И третье внимательно проследите, как в тексте представлены тире. Они обязательно должны быть окружены пробелами (иначе тире воспримется как дефис, и два слова сольются в одно - с дефисом). В этом вам тоде может помочь редактор - там есть команда поиска любой строки символов.

Но вот текст вычитан, исправлен. Что дальше? Прежде всего подумайте, что вы хотите получить из текста, какую информацию. Если текст совершенно однороден (для вас), то есть все слова и все фрагменты текста совершенно равноправны, то с ним почти ничего не надо делать. Вот тот минимум, который необходим в любом случае и достаточен - в простейшем.

1. Разделите ваш текст на модули - такие куски текста, каждый из которых занимает не более 60 Кбайт, т.е. не более 60 тысяч символов, включая и все знаки-не буквы. Для компьютера все равно, но для вас будет лучше, если это будет какое-то осмысленное членение: на главы, стихотворения, акты (для драмы). Каждый модуль в начале должен иметь имя, а в конце - признак конца. Имя модуля располагается в начале его, перед началом вашего текста, на отдельной строке, с самого начала строки, т.е. с первой позиции.

2. Еще одна необходимая вещь - нулевой модуль. Он должен находиться перед модулями текста, в начале файла. Этот модуль, имя которого состоит из любого допустимого количества нулей, содержит так называемую схему модуля, описывающую некоторые особенности структуры вашего текста. В самом простейшем случае нулевой модуль может быть пустым. В общем же случае схема содержит атрибуты и маркеры. Маркеры определяют дальнейшее членение модуля (если необходимо), и о них мы расскажем позже. Атрибуты задают название корпуса, администратора данных и список знаков препинания (каждый атрибут необязателен).

Синтаксические

В английском языке подлежащее выполняет другие функции, кроме субъекта действия (время, пространство, причину, объект).

В английском чаще используется страдательный залог.

He was met by his sister. The door was opened.

Простое предложение меняется на сложное при переводе простых предложений со сложными конструкциями.

Harry gasped, deflated. Гарри открыл от изумления рот, словно из него выпустили весь воздух.

I like watching her dance. Я люблю смотреть как она танцует.

Сложное предложение переводится простым, разбиение предложений, объединение.

Модели перевода

I. Ситуативно-денотативная модель (Розин, Розенцвейг)

Денотат – предмет реальной действительности.

1). восприятие текста оригинала (анализ значений языковых знаков и связей между ними)

2). складывается представление об описываемой действительности

3). описание ситуации средствами другого языка (интерпретация)

+ обращение к реальной действительности

– слабая объяснительная сила

перевод vs. интерпретация

II. Трансформационная модель (Швейцер)

поверхностные структуры vs. ядерные структуры

1). анализ (внутриязыковая трансформация)

структура оригинала → ядерная структура ИЯ

2). перенос ядерная структура ИЯ → в ядерную структуру ПЯ

3). синтез ядерная структура ПЯ → в поверхностную структуру ПЯ

+ сопоставительное изучение разноязыковых форм

→ переводческая эквивалентность → теоретическая база

+ типы переводческих трансформаций

– Как делается выбор в синтезе?

– слабая объяснительная сила

III. Семантическая модель (Кетфорд)

релевантные vs. нерелевантные семы

Не все семы включать в ЯП

Например: студент – обучающийся, учащийся в ВУЗе, муж. пол., 1 лицо

student – сема «пол» нерелевантная

Количество элементарных смыслов различается

Чем больше сем совпадают, тем лучше перевод.

+ хорошая объяснительная сила

релевантные vs. нерелевантные семы

– не объясняет переносные значения и ассоциации

IV. Трехфазовая модель

О – отправитель, П – получатель, Т – переводчик

1) декодирование

2) перекодирование

3) реализация текста

О Текст язык1 П|Промежуточное звено | О Текст язык 2 П1

+ четко выделенные этапы

+ полифункциональность действий переводчика

+ последовательность операций переводчика

– сам процесс непонятен

V. Интерпретативная модель (Семскович, Ледерер)

Смысл идеи строится из языковых единиц, но не складывается из суммы смыслов языковых единиц.

1) создание текста оригинала

2) понимание переводчиком смысла (центральный этап)

3) порождение текста на ПЯ

Интерпретация (смысл идеи) vs. Перевод (перекодировка с одного языка на другой)

Девербализация – отвлечься от языковых единиц и передать содержание.

Фраза вне контекста может трактоваться как угодно.

– критика, Комисаров

1. слишком большое внимание интуитивно-непосредственному в речи

2. необоснованное возвышение устного перевода над письменным

3. роль языка в создании смысла текста не сводится к языковому содержанию

4. смысл как нечто неповторимое, создается в данный момент

Критика: смысл не может быть полностью субъективным

Доказательство: нет интерпретации языков. Обращать внимание не на форму, а на содержание.

II. Научно-учебный текст

учебники, учебные пособия, тексты специальных энциклопедий

Задача: передать одно из специализированных знаний с целью повышения компетенции реципиента

Источник: профессионал в данной области

Реципиент: разные. Для взрослых/детей – ориентация на передачу когнитивной информации, средства примерно те же, но в сокращенной форме.

Плотность информации другая: вспомогательные знаковые системы вербального/невербального характера: схемы, графики, иллюстрации.

Термины: меньше.

Меньше слов абстрактной семантики. Прямое обращение к читателю (побуждение).

 

IV Энциклопедические тексты

Тип информации: примарно-когнитивный

Задача: получение первичных достоверных сведений о том, о чем читатель мало знает. Сообщаются общепринятые оценки предметов и явлений.

Автор: коллектив экспертов. За составление статей отвечает редакция.

Ведущая информация: когнитивная. Номинативность, терминология.

Средства компрессии (самый компрессивный из всех видов текстов): сокращения, аббревиатуры, числовая информация. Предложения простые, опускаются союза и наречия. Время – настоящее, прошедшее.

Фон: литературная норма.

Термины имеются, но самые распространенные или со ссылками на другие статьи.

В основном текст лишен эмоциональности, но есть необходимость в общепринятых оценках, следовательно имеется оценочная лексика.

Мера переводимости высокая.

 

28. Релятивные базы данных и возможности их использования в прикладных лингвистических целях. Типовая структура релятивной базы данных (таблицы и типы полей, нормализация, запросы, типы запросов). Access-приложения как релятивные базы данных.

Реляционная модель данных

На основе инфологической модели данных разрабатывается даталогическая модель, которая учитывает особенности функционирования конкретной СУБД. В настоящее время наиболее распространены СУБД, в основе которых лежит реляционная модель.

Реляционная база данных — это совокупность таблиц, содержащих всю информацию, которая должна храниться в БД.

1. Каждая таблица состоит из однотипных строк и имеет уникальное имя.

2. Строки имеют фиксированное число полей (столбцов) и значений. В каждой позиции таблицы на пересечении строки и столбца всегда имеется в точности одно значение или ничего.

3. Строки таблицы обязательно отличаются друг от друга хотя бы единственным значением, что позволяет однозначно идентифицировать любую строку такой таблицы.

4. Столбцам таблицы однозначно присваиваются имена, и в каждом из них размещаются однородные значения данных (даты, фамилии, целые числа или денежные суммы).

5. Полное информационное содержание базы данных представляется в виде явных значений данных, и такой метод представления единственный. Не существует каких-либо специальных " связей" или указателей, соединяющих одну таблицу с другой.

6. При выполнении операций с таблицей ее строки и столбцы можно обрабатывать в любом порядке безотносительно к их информационному содержанию.

Реляционная модель была разработана в конце 60-х годов математиком Э.Коддом на основе математического аппарата теории множеств. Рассмотрим формальное описание этого аппарата.


Поделиться:



Последнее изменение этой страницы: 2017-03-14; Просмотров: 394; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.127 с.)
Главная | Случайная страница | Обратная связь