Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Правила в фрагментационном анализе



В фрагментационном анализе можно выделить три группы правил:

1.    Правила, уничтожающие некоторые омонимы. В отличие от постморфологических они рассматривают не только ближайшее окружение слова, но весь фрагмент или все предложение.

2. Правила, устанавливающие иерархию. Это правила, которые включают данный фрагмент в непосредственно соседний.

.   Правила, которые объединяют два дистантно расположенных фрагмента или группу контактных (непосредственных соседей). При этом все объединявшиеся фрагменты уничтожаются и создается один большой фрагмент. Его границы определяются стандартно из границ объединенных фрагментов; заполнение других полей в структуре фрагмента определяется каждым правилом отдельно.

Порядок применения правил

Начальное разбиение предложения

Расстановка границ

По всем знакам препинания и сочинительным союзам без запятой проводятся границы фрагментов. Исключения:

1.    Граница не проходит по тем знакам препинания, которые входят в состав определенных графематическим анализом единиц (сокращения, дробные числа, букво-числовые комплексы и др.);

2. В том случае, если несколько знаков препинания идут подряд, по ним проходит одна граница. (Не строится фрагментов, не содержащих ни одного слова).

Правило о двух предикатах в одной клаузе

Список глаголов ГС = {давать, становиться, оказаться}

Список значений частей речи, которые могут принимать предикаты

ПС = {VERB (гл. в личн. форме), ADVERB_PARTICIPLE (деепричастие), ADJ_SHORT (кр. прил.), PARTICIPLE_SHORT (кр. прич.), PREDK (предикатив)}

В одной клаузе не может находиться две словоформы, все омонимы которой ПС & ГС. В случаях, когда возникает такая ситуация (опечатка или ошибка морфологии), перед вторым предикатом восстанавливается запятая. Данное правило работает внутри правила расстановки границ и учитывает информацию об аналитических формах. Примеры для клауз исключений, содержащих словоформы из ГС: «давайте будем дружить», «Ему там могло бы за это время стать совсем скучно» и т.д.

Алгоритм интерпретации клауз с тире и восстановления тире в клаузах с нулевым Копулом, написанный для Синтаксиса

Правило 1.

Если мы видим тире, то идем от него направо и налево. Пусть С1 - клауза слева от тире, а С2 - клауза справа. Осуществим следующую проверку: ищем в С1 и в С2 глагол в личной форме или предикатив, если находим, то алгоритм обрывается.

Правило 2.

Если непосредственно слева от тире стоит запятая, (дом, построенный на холме, - большой), то это говорит о конце причастного оборота (P1) либо деепричастного, либо оборота с вершиной «который», либо вводного слова, мы ищем его начало (вершины «причастие», «деепричастие», «который», «вводное слово»), и группу (слово), которая им управляет (R1). Затем мы объединяем R1, P1, C2 в одну клаузу «тире».

Правило 3.

Восстановление тире.

Работа производится на этапе первоначальной фрагментации. Мы имеем первоначальный фрагмент.

Если фрагмент не «Пустыха», то мы выходим из работы алгоритма. Если фрагмент имеет вариант «Пустыха», то мы все равно выходим из работы алгоритма.

Алгоритм не восстанавливает тире в клаузах с двумя инфинитивами («жить все равно что родине служить») по той причине, что случаев, требующих восстановление тире, много меньше, чем случаев, где восстановленное тире - ошибка («Он еще поигрался с этой мыслью, прежде чем позволить ей удалиться.»)

случай (тип клаузы ТИРЕ)

Определяем в составе:

 


Таблица 1

Первое слово Второе слово Пример
С, им. С/МС, им. «маша красавица»
С, им. П, им «Маша красивая»
МС, им С/МС, им «Она красавица»
МС, им П, им «Она красивая»
«это» С/МС, им., «Это Маша»
«у»+С/МС, рд С/МС, им «У соседей ссора»

 

Дополнительные условия:

1.    Прилагательное может стоять только справа от существительного или местоимения.

2. Существительное с большой буквы может стоять только слева (кроме случаев с «это» и «у+рд»).

.   Все части речи неомонимичны, в том числе не должно быть падежной омонимии (типа «глазок» - С, ед. им., или С, мн. рд), за исключением случая омонимии С, им, ед, но, С, вн, ед, но (стол - стол) и омонимии С ед, мн, им (дело-дела). В противном случае алгоритм обрывается.

.   Тире не может восстанавливаться непосредственно перед запятой и другими знаками препинания.

.   Тире не восстанавливается, если в одной из клауз есть инфинитив, даже если он омоним («вести свое хозяйство на крестьянский лад»). Если состав фрагмента определен согласно таблице 1, то во фрагменте восстанавливаем тире и тип фрагмента становится «ТИРЕ». Если мы имеем «это» + С им, ср» и хотя бы еще один претендент на восстановление тире по вышеуказанным правилам («это окно белое»), то мы после «это» тире не восстанавливаем.

.   Если в клаузе есть предлог («покушение на жизнь», «в стол рукопись»), то тире не восстанавливается, за исключением предлога «у» («Ссора у соседей»)

.   В случаях, требующих восстановления тире, последнее восстанавливается после первого слова («Покушение - по-человечески жизнь.»)

.   В клаузе не может восстанавливаться больше одного тире. В случае, если одно тире уже есть или восстановилось, то процедура обрывается. (тире не строится после «это» в примере «Мир - это сон»)

К МС мы приравниваем здесь также местоименные прилагательные «один», «каждый», «другой», «тот».

случай (тип клаузы КОПУЛ)

 

Таблица 2

С, им. + как словно будто что точно как будто С, им. «Иван что герой»

 

Корпус примеров.

Там, где есть тире, Синтаксис именует клаузу «ТИРЕ», где тире нет, там оно восстанавливается и Синтаксис именует клаузу «ТИРЕ». Примеры, выделенные жирным шрифтом, не обрабатываются в соответствии с указанными после них правилами.

«Петя - человек»

« вести свое хозяйство на крестьянский лад» (см правило 5)

«жить все равно что родине служить» (см правило 3)

«дом, построенный на холме, - большой»

« Вчера в лесу мы работали старой пилой, а сегодня во дворе - новой». Определение типа фрагмента

Типом фрагмента может быть ровно одно значение из списка. Начиная с первого значения из списка, по порядку проверяется есть ли в данном фрагменте слово этой части речи. Если такое слово найдено и у него нет омонимов других частей речи, то дальнейшие поиски прекращаются и тип фрагмента - значение, на котором остановились. Если для данного значения из списка не нашлось неомонимичных (с точностью до части речи) подходящих слов, но есть омонимичные, тогда для фрагмента не устанавливается однозначно тип, а постулируется несколько вариантов, которые либо уничтожатся на уровне семантики, либо останутся в выходной структуре.

Пример: на этот раз она не права

Для этого фрагмента есть два варианта:

1. Тип фрагмента - краткое прилагательное (права - ж.р., ед. ч. от правый)

2. Тип фрагмента - пустыха (права - и.п./в.п. мн. ч.; р.п. ед. ч. от право)

Пример: мои права забрали в милиции

Для этого фрагмента тип определяется однозначно, т.к. забрали - неомонимичный глагол в личной форме. Глагол в личной форме стоит в списке на первом месте, дальнейшие поиски возможных вершин фрагмента не ведутся.

Алгоритм выявления ВВОДНЫХ

Проверка клаузы на наличие вводных слов.

Если найдено слово из списка 1 вводных слов (см. ниже), при этом оно ограничено с обеих сторон какими-либо знаками препинания из следующих:

1.    запятая,

2. точка,

.   вскл. знак,

.   вопр. знак,

.   точка с запятой,

.   тире,

.   двоеточие,

.   начало предложения (Бб),

.   конец предложения,

.   кавычки.

То это слово «ВВОДН»

Дополнительное правило:

Если слева от вводного слова стоит сочинительный союз или частица, не отделенные от него знаком препинания, то они включаются в клаузу «ВВОДН». («Она двинулась в путь, и наверно, быстро бы достигла цели, если бы не гроза.»)

Определение союзов и союзных слов фрагмента

Сначала определяется, нет ли такого сложного союза (из файла оборотов obor.dic), начало которого (слово с пометой Об1) находится в соседнем слева фрагменте, а конец (помета Об2) в данном. (Это такие сложные союзы, которые разделяются запятой, часто имеют варианты, при которых запятая стоит перед всем союзом - для того, чтобы; с тем, чтобы; потому, что и др.) Если такой союз есть, то он относится к данному фрагменту, т.е. к тому, в котором заканчивается. Далее все слова фрагмента, у которых есть омоним - союз, считаются союзами данного фрагмента. Эта процедура несовершенна и требует доработки с учетом индивидуальных особенностей отдельных союзов.

Работа с фрагментами

В правилах обработки фрагментов может использоваться как стандартная информация (см. структура фрагмента), так и сведения об отдельных словах.


Поделиться:



Последнее изменение этой страницы: 2020-02-17; Просмотров: 62; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.026 с.)
Главная | Случайная страница | Обратная связь