Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Поиск по реквизитам документа.



Поиск документов по реквизитам довольно прост, и уже на самых ранних этапах становления справочных правовых систем программные технологии позволяли эффективно решать такую задачу. Любая СПС сегодня позволяет найти документ по одному или нескольким его реквизитам. Расширенный перечень реквизитов документа позволяет быстро и точно искать запрашиваемый акт. Среди реквизитов, характеризующих документ, пользователь может указать номер и дату принятия документа, номер акта, вид акта, название органа, принявшего акт, дату и номер регистрации в Минюсте России, источник и дату опубликования. При этом можно задавать несколько однотипных реквизитов, соединяя их различными логическими условиями (И, ИЛИ, КРОМЕ), вместо точной даты задавать различные диапазоны времени и т.д. При определении конкретного критерия поиска пользователь может вывести на экран список всех данных по определенному им реквизиту, что позволит избежать ввода критериев, на которые заведомо отсутствуют документы.

Поиск по реквизитам документа это наиболее простой, удобный и очевидный способ поиска. Однако он применим только в тех ситуациях, когда точно известны реквизиты конкретного документа. Основная проблема заключается в том, что в большинстве реальных ситуаций чаще всего требуется поиск документов, точные реквизиты которых заранее неизвестны. Другими словами, нужно найти документы, зная только общий смысл проблемы.

 

Поиск по контексту.

Если неизвестны реквизиты искомого документа, но известно, о чем идет в нем речь, то можно попытаться найти его по контексту, то есть по словам и словосочетаниям, встречающимся в тексте документа. В СПС должна быть предусмотрена такая возможность. Очевидно, что программная реализация данного инструмента является более сложной задачей, чем реализация поиска документов по формальным реквизитам. Это определяется объективными причинами, связанными с богатством естественного языка общения людей между собой по отношению к формализованному описанию ограниченного числа характеристик документа (его реквизитов).

Действительно, слова могут входить в текст документа в различных грамматических формах (число, падеж и т.д.); словосочетания могут быть разбиты другими словами (например, в перечислении); авторы документов могут использовать синонимы или сокращения и т.д. При этом помимо учета указанных особенностей программные инструменты контекстного поиска должны обеспечивать быстроту этого поиска в огромном массиве информации. Технологии контекстного поиска в СПС претерпели наибольшие изменения за время существования СПС.

На ранних стадиях развития справочных правовых систем возможности этих технологий позволяли задать несколько слов или словосочетаний, входящих в текст документа, и соединить их простейшими логическими условиями (И, ИЛИ, КРОМЕ). Затем появилась возможность учесть близость нахождения заданных слов в тексте документа. Например, задав для поиска два слова - ГЛАВНЫЙ и БУХГАЛТЕР, - можно было реализовать следующие возможности:

·найти все документы, где встречается хотя бы одно из этих слов: для этого надо соединить их логическим условием ИЛИ;

·найти все документы, где встречаются оба заданных слова: для этого надо соединить их логическим условием И;

·найти все документы, где заданные слова располагаются недалеко друг от друга: для этого надо было дополнительно указать, что слова обязательно должны располагаться в пределах заданного количества строк или слов.

Стандартом для технологий поиска в СПС по тексту документа в настоящее время является предоставление пользователю возможности задать поисковое выражение на естественном языке, так, чтобы при поиске нужных документов система сама учла близость расположения слов в тексте, нашла документы, где заданные слова встречаются в любых грамматических формах (с любыми окончаниями). Более того, желательно, чтобы поисковые технологии позволяли также учитывать возможные сокращения и синонимы. При этом остается важным сохранение возможности делать вручную ряд «тонких» настроек, например, регулировать близость слов в поисковом выражении, осуществлять поиск слов в определенной форме с определенным окончанием и пр.

 


Поделиться:



Последнее изменение этой страницы: 2019-04-19; Просмотров: 742; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.008 с.)
Главная | Случайная страница | Обратная связь