Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Форма выдачи результатов поиска
Другим важным для потребителя системы фактором является форма представления результатов поиска. Результатами поиска могут быть номера документов, библиографические описания, рефераты или полные тексты документов в виде микрофильмов или копий. Форма выдачи оказывает существенное влияние на требования к точности. Потребитель скорее может примириться с низкими показателями точности системы, выдающей ему рефераты, чем с такими же показателями системы, которая выдает только библиографические описания или номера документов. Если система предоставляет потребителю рефераты найденных документов, для него не составит проблемы и не отнимет чересчур много времени просмотр даже сотни рефератов с тем, чтобы отыскать по ним, скажем, 10 полезных документов. В случае же, когда система выдает лишь библиографические описания, обычно бывает труднее решить, какие из документов представляют реальную ценность, так что потребитель вынужден обращаться уже к самим документам и должен просмотреть большое их число, чтобы в итоге найти среди них несколько действительно полезных. Если потребитель располагает только номерами документов, он должен обратиться непосредственно к первоисточникам или ко вторичному фонду рефератов, чтобы выявить источники, удовлетворяющие его потребностям. Разыскать и просмотреть 100 первоисточников, чтобы обнаружить среди них 10 действительно полезных, не всегда бывает приемлемо. Другими словами, потребитель системы может примириться с низким значением точности, если результаты поиска выдаются в форме, обеспечивающей возможность быстрого предварительного просмотра. Номера документов становятся эффективной формой выдачи лишь в тех случаях, когда техническое оборудование позволяет немедленно получить микрокопии соответствующих документов или их заместителей. Организационные требования Операторы и административный состав ИПС, очевидно, прежде всего заинтересованы в том, чтобы система как можно лучше отвечала требованиям потребителей. Удовлетворение нужд потребителей является первой целью, как оператора, так и администратора системы. Однако, разумеется, для руководства небезразлично, во сколько обходится удовлетворение нужд потребителей и каким альтернативными способами эта задача может быть решена. Таким образом, в экономической эффективности системы руководство заинтересовано в неменьшей степени, чем в ее рабочей эффективности. «Высшее звено управления» производит оценку системы на более высоком уровне - на уровне стоимости работы системы и экономической оправданности самого ее существования. Факторы, влияющие на характеристики ИПС Полнота индексирования К двум наиболее важным факторам, влияющим на полноту и точность поиска по указателю, относятся: а) полнота (exhaustivity) индексирования и б) специфичность (specificity) языка индексирования. Полнота индексирования характеризует ту степень, в какой все отдельные предметы (темы), обсуждаемые в конкретном документе, распознаются при индексировании и переводятся на язык системы. Предположим, что имеется документ, в котором речь идет только о шести предметах (А, В, С, D, Е, Р). Если, на стадии понятийного анализа при индексировании все эти предметы распознаются в отдельности и выражаются через соответствующие комбинации терминов языка индексирования, то можно сказать, что достигнута исчерпывающая полнота индексирования данного источника информации. Очевидно, что если все шесть предметов заиндексированы, документ может быть найден независимо от того, какие предметы или комбинации предметов содержатся в запросе. Таким образом, высокий уровень полноты индексирования обеспечивает и высокую полноту поиска. При уменьшении полноты индексирования снижается полнота поиска. Если понятие F не выделено и специально не учтено при индексировании данного документа, он никогда не сможет быть найден в указателе в ответ на запрос о литературе, в которой говорится о F (если только термины, использованные для описания F в запросе, случайно не окажутся связанными иерархически или другим путем с терминами, использованными для описания понятий А-Е). При постепенном уменьшении уровня полноты индексирования путем последовательного исключения оставшихся предметов полнота поиска по отношению к конкретному документу соответственно уменьшается. Разумеется, это справедливо и для всех других заиндексированных документов. Индексирование каждого документа с максимальной полнотой обеспечивает максимальную полноту поиска по указателю. Однако, если высокий уровень полноты индексирования обеспечивает высокую полноту поиска, он одновременно снижает его точность. Это связано в основном с двумя причинами. Во-первых, если в каждом вводимом документе выделяются и учитываются все или по крайней мере существенная часть подлежащих индексированию предметов, то тем самым оказываются заиндексированными и многие предметы, которые лишь слегка затрагиваются в данном документе. Следовательно, и они также будут выдаваться в ответ на запросы, по отношению к которым они содержат очень мало информации. Предположим, что рассмотренный ранее документ, содержащий шесть предметов, является отчетом, описывающим определенные аэродинамические явления, и в нем говорится о применении конкретного математического метода, скажем метода Польхаузена для расчета одного из этих явлений. Предположим также, что этот математический метод был выделен на стадии понятийного анализа индексирования и выражен соответствующими терминами языка индексирования. Пусть этот метод будет предметом Р. По отношению к запросу (возможно, очень редкому), в котором потребитель требует всю литературу, описывающую применение метода Польхаузена, этот документ является релевантным и должен быть выдан. Высокий уровень полноты индексирования окажется полезным для данного запроса, требующего большой полноты выдачи. Однако рассмотрим запрос (вероятно, более частый), в ответ на который потребитель хочет получить документы, описывающие сам метод Польхаузена и способы его применения. Ему нужны только существенные статьи по этому методу; статьи, в которых он только упоминается, являются для его запроса нерелевантными. Однако поиск в массиве документов по аэродинамике, заиндексированных с высоким уровнем полноты, может привести к выдаче большого числа документов, в которых содержится лишь простое упоминание о данном методе. В этом случае высокий уровень полноты индексирования вызовет выдачу большого количества нежелательных источников (т.е. уменьшит точность поиска). Вторая причина уменьшения точности поиска при высоком уровне полноты индексирования заключаете в следующем. Чем больше предметов учтено при индексировании и чем больше терминов языка индексирования используется для выражения этих предметов, тем больше вероятность возникновения ложных координаций терминов при поиске (предполагая, что указатель посткоординируемый). Так, документ с [шестью предметам ABCDEF, в котором, допустим, А связан с В, С с D и Е с F, может быть ошибочно выдан в ответ на любой из 12 двухаспектных запросов (А в связи с С, А в связи с D, В в связи с С и т.д.). Если каждый из шести предмете выражен определенным числом отдельных несвязанных терминов языка индексирования, вероятность появления ложных координаций на уровне терминов чрезвычайно возрастает. С учетом всего выше сказанного нелишне все же еще раз подчеркнуть, что высокий уровень полноты индексирования приводит к большой полноте и низкой точности поиска. И наоборот, низкий уровень полноты индексирования вызывает малую полноту и высокую точность поиска. Рассмотрим ситуацию, в которой принята методика индексирования с минимальным уровнем полноты. Каждый документ в этом случае индексируется только по одному предмету - по главной теме документа. Очевидно, что полнота поиска по указателю будет крайне низкой: документ не будет выдаваться в ответ на запрос о предмете, несколько менее важном, чем главный предмет обсуждения. Вместе с тем всякий раз, когда документ будет найден при поиске в указателе, он окажется релевантным, так как в нем речь в значительной мере должна идти о предмете запроса. Кроме того, при индексировании с низкой полнотой (лишь отдельные ключевые слова) совершенно исключается возможность появления ложных координации на уровне понятий и существенно уменьшается возможность таких координаций на уровне терминов. Необходимо подчеркнуть, что уровень полноты при индексировании определяется решением, принимаемым руководством поисковой системы. Это решение не завит от свойств языка индексирования, если используемый язык подходит для обработки тематических областей, которые рассматриваются во вводимых документах, и если любой обсуждаемый предмет может быть выражен в терминах языка системы, хотя бы на более общем, родовом уровне. |
Последнее изменение этой страницы: 2020-02-16; Просмотров: 131; Нарушение авторского права страницы