Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Обеспечение механизма поиска



Поисковая страница представляет собой интерфейс, с помощью которого пользователь формулирует запросы, и обычно содержит поле для ввода поискового запроса, а также другие поисковые поля, предназначенные для опытных пользователей, желающих уточнить запрос.

Различают три типа поисковых запросов:

— перечень ключевых слов;

— перечень ключевых слов, связанных различными логическими операциями (объединение, исключение, последовательность и т.д.);

— вопрос на естественном языке.

Современные поисковые системы, как правило, поддерживают запросы первого и второго типа. Естественный язык в качестве языка запросов пока не получил широкого распространения.

Проблемы поисковых систем

1. Ограничения на индексирование динамических страниц. На крупных специализированных сайтах контент структурирован и распределен по базам данных. Страницы таких сайтов не хранятся на сервере в готовом виде, а генерируются динамически (например, с помощью PHP). (Например, на сайте про кино пользователь вводит в поля формы название нужного фильма или фамилию режиссера.) Поисковые роботы понятия не имеют, какого рода информация может быть введена в поля формы, чтобы получился результат. Поэтому все динамически генерируемые страницы (количество которых все возрастает) остаются вне поля зрения поисковых систем.

2. Недобросовестные действия пользователей. С целью привлечь на свою страницу максимум посетителей, разработчики используют различные приемы обмана поисковой системы. В основном эти приемы сводятся к использованию на странице «фальшивых» ключевых слов в служебных тегах. Эти «фальшивые» слова не отображаются при просмотре страницы в браузере и не имеют никакого отношения к назначению страницы. «Фальшивые» слова подбираются из наиболее востребованных пользователями тематик. Разработчики поисковых систем при индексации страниц должны уделять большое внимание отсечению подобных ресурсов.

3. Индексация страниц с ограниченным доступом. Поисковый робот, перемещающийся по ссылкам внутри ресурса, не способен отличить страницу, предназначенную для бесконечно широкого круга посетителей, от страниц, которые используются, например, только сотрудниками компании. Таким образом, поисковая система может случайно предоставить пользователю доступ к конфиденциальной информации (например, к коммерческой тайне), что служит источником судебных исков против системы.

Существует способ «защитить» свою страницу от индексации поисковым роботом. Для этого используется файл robots.txt, который размещается в корневом каталоге сайта и содержит список запретов всем поисковым системам (или только конкретным) анализировать определенные участки сайта. Аналогичного результата можно добиться с помощью тега:

< META name = “robots” content = “noindex”>

Приведенный тег означает, что данная страница не предназначена для индексирования. Можно так же проинформировать робота, что ему не следует идти по ссылкам с этой страницы:

< META name = “robots” content = “noindex, nofollow”>

Внутренняя поисковая система сайта

Создание системы поиска

Следующая последовательность шагов обобщает процесс добавления к сайту поисковой системы.

1. Выбор объектов индексирования. Далеко не всегда представляется необходимым индексировать все страницы сайта. Обычно присутствует определенная область, в которой пользователю понадобится вести поиск. Ей и следует ограничиться.

2. Выбор метода индексирования информации.

— система автоматически добавляет в индекс все слава, встречающиеся на рассматриваемых страницах;

— система автоматически добавляет в индекс все слова из определенных областей страниц (например, ограничивается заголовками);

— существует специальный словарь с ключевыми словами для поиска и слова из этого словаря сопоставляются конкретным страницам вручную.

3. Выбор модели поисковой системы. Вместо разработки собственного «движка» можно ознакомиться с рынком имеющихся моделей и приобрести ту, которая наиболее подходит для условий, установленных на шаге 1 и 2.

4. Разработка интерфейса поиска.

5. Разработка страницы результатов.

6. Индексирование информации. Поисковая система просматривает весь сайт, имеющийся на настоящий момент и создает его индекс. Может возникнуть необходимость оптимизировать индекс вручную.

7. Интегрирование поисковой системы с интерфейсом поиска.

8. Тестирование и наблюдение.

Интерфейс поиска

Поисковая система (если она есть) должна быть доступной с каждой страницы сайта. При этом есть два варианта доступа:

— На каждой странице сайта в одном и том же месте размещается поле для ввода поискового запроса (и соответствующая ему кнопка Search). Это решение может подойти по стилю не каждому сайту.

Главная проблема — сделать так, чтобы поисковая система не сильно бросалась в глаза, не мешала основной функции страницы (доставке контента), но в то же время моментально находилась бы при необходимости.

— Поисковая система выполнена в виде отдельной страницы сайта, ссылка на которую включена в набор сервисов глобальной навигации.

Поисковая страница (как и страница результатов поиска) должна быть выполнена в стиле всего сайта. Это правило зачастую нарушается, т.к. эта страница, как правило, разрабатывается другими людьми — техническими специалистами.

Лучший дизайн поисковой страницы минималистичен. Обязательные элементы — поле для ввода запроса и кнопка начала поиска.

Если на сайте поддерживается возможность расширенного поиска (или используется собственный язык запросов), она должна быть легко доступна, но не отображаться по умолчанию, чтобы не отпугивать количеством разнообразных опций спешащего пользователя. Идеальный вариант реализуется с помощью JavaScript: при щелчке по кнопке (или ссылке) «расширенный поиск» на странице появляются дополнительные поля.

Если для поиска необходимы инструкции (например, предупредить пользователя, что ключевые слова учитываются только в названиях материалов или научить пользоваться специальным языком запросов), то они должны быть легко доступны, но не отображаться по умолчанию. Пользователь, знакомый с сайтом, не должен отвлекаться. «Инструкции» и «Расширенный поиск» лучше всего реализовать в одном стиле.

Дизайн страницы результатов

Страница результатов должна предоставлять пользователю максимальный объем информации, чтобы он сразу мог определиться, какие результаты ему понадобятся. Её могут составлять следующие элементы:

Исходный запрос. Обязательно. Пользователь не должен вспоминать, какие именно параметры он указал в своём запросе.

Диапазон поиска и найденные результаты. Стоит продемонстрировать общее число просмотренных документов и количество найденных совпадений (например, просмотрено 5000 документов, обнаружено 15 совпадений). Первый параметр даёт косвенную характеристику объему сайта.

Контекст текущего результата. Должен присутствовать индикатор, демонстрирующий, какую часть результатов пользователь просматривает в данный момент (например, 3 страница из 9).

Заголовки страниц или документов. Каждый найденный документ должен быть четко озаглавлен.

Краткое содержание. Можно взять несколько первых строк найденного документа или несколько строк, входящих в окружение искомого термина. Желательно предоставить пользователю возможность опционально отключать этот элемент, поскольку краткое содержание резко увеличивает объем страницы результатов.

Дата и время. Следует показывать как дату создания, так и дату последнего обновления найденных документов.

Тип результата. Если кроме HTML-страниц могут быть выданы данные в виде файлов документов их формат (документ Microsoft Word или Acrobat Reader) должен быть обязательно указан.

Важность результатов (релевантность найденного документа запросу). Может выражаться в неявном виде — путем определенного порядка следования результатов.

Совпадение ключевых слов. Следует указать какие именно ключевые слова совпали — лучше всего путем выделения (цветом или начертанием) их среди окружения. Пользователей сильно раздражает, когда они не могут понять, почему данная страница включена в ответ на их запрос.

Навигация. Среди множества результатов должно быть легко перемещаться. Это можно реализовать с помощью перечня страниц результатов, а так же ссылок «Следующие 10 результатов», «Предыдущие 10 результатов», «Первая страница». Пользователь должен иметь возможность настраивать число результатов на одну страницу.

Уточняющий запрос. Пользователь должен иметь возможность провести дополнительный поиск внутри уже полученного набора результатов.

Основными элементами являются исходный запрос и заголовки найденных страниц. Все остальные должны выглядеть по возможности менее броско, чтобы не мешать пользователю быстро пробегать глазами вниз, оценивая результаты.


Поделиться:



Последнее изменение этой страницы: 2017-03-14; Просмотров: 205; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.02 с.)
Главная | Случайная страница | Обратная связь