Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Русскоязычные поисковые механизмы в Интернет



Многие популярные Web-узлы так и остались бы неизвестными, если бы не справочно-поисковые системы

Это должно было произойти, и это произошло. 1996 год стал годом появления и быстрого распространения поисковых систем, специализирующихся на выявлении, в первую очередь, русскоязычных материалов. Закономерность этого процесса понятна, поскольку к тому моменту российский блок Интернет уже накопил обширный по объему и ценный по содержанию информационный массив, и стал полноправной составной частью всемирных киберресурсов. Образование поисковых систем явилось как бы еще одним доказательством реальной значимости накопленного информационного массива: как только сформировалось то, что нужно искать, появились инструменты, позволяющие это делать.

Русскоязычные поисковые средства возникли не на пустом месте. У их разработчиков было время собраться с мыслями и проанализировать многочисленные зарубежные аналоги (забегая вперед, отметим, что этой возможностью воспользовались далеко не все). Тем более, что принципиально новые решения изобрести было довольно сложно. Российские поисковые системы сохранили традиционное деление на электронные справочники, позволяющие последовательно знакомиться с материалами по определенным отраслям и темам, и поисковые системы в чистом виде, с помощью которых осуществляется поиск источников по узкому профилю.

Среди справочников на роль российского Yahoo! претендовали два программных продукта: " Паук" (http: //spider.raser.ru) и " Созвездие Internet" (http: //www.stars.ru).

" Паук", плетущий свои сети с 1995 года (единственный, обогнавший время) и уже ставший ветераном отечественного сетевого поиска, имеет интерфейс без особых изысков, но зато несколько иерархических уровней. Логичность отраслевой иерархии оставляет желать много лучшего, поэтому для его использования требуется порой нестандартное мышление, иначе трудно определить, в каком разделе могут находиться требуемые данные. Такая запутанность справочника уже сейчас затрудняет работу, а с ростом объемов информации эта проблема будет все более и более усугубляться. Выборочная проверка оперативности обновления разделов " Паука" показала, что система поддерживается в актуальном состоянии довольно слабо. В ней отсутствуют некоторые очень информативные серверы, появившиеся более полугода назад.

В своей нынешней версии " Паук" поддерживает все русские кодировки, а также дает возможность непосредственного поиска, который, как это часто бывает у справочников, ограничен названиями, первым строками текста (комментариями) и электронными адресами Web-страниц. Поисковый блок не позволяет употреблять в запросе даже простые операторы " и" и " или", поэтому розыск может вестись одновременно только по одному понятию, с возможностью усечения окончаний слов с помощью " *".

" Созвездие Internet", нашедшее пристанище на известном сервере " ИнфоАрт", относится к новейшим разработкам, что заметно по его интерфейсу, выполненному на высоком уровне с применением фреймов и качественной графики: функционально и одновременно внешне привлекательно. К сожалению, содержание " Созвездия" пока отстает от его внешнего вида. Справочник не имеет разветвленной иерархической структуры. Основной ряд включает разделы " Компьютеры и технологии", " Экономика и бизнес", " Медицина и здоровье", " СМИ", " Искусство и культура", " Образование и наука", " Техника и транспорт", " Отдых и развлечения" и " Разное". При раскрытии раздела идет непосредственное перечисление серверов данной тематики, число которых пока также невелико. В среднем оно составляет около 40, а памятуя о том, что в России число серверов давно превысило 3000, легко понять, что фрагмент, отраженный в " Созвездии", очень невелик. Один из немногих положительных моментов - то, что помимо названия сервера в справочник включается также краткая характеристика его содержания. Прямой же поиск в " Созвездии Internet" не выходит за пределы названий и аннотаций уже учтенных серверов.

Для ориентации в отечественном киберпространстве также может помочь электронная версия " Желтых страниц Интернет (русские ресурсы)" издательства " Питер", хранящаяся по адресу (http: //proxy.menatep.elcom.ru/yp/yp_about.htm).

Русскоязычные поисковые средства в чистом виде (search engines) предоставляют более широкие возможности выбора. К ним относятся Rambler (http: //www.rambler.ru), " Новый русский поиск" (http: //www.openweb.ru/koi8), Апорт! http: //www.aport.ru/" Русская машина поиска" (http: //search.interrussia.com) и Russian Internet Search (http: //www.search.ru).

" Русская машина поиска", несмотря на название, является зарубежной разработкой, ориентированной, тем не менее, исключительно на русскоязычные ресурсы по всему Интернету. Как показывают тесты, она бороздит русскоязычное киберпространство весьма выборочно. Вероятно, ориентиром выступает значимость того или иного узла, определяемая создателями " Машины". Меню запроса " Машины" предлагает пользователю возможность самому устанавливать или отменять чувствительность к написанию заглавных и строчных букв, а также указывать количество возможных ошибок в искомом слове, если нет уверенности в его написании. Последнее качество, кстати, весьма полезно и при многовариантности запроса типа " библиотека или библиотеки или библиотек", поскольку усекать термины " Машина" принципиально не позволяет.

" Русская машина поиска" обладает довольно непривычной формой выдачи результатов, определяемой используемым инструментом - Harvest. Перед пользователем предстают нагромождения из английских и русских слов и символов. После некоторого разбирательства удается понять, что все не так сложно, просто один длинный URL разбит зачем-то на несколько составных частей, привычный title назван " Description", а каждое вхождение искомого термина обозначено отдельной строкой. Единственной положительной стороной такой детализации является возможность сразу увидеть, в какой части Web-страницы содержится искомый термин, а иногда даже и в каком контексте он употреблен. Впрочем, такую пестроту результатов можно и отменить через меню, однако в этом случае информация в ссылке сократится до электронного адреса найденного объекта. К сожалению, система не ранжирует результаты поиска, поэтому зачастую приходится просматривать список до самого конца, ища наиболее ценные ссылки.

Поисковая система Rambler

адрес: http: //www.rambler.ru

Краткий обзор

Поисковая система Рамблер начала свое существование с 1996 года. На сегодняшний день она является одной из самых популярных в РуНете, уступая лишь Яндексу (по популярности). По оценкам SpyLog на Рамблер приходится 20-25% от всех поисковых запросов РуНета.

Поисковая система Рамблер при поиске учитывает морфологию русского языка, что дает больше возможностей для эффективного поиска информации. Реализована также система так называемых " перевязок", которая позволяет выдавать в результатах поиска не только страницы содержащие запрос, но и слова, которые являются синонимами запроса. Еще одной функцией " перевязок", думаю более значимой, является выдача контекстной рекламы не только по конкретному запросу, но и по запросам, которые тесно связаны с исходным, это позволяет перекрыть большее количество целевой аудитроии.

На Rambler функционирует также рейтинговая система Rambler's Top 100(http: //www.top100.rambler.ru/, здесь можно прочитать его описание), в которой можно найти наиболее посещаемые сайты по определенной тематике. На данный момент это самый популярный рейтинг РуНета, даже можно сказать, что это один из немногих рейтингов РуНета, в которых стоит участвовать.

Рамблер находит именно то, что Вам нужно, результаты поиска максимально соответствуют запросу. Вам не придется искать нужные документы среди множества ссылок.

По соответствию запросу оцениваются не только отдельные документы, но и целые сайты. Благодаря объединению по сайтам за одним ответом на Ваш запрос могут стоять десятки найденных документов.

Робот Рамблера, индексирующий российский Интернет, обходит его значительно чаще. Новые страницы быстрее попадают в результаты поиска, " мертвые" – уходят.

Поисковая машина понимает, что " идет" и " шёл" - формы одного и того же слова. То же и с английскими словами - например, " go" и " went". И даже совсем новые, незнакомые ей слова машина умеет склонять и спрягать: поищите, например, " виндозные сидюки".

На популярные новостные сайты (Рамблер-Медиа, Лента.ру, Газета.ру, НТВ и другие) робот Рамблера заходит по несколько раз в сутки. Переключившись на поиск " по новостям", Вы найдете информацию о последних событиях почти сразу после ее появления на сайтах агентств и онлайновых СМИ.

Рамблер по-прежнему остается самой быстрой поисковой системой На конкурсе " Золотая паутина" информационно-поисковая система Рамблер была отмечена первым призом в номинации " Лучший коммерческий проект года".

Действительно, компания Рамблер по праву считается первой крупной рекламной площадкой российского Интернета и стоит у истоков классического сетевого рекламного бизнеса.


Поделиться:



Последнее изменение этой страницы: 2019-10-03; Просмотров: 206; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.017 с.)
Главная | Случайная страница | Обратная связь