Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Самые популярные поисковые системы



Содержание

Введение. - 2 -

Поисковые системы.. - 2 -

Самые популярные поисковые системы.. - 3 -

Сравнительный обзор и классификация поисковых системы.. - 5 -

Наиболее яркие представители. - 9 -

Преимущества и недостатки поисковых систем.. - 16 -

Сравнительный анализ работы различных поисковых систем: - 18 -

Модель " идеальной" поисковой системы.. - 19 -

Рекомендации по применению поисковых систем: - 21 -

Заключение. - 23 -

Используемые источники: - 25 -

 

 

Введение

Первые поисковые системы появились в сети Интернет более десяти лет назад. Тогда они выполняли лишь одну функцию – поиска ссылок к недавно созданным страницам.

На начальном этапе развития интернета, число пользователей сети было невелико и количество информации относительно небольшим. В подавляющем большинстве случаев пользователями Интернет были сотрудники различных университетов или научных организаций. В то время поиск нужной информации в сети был не столь актуален, как теперь. Сегодня же поисковые системы превратились в многофункциональный сервис. Они позволяют пользователям находить в сети Интернет самую разнообразную информацию, благодаря чему пользуются огромным успехом.

Поисковые системы

Одной из первых попыток организации доступа к информационным ресурсам сети стало создание тематических каталогов сайтов. Первым, открывшимся в апреле 1994 г, стал Yahoo. Это еще не было поисковой системой, в современном понимании, т.к. возможность поиска информации ограничивалась ресурсами, зарегистрированными в каталоге Yahoo. Каталоги ссылок ранее использовались довольно широко, но в настоящее время практически утратили свою популярность. Объяснение этому очень простое – даже современные, содержащие огромное количество ресурсов каталоги, представляют информацию лишь о довольно незначительной части сети. Для сравнения - самый полный каталог сети интернет - DMOZ содержит информацию примерно о 12.000.000 ресурсов, в то время как база данных самой полной поисковой системы Google состоит более чем из 28.000.000.000 документов.

Первой полноценной поисковой системой в 1994г. стал проект WebCrawler. Далее в 1995 году появились поисковые системы AltaVista и Lycos. В 1997 году в Стэнфордском университете, в рамках исследовательского проекта, была создана Google - самая популярная поисковая система на данный момент в мире. В 1997 году появилась поисковая система - Yandex, лидер в русскоязычной части Интернета. На данный момент основными поисковыми системами являются три международных – Google, Yahoo и MSN Search. Остальные, коих не мало, используют целиком или частично базы и (или) алгоритмы выше приведенных систем. В Рунете основной поисковой системой является Яндекс, далее по популярности идут Rambler, Google.ru, Mail.ru и Aport.

Поисковая система - это сумма следующих компонентов:

Web server (веб-сервер) – сервер поисковой машины, который осуществляет взаимодействие между пользователем и остальными компонентами системы.

Spider (паук)- программа написанная по принципу браузера, предназначена для скачивания веб-страниц. Браузер предназначен для визуального использования страниц, а паук работает с HTML кодом напрямую. Чтобы посмотреть " сырой" исходник нажмите в меню браузера: Вид- Просмотр HTML кода.

Crawler («путешествующий» паук) – программа, которая автоматически уходит по всем внешним ссылкам страницы. Ее задача - поиск не известных (или измененных) документов и в расстановке приоритетов, куда дальше должен идти Spider.

Indexer (индексатор) - программа-анализатор скаченных пауками веб-страниц. Она " разбирает" на части скачанную страницу и анализирует ее элементы, такие как текст, служебные html-теги, заголовки, особенности стилистики и структурные формы.

Database (база данных) – хранилище для скачанных и обработанных страниц - общая база данных поисковой машины.

 Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных поисковой системы. Именно она решает, какие страницы более соответствуют запросу пользователя и отсортировывает их в нужном порядке. Модуль работает согласно заданным поисковой системой алгоритмам ранжирования.

 

Самые популярные поисковые системы

 

Доля каждой поисковой системе в Рунете

 

Русскоязычные Англоязычные
Яndex Google
Google MSN search
Rambler Yahoo
Аport Aol
MSN Search Lucos
Yahoo Cuil
AltaVista Ask Jeeves
Mail.ru LookSmart

 

Количество переходов с поисковых систем

Рекомендации по применению поисковых систем:

Первый вопрос, который возникает у начинающего пользователя Интернета: " Как найти необходимую мне информацию? " Прежде всего, мы должны отметить, что нет " правильных" или " неправильных" путей поиска в Интернете. Несомненно, одни из них могут потребовать больше времени, чем другие, но в конечном счете предпочтение должно отдаваться тому методу, который кажется наиболее удобным и эффективным конкретному пользователю Интернета.

Представьте себе, что Вам нужно найти потерявшуюся вещь в Вашем доме. Вы можете использовать несколько способов поиска:

1. Планомерно обыскать все шкафы и полки;

2. Искать только там, где, по Вашему мнению, может находиться эта вещь;

3. Спросить родных: маму, детей, жену или мужа о месте, где может находиться искомый предмет или нечто похожее на него.

Конечно, могут быть и другие способы... Но в каждом отдельном случае только один из трех перечисленных методов будет наиболее успешным. Аналогичный принцип применяется при поиске в любой поисковой системе: Вы можете искать в новостях, файлах или во всем Интернете. Вы даже можете искать только на определенном сайте (только в одном шкафу), если Вы знаете, что искомый объект спрятался именно там. Но следует учитывать, что поисковые роботы могут обойти только те места, куда его пускают (заглянуть только в те шкафы, дверцы которых не заперты).

Точно так же, как и дома, в каждом отдельном случае один из способов может оказаться эффективнее другого: в Интернете нужный объект или сайт может найтись вовсе не там, где ожидалось

Начните искать — это легко

Поисковые машины не требуют от вас знания специальных команд для поиска. Достаточно набрать вопрос — так же, как бы вы его задали библиотекарю или всезнайке-эрудиту. Например, где раки зимуют? Ярчайшая звезда северного полушария?

Морфология учитывается

Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Это называется учет морфологии слов. При необходимости вы всегда можете его отключить.

Ищете цитату?

Если вы хотите найти точную цитату, просто задайте искомую фразу в кавычках: " о закрой свои бледные ноги". По такому запросу будут найдены все страницы, в которых есть нужная вам цитата.

Ищете имена?

Слова с большой и маленькой буквы считаются разными формами одного слова, поэтому все равно, какой регистр использовать в запросе. Исключением является оператор точной формы. По запросу '! лужков' будут найдены все документы, содержащие эту словоформу в любом регистре, а по запросу '! Лужков' — только документы, в которых имеется форма 'Лужков' с большой буквы. Это полезно, если искомое имя собственное совпадает с распространенным именем нарицательным, например, село! Кошки или! Прост.

Обязательно найдите слово!

Чтобы отобрать документы, где определенное слово присутствует обязательно, поставьте перед ним плюс (без пробела). Поэтому, если вас интересует цитата из «Гамлета», вы можете задать запрос +быть +или +не быть. Маленькая хитрость: тот же результат можно достичь, задав «обязательные» слова в кавычках: " быть или не быть".

Как исключить слово?

Чтобы исключить документы, в которых встречается определенное слово, поставьте перед этим словом два символа тильды или один минус (без пробела). Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, задайте запрос путеводитель по Парижу ~~агентство ~~тур. Или запрос путеводитель по Парижу -агентство –тур.

Заключение

Поисковые системы обычно состоят из трех компонент:

· агент (паук или кроулер), который перемещается по Сети и собирает информацию;

· база данных, которая содержит всю информацию, собираемую пауками;

· поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

Во время путешествия по Интернету, вам обязательно понадобиться помощь поисковой машины. Очень часто приходится искать информацию в сети не зная даже приблизительно адрес страницы, на которой она может располагаться. В таких случаях на помощь приходит поисковая машина.

Поисковые машины - это роботизированные системы. Специальная программа-робот, которую называют паук или ползун, постоянно обходит Сеть в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.

При поиске в Интернете важны две составляющие – полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом – релевантность, то есть соответствие ответа вопросу. Важными показателями являются охват и глубина поисковой машины (насколько велика база данных по документам), скоростью обхода и актуальностью ссылок (скорость обновления информации в этой базе данных), качеством поиска (чем ближе к началу списка оказывается нужный вам документ, тем лучше работает релевантность).

Кроме релевантности, существуют важные пользовательские характеристики: скорость поиска (медленная поисковая машина неэффективна в работе), поисковые возможности (как именно происходит индексация: только по ключевым словам web-страницы или по всему тексту, с учетом морфологии или без него, с поиском по тэгам HTML - заголовкам, ссылкам, подписям к изображениям и др.), а также дополнительные удобства (удобный интерфейс, наличие специальных функций, например, поиск по датам и серверам). Здесь все зависит от того, что вы предпочитаете.

Среди ведущих поисковых машин на данный момент - Яndex, Google, Rambler, Апорт! и др.

Используемые источники:

1. www. google.ru

2. www.yandex.ru

3. www.rambler.ru

4. www.aport.ru

5. www.msn.ru

6. www.yahoo.ru

7. http: //company.yandex.ru/articles/article10.xml

8. http: //www.citforum.ru/internet/search/searchsystems.shtml

9. http: //www.intelsib.ru/

10. http: //www.seonews.ru/news/.info_news/2385/

11. http: //www.seo-gu.ru/im_stat.html

12. http: //www.relevantno.ru/news/html/1138782965.html

13. http: //www.vadimstepanov.ru/f_texts/column6.htm

14. http: //book.itep.ru/4/45/retr4514.htm

15. http: //www.seoexp.com/ru/history/search_engines/

16. http: //smo.me/uncategorized/история-создания-компании-google/

17. www.google.com/codesearch

 

Содержание

Введение. - 2 -

Поисковые системы.. - 2 -

Самые популярные поисковые системы.. - 3 -

Сравнительный обзор и классификация поисковых системы.. - 5 -

Наиболее яркие представители. - 9 -

Преимущества и недостатки поисковых систем.. - 16 -

Сравнительный анализ работы различных поисковых систем: - 18 -

Модель " идеальной" поисковой системы.. - 19 -

Рекомендации по применению поисковых систем: - 21 -

Заключение. - 23 -

Используемые источники: - 25 -

 

 

Введение

Первые поисковые системы появились в сети Интернет более десяти лет назад. Тогда они выполняли лишь одну функцию – поиска ссылок к недавно созданным страницам.

На начальном этапе развития интернета, число пользователей сети было невелико и количество информации относительно небольшим. В подавляющем большинстве случаев пользователями Интернет были сотрудники различных университетов или научных организаций. В то время поиск нужной информации в сети был не столь актуален, как теперь. Сегодня же поисковые системы превратились в многофункциональный сервис. Они позволяют пользователям находить в сети Интернет самую разнообразную информацию, благодаря чему пользуются огромным успехом.

Поисковые системы

Одной из первых попыток организации доступа к информационным ресурсам сети стало создание тематических каталогов сайтов. Первым, открывшимся в апреле 1994 г, стал Yahoo. Это еще не было поисковой системой, в современном понимании, т.к. возможность поиска информации ограничивалась ресурсами, зарегистрированными в каталоге Yahoo. Каталоги ссылок ранее использовались довольно широко, но в настоящее время практически утратили свою популярность. Объяснение этому очень простое – даже современные, содержащие огромное количество ресурсов каталоги, представляют информацию лишь о довольно незначительной части сети. Для сравнения - самый полный каталог сети интернет - DMOZ содержит информацию примерно о 12.000.000 ресурсов, в то время как база данных самой полной поисковой системы Google состоит более чем из 28.000.000.000 документов.

Первой полноценной поисковой системой в 1994г. стал проект WebCrawler. Далее в 1995 году появились поисковые системы AltaVista и Lycos. В 1997 году в Стэнфордском университете, в рамках исследовательского проекта, была создана Google - самая популярная поисковая система на данный момент в мире. В 1997 году появилась поисковая система - Yandex, лидер в русскоязычной части Интернета. На данный момент основными поисковыми системами являются три международных – Google, Yahoo и MSN Search. Остальные, коих не мало, используют целиком или частично базы и (или) алгоритмы выше приведенных систем. В Рунете основной поисковой системой является Яндекс, далее по популярности идут Rambler, Google.ru, Mail.ru и Aport.

Поисковая система - это сумма следующих компонентов:

Web server (веб-сервер) – сервер поисковой машины, который осуществляет взаимодействие между пользователем и остальными компонентами системы.

Spider (паук)- программа написанная по принципу браузера, предназначена для скачивания веб-страниц. Браузер предназначен для визуального использования страниц, а паук работает с HTML кодом напрямую. Чтобы посмотреть " сырой" исходник нажмите в меню браузера: Вид- Просмотр HTML кода.

Crawler («путешествующий» паук) – программа, которая автоматически уходит по всем внешним ссылкам страницы. Ее задача - поиск не известных (или измененных) документов и в расстановке приоритетов, куда дальше должен идти Spider.

Indexer (индексатор) - программа-анализатор скаченных пауками веб-страниц. Она " разбирает" на части скачанную страницу и анализирует ее элементы, такие как текст, служебные html-теги, заголовки, особенности стилистики и структурные формы.

Database (база данных) – хранилище для скачанных и обработанных страниц - общая база данных поисковой машины.

 Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных поисковой системы. Именно она решает, какие страницы более соответствуют запросу пользователя и отсортировывает их в нужном порядке. Модуль работает согласно заданным поисковой системой алгоритмам ранжирования.

 

Самые популярные поисковые системы

 

Доля каждой поисковой системе в Рунете

 

Русскоязычные Англоязычные
Яndex Google
Google MSN search
Rambler Yahoo
Аport Aol
MSN Search Lucos
Yahoo Cuil
AltaVista Ask Jeeves
Mail.ru LookSmart

 


Поделиться:



Последнее изменение этой страницы: 2020-02-16; Просмотров: 162; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.035 с.)
Главная | Случайная страница | Обратная связь