Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Описание поисковой системы Яндекс.



Яндекс является русскоязычной поисковой системой по российскому Интернету. При поиске используется вся имеющаяся информация. При каждом запросе ищутся (и получают более высокий ранг) фразы, точно совпадающие с запросом, затем предложения, содержащие все слова запроса, и т.д. Важную роль играет относительное положение слов. Так, например, если запрос из четырех слов не имеет точного ответа в базе данных, будут отранжированы выше предложения, содержащие три слова из запроса, в которых слова стоят в точно той же последовательности, что и в запросе. Это дает возможность решать типичную поисковую задачу - искать документ по " неточному цитированию". Вот, что определяет положение сайта на первой странице поисковой системы при запросе по одному слову.

1. Частотные характеристики.

o Частота слова в базе.

o Частота слова в документе.

o Размер базы.

o Размер документа.

2. Привилегированное положение слова в документе (например, заголовок) и/или наличие его в списке ключевых слов.

3. Присутствие слова в " авторитетных" ссылках на данный документ.

4. " Взвешенный индекс цитирования" документа.

5. Количество и ранг (" авторитетность" ) всех страниц сайта с этим словом.

Для более эффективного поиска следует помнить несколько вещей[6]:

1. Следует задавать уникальные заголовки документов, вкратце описывающие сайт и текущий документ (но не более 20-25 слов). Слова в заголовках имеют больший вес, чем остальные.

2. Не стоит забывать о ключевых словах, по возможности уникальных для каждой страницы

 

3. Чем длиннее документ, тем менее заметны в нем будут слова, заданные в запросе и, следовательно, нужная страница будет ниже в результатах поиска при прочих равных. 

4. Яndex работает только с текстами и не умеет распознавать графические изображения. Поэтому, если название нарисовано, стоит продублировать его в текстовом виде.

5. Следует соблюдать правила оформления документов:

o не набирать слова в р а з р я д к у;

o не набирать слова БОЛЬШИМИ буквами без необходимости;

o точки и запятые нужно прижимать к слову, за которым они стоят,      после них ставя пробел.

6. Нужно подумать, по каким словам и фразам вы сами искали бы сайт вашей тематики. Если сайт посвящен заработку в Интернете и вы не находите его по слову " Заработок" - значит, это слово мало используется в документах сайта. Те, кто интересуется именно " Заработком", могут его не найти.

Это означает, что, с точки зрения Яндекса количество повторов слова в " keywords" не может " поднять" документ в результатах поиска - на ранжирование влияет совпадение фактов наличия этого слова и в ключевых словах, и в основном тексте документа (ну и, естественно, в запросе пользователя). Полную информацию по поисковой машине Яндекс найдете по адресу www.yandex.ru[7].

 

Описание поисковой системы Рамблер

Рамблер - это российский поисковый робот обслуживает только сайты, находящиеся в следующих доменах первого уровня:

· Российская Федерация: .ru, .su

· Украина: .ua

· Белоруссия: .by

· Казахстан: .kz

· Киргизия: .kg

· Узбекистан: .uz

· Грузия: .ge

Чтобы Рамблер находил документы необходимо соблюдать следующие правила[8]:

· Размер документа для роботов Рамблера составляет максимум 200 килобайт. Документы большего размера усекаются до указанной величины.

· Первые несколько позиций (до пяти) в результатах поиска отданы сайтам, зарегистрированным в Top100. Поисковая машина и рейтинг Рамблер Тор100 независимые системы, и регистрация в них производится раздельно.

· Нужно внимательно следить за соблюдением русско-латинского регистров. Ошибочно вместо русской буквы 'р' используют латинскую 'p', вместо русского 'с' - латинское 'c'.

· Не следует также использовать невидимый текст (в котором цвет шрифта совпадает с цветом фона). На результатах поиска это не отразится.

· Комментарии в документе робот Рамблер тоже не сканирует, поэтому их следует использовать по прямому назначению.

· Заполняя поля мета тег " Название сайта" и " Описание" не следует вводить в них длинные перечни ключевых слов, так как при сканировании игнорируются поля < meta name=" keywords"...> и все другие поля < meta...>.

· Не индексируются части HTML, размеченные тегами < script...> ...< /script> и Macromedia Flash.

· Части документа, не требующие индексации, можно отделять в документе с помощью тегов < noindex> ... < /noindex>. Из частей документа, размеченных этими тегами, также не будут выделены ссылки для дальнейшего обхода.

· Исключить страницу из списка индексируемых можно с помощью стандартного для Http механизма - посредством файла robots.txt в головной директории вашего сайта или HTML-тега < meta name=" robots" ...>.

Есть возможность организовать поиска по сайту, а также по всему Интернету на вашем сайте[9].

 

Описание поисковой системы Aport

Апорт является русскоязычной поисковой системой по российскому Интернету. Апорт - полнотекстовая поисковая система. Это означает, что она индексирует все слова, которые бы увидел на экране человек, просматривая конкретную страницу сервера. В результате любое слово из текста ваших документов может служить критерием последующего поиска. Для документов HTML кроме основного текста документа индексируются также: заголовок документа < title>, ключевые слова < meta keywords>, описания страниц < meta description> и подписи к картинкам < alt>. Апорт индексирует как принадлежащие документу, тексты гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами. Ключевые слова < meta keywords> не имеют определяющего значения при определении релевантности документа. Разумное использование этого тега рекомендуется и может поднять ваш сайт в результатах поиска по соответствующим словам, однако, не следует думать, что именно на него Апорт обращает внимание в первую очередь. Следует также отметить, что Апорт не индексирует документы, в Url которых встречается символ "? ".

В отличие от многих других поисковых систем, Апорт не применяет каких-либо специальных санкций к сайтам, пытающимся обмануть поисковую систему с помощью спама, однако, добиться подобным способом желаемого результата не получится. Поэтому не стоит писать невидимые тексты, вбивать сотни ключевых слов, не имеющих никакого отношения к содержанию документа и т.д. При просмотре содержимого сервера для индексирования Апорт обязательно проверяет файл robots.txt. Так что можно использовать его, чтобы ограничить «деятельность» Апорта на своем сервере. При желании установить селективные ограничения только для Апорта следует использовать в качестве имени робота слово « Aport». Также поддерживаются мета теги < robots>, позволяющие, в частности, установить правила поведения робота на вашем сайте даже в случае, если вы не имеете возможности изменять файл robots.txt на сервере.

Более полно ознакомиться с поисковой системой Апорт можно по адресу www.aport.ru

Социология в Сети

После краткого описания браузера и основных русских поисковых систем, видимо следует рассказать о непосредственном предмете моей контрольно–курсовой работы – сетевых ресурсах по социологии.

Собственно информации по социологии в Интернете очень много. Российскими социологами уже сделаны первые шаги по долгой дороге освоения всемирной Web-сети. В настоящее время более 100 российских социологических организаций имеют свои сайты и они постепенно начинают использовать их для представления результатов своих исследований. Условно всю информацию можно разделить на два типа: теоретический уровень и, так называемые, конкретные социологические исследования (КСИ).

Первый тип предназначен скорее для тех пользователей, кто связан непосредственно с наукой и, следовательно, часто пользуется теоретическим материалом. К таким людям можно отнести научных работников, преподавателей, студентов и школьников. Что касается КСИ, то данная информация может быть интересна не только специалистам, но и всем интересующимся социологическими исследованиями. На сайтах с результатами конкретных социологических исследований любой желающий может легко найти информацию обо всех опросах и социологических исследованиях, проведённых либо компаниями-владельцами сайтов, либо компаниями, предоставившими эту информацию. К сайтам, относящимся к последним, можно отнести интернет-странички самых разнообразных газет, журналов, телеканалов, различных интернет-изданий, которые, как известно, часто используют подобную информацию или, даже, сами заказывают проведение исследований.

Кроме того в отдельный ряд можно поставить сайты социологических журналов, на страницах которых профессиональные социологи обсуждают проблемы современной социологии, публикуются статьи по многим животрепещущим для социологии вопросам.


Поделиться:



Последнее изменение этой страницы: 2020-02-16; Просмотров: 68; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.018 с.)
Главная | Случайная страница | Обратная связь