Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Дополнительные факторы, которые влияют на ценность ссылки
Классический рейтинг PageRank – это не единственный фактор, который влияет на ценность ссылки. В следующих разделах мы обсудим некоторые дополнительные факторы, которые влияют на передаваемое ссылкой значение. Якорный текст Якорный текст – это та часть ссылки (с одной web-страницы на другую), которую можно кликнуть. Например, на рис. 7.10 показан моментальный снимок части страницы сайта Alchemist Media Home Page по адресу http: //www.alchemistmedia.com. Рис. 7.10. Якорный текст: сильный элемент ранжирования Якорный текст для ссылки Link #3 на рис. 7.10 такой: SEO Web Site Design. Поисковый движок использует этот якорный текст, чтобы понять, о чем та страница, на которую ведет эта ссылка. В результате поисковый движок будет интерпретировать ссылку Link #3 как указание на то, что ссылка показывает на страницу о SEO Web Site Design. Влияние якорного текста может быть очень сильным. Например, если вы делаете ссылку на web-страницу, на которой нет видимого для поискового движка контента (возможно, что это полностью Flash-сайт), то поисковый движок будет все равно искать сигналы, чтобы определить, о чем же эта страница. При таком сценарии входящий якорный текст становится основным средством определения релевантности страницы. Сила якорного текста привела к такому явлению, как " бомбежка Google" (Google bombing). Идея состоит в том, что если вы делаете ссылку (с одним и тем же якорным текстом) на некую web-страницу из многих мест, то можете добиться рейтинга данной страницы для запросов по этому якорному тексту (даже если страница не релевантна). Одной из самых известных Google-бомб стала компания по созданию ссылок на страницу (на сайте Whitehouse.gov) с биографией президента George W. Bush с якорным текстом miserable failure (" жалкий неудачник" ). В итоге эта страница стояла первым номером в результатах поиска по словам miserable failure, но только до тех пор, пока Google не подправила свой алгоритм (чтобы снизить эффективность такой методики). Однако все это продолжает работать в Yahoo! (по состоянию на май 2009 г.), как показано на рис. 7.11. Кстати, президент Обама также попал сюда (в основном благодаря редиректу, который поставили web-разработчики Белого дома). Рис. 7.11. Якорный текст создает страницам рейтинг для нерелевантных терминов Релевантность Те ссылки, которые приходят с сайтов/страниц той же тематики, что и сайт издателя, стоят больше, чем ссылки с сайтов другой тематики. Релевантность ссылки оценивается в конкретном контексте введенного пользователем запроса. Если пользователь вводит used cars in Phoenix, а у издателя есть ссылка на страницу с подержанными машинами в городе Phoenix (которая сделана с сайта торговой палаты города Phoenix), то эта ссылка усилит уверенность поискового движка в том, что данная страница действительно относится к городу Phoenix. Аналогичным же образом, если у издателя есть другая ссылка с сайта журнала, который делал обзор web-сайтов подержанных машин, то такая ссылка усилит мнение о том, что данный сайт следует считать сайтом подержанных машин. Вместе взятые, эти две ссылки могут сильно помочь издателю получить рейтинг для слов used cars in Phoenix". Авторитет Авторитет является предметом множества исследований. Один из самых знаменитых докладов, написанный Apostolos Gerasoulis и другими авторами в университете Rutgers University и озаглавленный " DiscoWeb: Applying Link Analysis to Web Search" (http: //www.cse.lehigh.edu/~brian/pubs/1999/www8/), стал основой алгоритма Teoma, который позднее был куплен компанией AskJeeves и стал частью алгоритма Ask. Уникальным его делает оценка ссылок по их релевантности целевой странице. Исходный алгоритм PageRank компании Google не содержал понятия тематической релевантности и несмотря на то, что сегодня алгоритм Google безусловно это делает, Teoma был фактически первым алгоритмом, который предложил коммерческую реализацию релевантности ссылок. Алгоритм Teoma ввел понятия хабов (это сайты, которые ссылаются на большинство важных сайтов, релевантных данной конкретной тематике) и авторитетов (это сайты, на которые есть ссылки с большинства сайтов, релевантных данной теме). Ключевая концепция заключается в том, что каждая тематическая область, по которой пользователь может делать поиск, имеет сайты-авторитеты, специфичные для данной тематической области. Сайты-авторитеты по подержанным машинам отличаются от сайтов-авторитетов по бейсболу. На рис. 7.12 показана разница между сайтами-хабами и сайтами-авторитетами. Рис. 7.12. Хабы и авторитеты Если издатель имеет сайт о подержанных машинах, то он стремится получить ссылки от таких web-сайтов, которые поисковые движки считают авторитетами по подержанным машинам (или просто по машинам). Однако поисковые движки не скажут вам, какие сайты они считают авторитетными, и от этого работа издателя становится гораздо труднее. Модель организации Интернета в тематические сообщества, выявление хабов и авторитетов – это важная модель, которую следует понимать (подробности читайте в докладе Mike Grehan под названием " Filthy Linking Rich! " по адресу http: //www.search-engine-book.co.uk/filthy_linking_rich.pdf). Лучшие мастера по сбору ссылок понимают эту модель и используют ее в своих интересах. Доверие Доверие отличается от авторитета. Авторитет недостаточно учитывает, насколько легко спамеры могут внедриться в тот домен (или страницу), который делает ссылку. Доверие это учитывает. Оценка доверия web-сайта включает в себя просмотр всех его соседей по ссылкам, чтобы увидеть, какие другие доверенные сайты делают сюда ссылки. Большее количество ссылок с других доверенных сайтов дает больше доверия. В 2004 г. компания Yahoo! и университет Stanford University опубликовали доклад под названием " Combating Web Spam with TrustRank" (http: //www.vldb.org/conf/2004/RS15P3.PDF). Доклад предлагал при выполнении анализа PageRank начинать с некого доверенного начального набора страниц (выбранных человеком вручную), а не со случайного набора страниц (как предлагал исходный документ по рейтингу PageRank). Использование такой тактики ликвидирует риск использования (для определения доверия сайта) чисто алгоритмического подхода и возможного получения неверных положительных/отрицательных результатов. Уровень доверия сайта будет основан на расстоянии (количестве кликов мышью) от начальных сайтов. Сайт на расстоянии одного клика получает максимум доверия; двух кликов – чуть меньше; трех кликов – еще меньше (и т. д.). На рис. 7.13 показана эта концепция рейтинга TrustRank. Рис. 7.13. Иллюстрация рейтинга TrustRank Авторы доклада по TrustRank опубликовали также еще один доклад, описывающий концепцию массы спама (http: //ilpubs.stanford.edu: 8090/697/1/2005-33.pdf). Этот доклад посвящен оценке эффекта спамерских ссылок на рейтинг сайта (нескорректированный). Чем выше влияние таких ссылок, тем больше вероятность того, что и сам сайт спамерский. В качестве индикатора спама рассматривается также наличие большого количества купленных ссылок. Существует также понятие обратного TrustRank, когда ссылки на спамерские сайты снижают TrustRank сайта. Похоже, что движки Google, Yahoo! и Bing используют какие-то формы измерения доверия (для оценки сайтов) и что этот показатель доверия может быть весьма существенным фактором ранжирования. Для специалистов по оптимизации получить замеры доверия может быть сложно. В настоящее время mozTrust из комплекта Linkscape сайта SEOmoz является единственным публично доступным инструментом для оценки рейтинга TrustRank страницы. Популярное:
|
Последнее изменение этой страницы: 2016-04-10; Просмотров: 834; Нарушение авторского права страницы