Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии 


Скрытый контент, который может быть воспринят как спам




Скрытый текст – это одна из проблем, с которой сталкиваются web-мастера и поисковые движки. Спамеры продолжают использовать скрытый текст для фаршировки своих страниц ключевыми словами (с целью искусственного завышения своих рейтингов). Поисковые движки стараются обнаружить это и затем предпринимают соответствующие меры. Есть много вариантов нечаянного создания скрытого текста, но никто не хочет быть наказанным за то, чего не собирался делать. Чтобы лучше это понять, полезно прочитать руководство Google’s Webmaster Guidelines (http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=66353), где, в частности, сказано:

"Если ваш сайт воспринимается как содержащий скрытый текст и имеющий ссылки, которые сделаны с мошенническими намерениями, то ваш сайт будет удален из индекса Google и не появится на страницах с результатами поиска".

В ветке Google Groups по адресу http://groups.google.com/group/Google_Webmaster_Help-Indexing/browse_thread/thread/928aa76a1226cf89/32b089e3248cef78 сотрудница компании Google госпожа Susan Moskwa сказала следующее:

"Конечно, как и во многих других технологиях, между явно мошенническим и абсолютно приемлемым есть много оттенков серого. Matt Cutts (глава подразделения Web Spam компании Google) сказал, что сокрытие текста перемещает нас на один шаг ближе к серой зоне. Но если вы имеете совершенно законный сайт, то вам не стоит об этом беспокоиться. Если же ваш сайт уже демонстрирует целый букет других теневых технологий, то скрытый текст тоже начинает выглядеть как один из элементов этого списка. Это подобно тому, как 1 грамм песка незаметен, но большое количество песка напоминает пляж".

На эту тему имеется также и пост Matt Cutts на Threadwatch (http://www.threadwatch.org/node/4313#comment-26883):

"Если вы откровенно используете CSS для сокрытия текста, то не удивляйтесь, если это назовут спамом. Я не утверждаю, что наведение мыши или текст DHTML являются спамом. Но представьте себе, как это выглядит для посетителя, для конкурента или для проверяющего отчет по спаму. Если вы показываете название вашей компании Expo Markers вместо логотипа Expo Markers, то все должно быть хорошо. Но если вы решаете показать текст "Expo Markers cheap online discount buy online Expo Markers sale…", то тогда я буду более осторожен, потому что это выглядит плохо".

Понятно, что вы хотели бы избежать этого. Обратите внимание на использование слова "воспринимается" в отрывке из руководства Google Webmaster Guidelines. Это не простая проблема "черное-белое", не так ли? (Поскольку существует много способов для создания скрытого текста.)

Несколько способов создания скрытого текста

Существует множество техник создания скрытого текста. Вы можете использовать некоторые из них без применения CSS (их обычно очень легко обнаружить).

• Сделайте цвет вашего текста и цвет фона одинаковыми (или практически одинаковыми). Это самый первый способ, который для создания скрытого текста использовали спамеры. Обнаружить его легко.

• Установите размер шрифта для текста в 0 или в отрицательное число. Это также легко обнаружить.

• Используйте тег noscript. Этот тег говорит браузеру о том, что именно нужно показать на странице в том месте, где имеется блок JavaScript, а поддержка JavaScript в браузере отключена. Фактически это "псевдоскрытый" текст. Несмотря на то, что можно сделать текст внутри тега noscript отличающимся от того, который содержится в JavaScript, примерно 3 % пользователей его увидят. И этого более чем достаточно для того, чтобы написать жалобу на спам в поисковый движок. Иначе говоря, фаршировка ключевыми словами тегов noscript влечет за собой изрядный риск.

• Разместите ваш текст значительно ниже рамки. Это также псевдоскрытый текст. Итак, несмотря на то, что текст видим, он расположен вне области страницы, ориентированной на действия, и находится ниже рамки (пользователю нужно прокрутить вниз, чтобы увидеть его). Текст может быть непосредственно связан с основным назначением сайта и его намерение в данном случае – это фаршировка ключевыми словами. Его тяжело выявить алгоритмически, но человек, скорее всего, его заметит и расценит как плохой сигнал.

• Используйте для сокрытия текста методы на основе CSS. Методы CSS для создания скрытого текста более сложные, поскольку их гораздо труднее обнаружить паукам поисковых движков (если они не просматривают и не интерпретируют CSS). Большинство пауков на данный момент этого не делают. Однако многие подобные методики используются в совершенно законных целях (например, атрибут display: none часто применяется для создания выпадающих меню).



Непреднамеренное создание скрытого текста

Имеется несколько способов создания скрытого текста нечаянно. Один из самых часто встречающихся – это при помощи вашей системы управления контентом (CMS), которая имеет некоторые встроенные в нее методы на базе CSS. Например, многие CMS используют атрибут display: none для реализации выпадающих меню или других виджетов, которые после щелчка пользователя "разворачиваются" и показывают текст. Хороший пример – закладки с папками. Иногда метод display: none используется в системах генерируемого пользователями контента, когда страница показывает количество комментариев на данный пост (но подавляет текст "Comments" в том случае, когда комментариев еще нет).

Еще один часто встречающийся вариант создания скрытого текста – это когда предоставляют расширения для слабовидящих людей. Как и в ранее приведенном примере с использованием скрытых меток внутри таблицы, этот вариант появляется, потому что вы стараетесь разместить текст в таком месте, где он будет выглядеть как нагромождение для пользователя с нормальным зрением. Иногда для обеих групп пользователей применяют такое решение, когда текст скрывается от хорошо видящих пользователей.

Многие из этих сценариев не имеют никакой ценности с точки зрения поисковой оптимизации (даже при использовании спамерами). Эти технологии обычно не влекут риска подвергнуться штрафу, поскольку нет причин подозревать негативных намерений.

Фильтрация спама и штрафы

C течением времени становится все труднее обыгрывать поисковые движки и гораздо легче получать от них штраф или полный запрет, восстановиться после которых трудно.

Последствиями могут быть рейтинговые штрафы, лишение сайта способности голосования (т. е. возможности передавать PageRank), неполная индексация (т. е. частичный запрет сайта) или (что хуже всего) полный запрет сайта.

Иммунитета нет даже у крупных корпораций, которые тратят большие деньги на рекламу Google AdWords. Например, весь сайт BMW.de был на некоторое время запрещен в Google, поскольку на нем были созданы входные страницы, полные ключевых слов, созданные исключительно для пауков поисковых движков (и не предназначенные для просмотра пользователями). Чтобы еще больше наказать BMW, инженер Google господин Matt Cutts публично обвинил компанию в своем блоге. Он сделал из BMW показательный пример и все сообщество поисковых оптимизаторов узнало об опрометчивом поступке производителя автомобилей.

Поисковые движки в основном выявляют спам автоматическими средствами, но им помогают также платные оценщики, добровольцы и даже ваши конкуренты. Инженеры компаний Google, Yahoo! и Microsoft пишут сложные алгоритмы, которые ищут аномалии во входящих и исходящих ссылках, в структуре предложений, в коде HTML и т. д.

С точки зрения поисковых движков, поисковая оптимизация бывает допустимой и недопустимой. В общем смысле любые действия, которые направлены на повышение рейтинга сайта в поисковых движках без повышения реальной ценности страниц, могут считаться спамом.

Каждый поисковый движок опубликовал свое руководство. Вот они:

• Google’s Webmaster Guidelines находится по адресу: http://www.google.com/webmasters/guidelines.html;

• Yahoo! Search Content Quality Guidelines находится по адресу: http://help.yahoo.com/help/us/ysearch/basics/basics-18.html;

• Bing Guidelines for Successful Indexing находится по адресу: http://help.live.com/help.aspx?mkt=en-us&project=wl_webmasters.

Каждый поисковый движок имеет свою степень толерантности к разным тактикам поисковой оптимизации. Все то, что нарушает указания этих руководств, засоряет результаты поиска нерелевантной или бесполезной информацией, либо способно поставить вас в неудобное положение в том случае, если это будет обнаружено представителем Google AdWords или Yahoo! все это является нежелательным и всего этого следует избегать.

Существует большая разница между понятиями "дружественный к поисковым движкам" и "пересекший черту и попавший на территорию спама". "Дружественный к поисковым движкам" может означать, например, что:

• данный сайт легко доступен паукам (даже если он сделан на основе базы данных);

• его HTML-код вычищен для минимизации количества избыточного кода;

• важные заголовки (такие, как названия товаров) отделены от остального текста (например, с помощью тегов Н1) и содержат релевантные ключевые слова (вместо обычных ссылок типа "щелкните здесь" или "дополнительная информация").

Сравните эти базовые практики оптимизации со следующими спамерскими манипуляциями для поисковых движков.

• Выдача поисковым движкам таких страниц, которые бесполезны, непонятны, непригодны для просмотра человеком, либо каким-то иным способом лишены ценного контента. Это такие, как: "входные страницы", "страницы-мосты", "страницы перехода", "страницы притяжения", "рекламные страницы", "страницы-каналы", "информационные страницы каталогов", "сателлитные сайты", "мини-сайты", "магнитные сайты" или "теневые домены". Как вы их ни назовете, они по определению создаются для единственной цели – поднять рейтинг в поисковых движках.

• Создание сайтов с минимальным количеством полезного уникального контента. Для этого существует множество способов, в том числе:

– дублирование страниц с внесением минимальных изменений (или вообще без них) и показ их тем же самым поисковым движкам под новым URL или на новом домене;

– машинное генерирование контента с заданными плотностями ключевых слов, например, при помощи цепей Маркова. Подробнее об этих методиках можно прочитать по адресу http://en.kerouac3001.com/markov-chains-spam-that-search-engines-like-pt-1-5.htm, но применять их не рекомендуется;

– вставка в контент сайта насыщенной ключевыми словами, но не имеющей смысла "тарабарщины" (ее называют также spamglish);

– создание малоценных сайтов исключительно для целей партнерского маркетинга (более полное определение понятия "тонкий партнер" смотрите далее в разделе про дублированный контент).

• Повторение одной и той же ключевой фразы в теге заголовка, теге Н1, первом теге alt страницы, метаописании, первом предложении текста, а также в якорном тексте, указывающем на страницу ссылок.

• Нацеливание на явно нерелевантные ключевые слова.

• Сокрытие насыщенного ключевыми словами текста или ссылок внутри HTML-кода страницы, чтобы он не был виден человеку (внутри тегов комментариев, тегов noscript, тегов noframe, цветной текст на фоне такого же цвета, крошечный размер шрифта, слои, ссылки (которые не видны пользователю как ссылки, потому что никак не выделены, например, подчеркиванием)).

• Кража контента с других сайтов и использование его для скармливания поисковым движкам. Для этого используются так называемые "скребки". Сюда же относится и практика, известная под названием splogging – это создание блогов и размещение в них краденого или машинно-сгенерированного контента.

• Покупка ссылок с целью повлиять на поисковые рейтинги.

• Участие в "фермах ссылок" (которые отличаются от каталогов тем, что они меньше организованы и имеют больше ссылок на страницах) или в схемах взаимных ссылок с нерелевантными сайтами (с целью искусственно повысить важность вашего сайта).

• Фаршировка гостевых книг, блогов и форумов большим количеством насыщенных ключевыми словами текстовых ссылок (с целью искусственно повысить важность вашего сайта).

• Выполнение скрытых перенаправлений (немедленное перенаправление посетителей, входящих на ваш сайт с насыщенной ключевыми словами страницы (имеющей рейтинг в поисковом движке) на какую-то другую страницу (которая не имеет такого же высокого рейтинга)).

• Клоакинг (маскировка), т. е. обнаружение посещений пауков из поисковых движков и модификация контента страниц специально для пауков (для повышения рейтинга).

• Покупка доменов с истекшим сроком (с высоким рейтингом PageRank) или захват доменных имен с истекшим сроком с целью использования входящих ссылок предыдущего сайта.

• "Игра в боулинг с Google" – подписка ваших конкурентов на фермы ссылок и т. д. (чтобы их оштрафовали).

Все эти тактики весьма сомнительны с точки зрения их эффективности и вызывают подозрения в глазах поисковых движков, что часто приводит к штрафам или запретам в поисковых движках. И этот риск постоянно увеличивается, поскольку движки все более агрессивно удаляют нарушителей из своих индексов. Мы не советуем применять эти тактики тем, кто рассчитывает получить от поисковой оптимизации пользу в долговременном плане.

Поисковые движки выявляют такие тактики не только при помощи автоматизированных средств со сложными противоспамерскими алгоритмами, но и при помощи посылаемых пользователями сообщений о спаме, и конечно же, при помощи ваших конкурентов. Вы также можете сообщать о спамерах в специальных формах, расположенных по следующим URL:

• Google: http://www.google.com/contact/spamreport.html;

• Yahoo!: http://add.yahoo.com/fast/help/us/ysearch/cgi_reportsearchspam;

• Bing: http://support.msn.com/feedbacksearch.aspx.

Маркетологи часто даже и не знают, что они поступают неправильно. Например, несколько лет назад компания JC Penney наняла поставщика услуг по поисковой оптимизации, который применил нежелательную тактику "входных страниц". Поэтому (как подтвердил источник в компании Yahoo!) без ведома компании JC Penney весь ее интернет-каталог (за исключением начальной страницы) был запрещен движком Yahoo! на много месяцев. Это должно было стоить данному торговцу целого состояния.

Маркетологи могут попасть под перекрестный огонь даже без всякой причины. Например, поисковые движки гораздо тщательнее изучают те страницы, которые имеют признаки возможного жульничества, такие как: теги no-archive, теги noscript, теги noframe, и маскировку, даже если все это используется вполне этично.

Существует популярный миф о том, что поисковая оптимизация – это вечная шахматная игра между специалистами по оптимизации и поисковыми движками. Один делает ход, другой меняет правила или алгоритм, затем с учетом новых правил делается следующий ход и т. д. Понятно, что если вы не будете участвовать в этом постоянном состязании тактик, то не получите желаемого вами повышения рейтингов.

Для соблюдающих этику специалистов по оптимизации это принципиально неверно. Поисковые движки совершенствуют свои алгоритмы для противодействия спамерам. Если вы достигли высоких рейтингов при помощи таких тактик поисковой оптимизации, которые соответствуют руководствам поисковых движков, то, вероятно, добъетесь устойчивых результатов.

Считать поисковую оптимизацию шахматной игрой между вами и поисковыми движками недальновидно. Поисковые движки хотят предоставлять своим пользователям релевантные результаты поиска. Попытка обмануть поисковые движки и получить нечестное преимущество при помощи дешевых трюков не принесет ничего хорошего ни для кого – ни для компании, ни для ее поставщика услуг по поисковой оптимизации, ни для поискового движка, ни для его пользователей. Однако верно и то, что однажды законно примененная тактика может стать менее эффективной. Но это обычно происходит только из-за увеличения количества тех компаний, которые используют такую же тактику.





Рекомендуемые страницы:


Читайте также:



Последнее изменение этой страницы: 2016-04-10; Просмотров: 433; Нарушение авторского права страницы


lektsia.com 2007 - 2021 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.02 с.) Главная | Обратная связь