Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Основы дружественности к поисковым движкам
Пауки поисковых движков должны суметь прочитать и интерпретировать код вашего web-сайта, чтобы правильно просмотреть и проиндексировать содержимое ваших web-страниц. Не путайте это с правилами таких организаций, как консорциум W3C, который выпускает указания по структуре HTML. Следование указаниям W3C вполне может быть хорошей идеей, однако огромное большинство сайтов не выполняет эти указания, так что поисковые движки обычно просто пропускают нарушения этих правил (если паукам удается проанализировать этот код). К сожалению, существуют такие способы отображения контента и навигации на web-страницах, которые работают для человека, но невидимы (или трудно различимы) для пауков поисковых движков. Например, есть множество разных способов встраивания контента и навигации в состав страниц web-сайта. По большей части они разработаны для людей. Простой HTML-текст и HTML-ссылки (например, начальная страница Alchemist Media, рис. 6.12) одинаково хорошо работают как для людей, так и для пауков поисковых движков. Рис. 6.12. Пример страницы с простыми текстом и текстовой ссылкой Формы поиска и web-формы На многих сайтах есть функции поиска, являющиеся специальными поисковыми движками, которые индексируют контент сайта и предоставляют к нему доступ. Это довольно популярный способ помощи пользователям, чтобы они могли быстро найти дорогу по сложному сайту. Например, web-сайт Pew Internet (http: //www.pewinternet.org) предоставляет поиск по сайту в правом верхнем углу. Это отличный инструмент для пользователей, но поисковые движки им блокируются. Поисковые движки при своей работе только просматривают структуру ссылок Интернета, а не заполняют формы и не пытаются делать случайные запросы в полях поиска. Таким образом, любой контент, доступ к которому можно получить исключительно через поиск по сайту, останется невидимым для Google, Yahoo! и Bing. Формы – это популярное средство интерактивности. Самая простая из них форма " свяжитесь с нами", которая имеется на многих web-сайтах. К сожалению, пауки не заполняют и не отправляют такие формы. Таким образом, доступный пользователям этих форм контент является недоступным для поисковых движков. В случае формы " свяжитесь с нами" это не имеет большого значения, но формы других типов могут привести к более серьезным проблемам. Тем web-сайтам, которые имеют скрытый за экранами регистрации контент, придется либо предоставить текстовые ссылки на этот контент (что делает ненужным сам экран входа), либо реализовать First Click Free (обсуждается далее в разд. " Поставка контента и управление поисковыми пауками” этой главы). Java, изображения, аудио и видео Файлы Adobe Shockwave, вставки Java, аудио и видео (в любом формате) представляют собой такой контент, который, по большей части, не может быть просмотрен пауками основных поисковых движков. За исключением некоторых случаев (которые мы обсудим позже), поисковые движки могут читать только текст, представленный в формате HTML. Встраивание важных ключевых слов или целых параграфов текста в изображение или Java-консоль делает их невидимыми для пауков. Точно так же и произносимые слова в аудио– или видеофайле поисковыми движками прочитаны быть не могут. Атрибут alt, созданный изначально как метаданные для языка разметки и как тег доступности для слабовидящих пользователей, является хорошим способом предоставления текстового контента (или по крайней мере какой-то его части) для поисковых движков (при отображении изображений или встроенного нетекстового контента). Обратите внимание, что атрибут alt не является сильным сигналом, использование этого атрибута с ссылкой на изображение не является заменой простой текстовой ссылки с целевым якорным текстом. Хорошей альтернативой является использование заголовков и текстовых описаний в HTML-контенте (там, где это возможно). За последние несколько лет появились компании, предлагающие услуги по транскрипции (автоматическому созданию текста по словам в аудио или видео). Предоставление таких транскрипций на страницах с медиафайлами сделает ваш контент доступным для поисковых движков и даст возможность найти его тем пользователям, которые делают поиск по ключевым словам. Вы можете также использовать программное обеспечение (такое, как Dragon Naturally Speaking) и продиктовать свою транскрипцию вашему компьютеру. AJAX и JavaScript JavaScript позволяет использовать на web-сайте много динамических функций, большинство из которых очень мало мешает работе пауков. Исключением является тот случай, когда страница делает вызов JavaScript (чтобы попасть на другую страницу или чтобы извлечь контент, который пауки не видят внутри HTML). Несмотря на то, что такие случаи относительно редки, все же лучше знать о том, как роботы просматривают и индексируют. И контент, и ссылки должны быть доступны в необработанной HTML-странице (во избежание проблем). Асинхронный JavaScript и XML (AJAX) создают похожие проблемы, особенно при доставке контента, который поисковые движки не могут просмотреть. Поскольку AJAX для извлечения данных без обновления страницы или изменения URL использует вызовы баз данных, то содержащийся за такими технологиями контент часто полностью скрыт от поисковых движков (рис. 6.13). Рис. 6.13. Проблема при использовании AJAX При использовании AJAX вы можете рассмотреть возможность реализации альтернативной системы просмотра, которой смогут воспользоваться поисковые движки. Приложения AJAX настолько дружественны к пользователю и так привлекательны, что для многих издателей отказаться от них было бы слишком непрактично. Создание каталога ссылок и страниц, которые смогут просматривать поисковые движки, будет гораздо более удачным решением. Когда вы будете строить эти вторичные структуры из ссылок и страниц, не забудьте предоставить к ним доступ и пользователям. Внутри самого приложения AJAX дайте посетителям возможность сделать " прямую ссылку на данную страницу" и свяжите этот URL с тем URL, который вы предоставляете паукам поисковых движков (в вашей структуре ссылок). Приложения AJAX не только имеют непросматриваемый пауками контент, но зачастую не получают также и точных ссылок от пользователей (поскольку URL не меняется). Более новые версии AJAX используют разделитель #, который работает как строка запроса к приложению AJAX. Это позволяет делать ссылки непосредственно на страницы приложения. Однако и сам знак # (который используется для закладок в HTML) и все, что следует за ним, игнорируется поисковыми движками. Так происходит в основном потому, что web-браузеры используют то, что находится после #, для перехода к якорю внутри страницы, а это делается локально в браузере. Иначе говоря, браузер не посылает полный URL, поэтому информация о параметрах (т. е. текст после #) не передается обратно на сервер. Поэтому не используйте возможность делать ссылки внутри приложения AJAX как решение проблемы показа поисковым движкам страниц, находящихся внутри приложения. Все показанные таким образом страницы будут видны как имеющие один и тот же URL (тот, который предшествует знаку #). Убедитесь в том, что вы создаете разные web-страницы, имеющие уникальные URL (для удобства поисковых движков). Фреймы Фреймы появились в середине 90-х годов как популярный способ реализации простых систем навигации. К сожалению, как удобство пользования (в 99 % случаев), так и дружественность фреймов к поиску (в 99, 99 % случаев) были исключительно низкими. Сегодня i-фреймы и CSS могут вполне заменить потребность во фреймах (когда такая функциональность сайту требуется). Самой большой проблемой с фреймами и i-фреймами для поисковых движков является то, что они часто держат контент с двух или более URL на одной странице. Поисковые движки, которые направляют пользователя только на один URL, могут быть сбиты с толку и направить посетителя на одиночные (потерянные) страницы внутри сайта (предназначенного для показа сразу нескольких URL). Кроме того, поскольку поисковые движки используют ссылки, а страницы фреймов часто меняют контент для пользователей без изменения URL, то внешние ссылки указывают на неправильный URL (это получается непреднамеренно). Как следствие, ссылки на страницу (содержащую фрейм или i-фрейм) могут и не указывать на тот контент, на который они должны были указать. На рис. 6.14 показана страница, иллюстрирующая то, как множество страниц комбинируется в единый URL с фреймами, что приводит к распылению ссылок и проблемам с пауками. Рис. 6.14. Пример страницы с использованием фреймов Популярное:
|
Последнее изменение этой страницы: 2016-04-10; Просмотров: 551; Нарушение авторского права страницы