Поисковый спам

Материал из Provizorii
Перейти к: навигация, поиск

Поисковый спам (спамдексинг) — сайты и страницы в интернете, созданные с целью манипуляций результатами поиска в поисковых машинах — в конечном счете, для обмана пользователя.

Основные виды поискового спама

  • Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в тегах meta keywords, description, например sex, халява. Этот вид спама появился, когда веб-дизайн только зарождался. В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта.
  • «Невидимый текст», текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 пиксель, блоки текста, со стилем «display:none».
  • Ссылочный спам — ссылки, «накручивающие» link popularity и PageRank сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок:
    1. Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной.
    2. Принять участие в обмене ссылками.
    3. Приобретать ссылки за деньги.
    4. Ссылочный спам с гостевых книг, блогов, вики и пр.

Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании.

  • Дорвеи — промежуточные страницы, созданные для накрутки веса страницы при ссылочном ранжировании или для организации Гугл-бомбы. В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной может быть неограниченное число дорвеев. Поисковые машины в ответ, удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку «Вход на сайт» или что-то подобное.
  • Маскировка или клоакинг — анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь.

Последствия использования поискового спама

Главная проблема поискового спама заключается в том, что он порождает кучу мусорного контента — миллионы сгенерированных страниц бессмысленного текста, а так же бесконечные до непрогружаемости ветки комментариев с фентерминовыми и покерными ссылками. Поисковой спам в итоге обесценивает Интернет как источник информации и заставляет поисковые системы тратить силы и время на его искоренение, а не на повышение релевантности поисковых результатов.

Последствия использования поискового спама

В связи с активным использованием поискового спама отношения поисковик-сайт перешли из «дружеских» во «враждебные». Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то в связи с активным использованием этих методов для «обмана» поисковых систем более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что делает затруднительным поиск «добропорядочных» страниц к редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми «средние века, поэзия, Восточная Европа», не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова «средние века, поэзия» врят ли будет найдена по этим ключевым словам.