Дорвей
Дорвей (от англ. doorway — входная дверь, портал) или входная страница — вид поискового спама, веб-страница, специально оптимизированная под один или несколько поисковых запросов с единственной целью её попадания на высокие места в результатах поиска по этим запросам.Иногда дорвеем называют и целый веб-сайт, состоящий из таких страниц.
Основные сведения
Как правило, содержимое дорвея не представляет никакой информационной ценности для посетителя страницы, и содержит в себе ссылку или автоматическую переадресацию (редирект) на некоторую другую целевую страницу или сайт, раскручивающийся при помощи таких дорвеев.
Редирект технически может быть реализован при помощью сценариев JavaScript, HTML-тега Meta refresh, Macromedia Flash и других технологий. В последнее время, многие поисковые боты научились отслеживать быстрый редирект. Поэтому, создателям дорвеев приходится использовать более изощренные методы перенаправления пользователей на целевой ресурс. Например, «принуждая» их нажимать на кнопку «Вход» или изображение-ссылку.
Оптимизация страницы осуществляется путем искусственного увеличения факторов ранжирования страницы поисковой системой, например за счет создания страницы с текстом с большой частотой вхождения фразы нужного запроса.
Дорвеи, как и другие виды поискового спама, относятся к так называемой «чёрной оптимизации», и поэтому поисковые системы стремятся автоматически и вручную исключать их из своих индексов, как сайты, не имеющие никакой смысловой нагрузки для людей, а используемые исключительно для обмана поисковых роботов и, в большинстве случаев, для извлечения прибыли.
Редирект технически может быть реализован при помощью сценариев JavaScript, HTML-тега Meta refresh, Macromedia Flash и других технологий. В последнее время, многие поисковые боты научились отслеживать быстрый редирект. Поэтому, создателям дорвеев приходится использовать более изощренные методы перенаправления пользователей на целевой ресурс. Например, «принуждая» их нажимать на кнопку «Вход» или изображение-ссылку.
Оптимизация страницы осуществляется путем искусственного увеличения факторов ранжирования страницы поисковой системой, например за счет создания страницы с текстом с большой частотой вхождения фразы нужного запроса.
Дорвеи, как и другие виды поискового спама, относятся к так называемой «чёрной оптимизации», и поэтому поисковые системы стремятся автоматически и вручную исключать их из своих индексов, как сайты, не имеющие никакой смысловой нагрузки для людей, а используемые исключительно для обмана поисковых роботов и, в большинстве случаев, для извлечения прибыли.
Генераторы дорвеев
Программы для автоматического создания дорвеев на жаргоне поисковых оптимизаторов известны как «доргены».
Часто они используют такие статистические методы, как марковские цепи, для создания множества страниц с бессмысленным текстом на основе списка ключевых слов и коллекции тематических текстов. Такой подход позволяет без участия человека (что было бы трудозатратно) создавать страницы с уникальным содержимым, не определяющиеся поисковыми системами как дубликаты других страниц. Тексты получаются локально, на уровне соседних слов, похожими на естественный текст, что затрудняет их обнаружение поисковыми системами, но в последнее время успешно разрабатываются методы для их обнаружения
Кроме марковских цепей применяются и другие методы:
Использование синонимизаторов для получения уникального текста из существующего текста заменой слов на их синонимы. Такие тексты часто легко обнаружить по появлению словосочетаний, нехарактерных естественному тексту. Так, например, «Новый год» может быть заменён на «свежий год», а «друг от друга» — на «товарищ от друга». Некоторые генераторы даже не утруждаются поправлять окончания у слов при замене.
Склейка сниппетов из результатов поиска по целевым запросам.
Использование систем машинного перевода.
Созданные страницы могут быть связаны ссылками между собой и, иногда, с другими сайтами, размещающими дорвеев. Некоторые генераторы дорвеев способны динамически, во время запроса, создавать страницы или целые сайты и сочетать их с такими приёмами, как клоакинг, другие же генерируют статический набор HTML-страниц.
Часто они используют такие статистические методы, как марковские цепи, для создания множества страниц с бессмысленным текстом на основе списка ключевых слов и коллекции тематических текстов. Такой подход позволяет без участия человека (что было бы трудозатратно) создавать страницы с уникальным содержимым, не определяющиеся поисковыми системами как дубликаты других страниц. Тексты получаются локально, на уровне соседних слов, похожими на естественный текст, что затрудняет их обнаружение поисковыми системами, но в последнее время успешно разрабатываются методы для их обнаружения
Кроме марковских цепей применяются и другие методы:
Использование синонимизаторов для получения уникального текста из существующего текста заменой слов на их синонимы. Такие тексты часто легко обнаружить по появлению словосочетаний, нехарактерных естественному тексту. Так, например, «Новый год» может быть заменён на «свежий год», а «друг от друга» — на «товарищ от друга». Некоторые генераторы даже не утруждаются поправлять окончания у слов при замене.
Склейка сниппетов из результатов поиска по целевым запросам.
Использование систем машинного перевода.
Созданные страницы могут быть связаны ссылками между собой и, иногда, с другими сайтами, размещающими дорвеев. Некоторые генераторы дорвеев способны динамически, во время запроса, создавать страницы или целые сайты и сочетать их с такими приёмами, как клоакинг, другие же генерируют статический набор HTML-страниц.