комментарии: 43 18.03.2008 Оля Иванова @ Google, Интернет Маркетинг, Поисковые системы

Дублирование содержания

Для многих до сих пор остается актуальным вопрос, как реагируют поисковые системы на дублирующий контент. Наказывают ли они сайты за это, понижают ли в результатах выдачи или просто «закрывают глаза»? Очень часто этот вопрос задавали читатели моего блога. И поэтому сегодня я решила провести небольшое исследование и собрать информацию из авторитетных источников об этом вопросе.

Начну для начала со своей точки зрения и размышлений. Насколько я сталкивалась с этим вопросом, то поисковики не наказывают сайты за дублирование содержания. А результаты выдачи формируются за счет совокупности показателей, основным из которых является наличие обратных ссылок на ресурс. Ведь сколько в интернете существует сплогов, сколько сайтов имеют общий контент, исходя из своего направления: информационные ресурсы, дублирующие новости, интернет-магазины с одинаковыми описаниями товаров и т.д. А сколько существует блогов, которые просто копируют контент…

Да и я сейчас работаю над 2 сайтами, имеющих практически одинаковый контент, но при этом оба находятся очень высоко в выдаче поисковиков по основным ключевым словам. Один для русской аудитории – http://www.epochta.ru/, второй для украинской – http://www.epochta.com.ua/. Первый находится высоко в русском Google, второй в украинском. И ни один из сайтов не был наказан за почти полную схожесть.

Получается для поисковика в результатах выдачи большое значение имеет географическая составляющая сайта – на какую аудиторию он рассчитан, так как число обратных ссылок на русский сайт значительно выше, чем на украинский. Тогда возникает вопрос, каким образом поисковик определяет какой из сайтов опубликовал оригинальный материал, а какой скопировал и какой вообще выдавать выше в результатах поиска?

В этом случае также имеет значение множество факторов (google заявляет, что их более 100): дата опубликования статьи на сайте, наличие обратных ссылок на данную статью, общий рейтинг и авторитетность сайта.

В принципе? можно манипулировать дублированием контента, обманывая поисковые системы. Существует простейший вариант, копируется содержание статьи и после этого размещается на нескольких ресурсах ссылка на эту статью. Таким способом даётся понять поисковой системе, что это оригинал. Подобная методика даже получила собственное название: Google-Bombing и Google-Washing.

Ну а что же говорят авторитетные источники и представители поисковых систем?

Ванесса Фокх на Search Marketing Expo очертила отношение Google к этому вопросу:

  • Google хочет показывать в результатах поиска свежий и уникальный контент и предоставляет возможности веб-мастерам избавиться на их сайтах от дублирования контента.
  • Само по себе дублирование контента не может повлечь за собой наказания в виде пенальти. Google старается выбирать из дублей только одну копию для показа в результатах поиска.
  • Само по себе дублирование контента не может привести к тому, что сайт попадет в дополнительный индекс (suggestion results), хотя косвенно дублирование может повлиять на это.

Исходя из этого, меня удивляют заявления некоторых вебмастеров, что их ресурсы вылетели из результатов поиска по причине, что Google наказал их за дублирование контента, которого на самом деле не было.

Google может наказать сайт в случаях:

  • если сайт является зеркальной копией другого сайта;
  • если страницы на одном сайте копируют страницы другого сайта с незначительными изменениями;

В случае если страницы были скопированы из разных источников и нет никакой закономерности в их копировании, то сайт никогда не будет наказан за это!

Какой напрашивается вывод? Google и ему подобные постоянно подчеркивают, что главное качественный уникальный контент и сайт будет иметь соответствующие позиции в поисковиках. Но в итоге мы видим, что сайты дублирующие контент зачастую в выдаче стоят выше и наблюдается определенный сдвиг от важности контента к наличию обратных ссылок.

Ресурс для проверки уникальности контента: Copyscape.

Не понравилась статьяПонравилась статья (+1 бал, 1 голосов)

Теперь подписаться на свежие статьи и новости стало еще проще:

Статьи через RSS
Статьи на почту:

Отзывов (43) на "Дублирование содержания"

  1. порадовала статья.

    расскажу свою историю.
    имеется сайт, движок самописный. парсер рсс стоит на кроне. забирает всё новости с рсс 2х сайтов и сохраняет полные версии с источников./а-я-яй нехороший я человек :mrgreen: /
    в общем-то гугла довольно лояльно относится к сайту, сайт легко выходит в топе по НЧ запросам. а вывод такой – используйте хотя бы простой синонимайзер и ваш говносайт переживет третье пришествие :cool:

    тема не раскрыта ибо забыли рассмотреть дорогого Я. у него, конечно же, свои замахи. как раз думал написать статейку о фильтрах Я. -)

  2. seoplayer, вы правы. Яндекс я упустила. Думаю сегодня продолжу эту тему, так как вопрос интересный и важный.

  3. спасиб :smile: за пост :grin:

    Да, географическая составляющая это хорошо, но не всегда. У меня есть проект – http://www.English4U.com.ua , он находится в Яше и Гугле довольно высоко по своим запросам, но только для украинцев… для россиян он куда ниже, хотя по контенту там куча уникального и интересного контента.
    Создал недавно http://www.English4Free.ru (специально в зоне РУ), так этот сайт теперь для России показывается на более высоких позициях, чем исходный, хотя контент во многом просто скопирован, да и показатели ТИЦ/Пр у него значно пониже :lol: правда добавил туда и много уникального контента и сделал совершенно другой дизайн и верстку.

  4. Сайт, дергающий контент из множества других сайтов – своего рода каталог, только называется по-другому.

    Поэтому ничего страшного в виде санкций за копипаст статей, но не целых сайтов, не будет.

    Только склейка :D И тут уже кто сильнее, тот и прав.

  5. Как раз сейчас планирую перевести свой блог в stand-alone вариант, мой текущий блог кросспостится на многие другие платформы.
    Встает вопрос, если я перенесу базу с основного блога на новый stand-alone и буду продолжать кросспостинг, не сочтет ли Яндекс, мой новый блог – копией старого, попадает ли он в рейтинг, етц…

  6. Если одна и та же статья находится на нескольких сайтах, то оригиналом считается та, которую поисковик нашел раньше. Установкой ссылок на дублированный контент обмануть поисковик не получится, потому что он учитывает возраст ссылок.
    За дублирование контента САЙТЫ действительно не наказываются, за это наказываются СТРАНИЦЫ. Поисковики стремятся выбрать из дублирующих страниц оригинальную, а остальные из поиска выкинуть. Это называется склейка. На это и жалуются многие вебмастера.
    Скопированы страницы сайта из одного источника или из разных – абсолютно неважно, главное не ставить ссылку на оригинал.
    Другой вопрос, что алгоритмы поисковиков не совершенны и действительно в выдаче много дублей. Особенно если это не полные копии, а с небольшими изменениями. Но это не значит что склейки не существует.

    • А бывают обидные моменты, когда ты выложил статью, ее у тебя скопировали и выложили у себя, а поисковик принял копию за оригинал… Обидно будет.

  7. Если говорить по аналогии с одним древнегреческим философом – «понятно, что ничего непонятно». С одной стороны есть вебмастера-кадры, которые вообще не парятся насчет этого вопроса – синонимизатор или тому подобное запускают или втупую все тырят и имеют свой доход. Другие же попадают под различные штрафы и баны:(

  8. Andrey A Dengin многие начинают новые блоги с чистого листа в этом случаи=))

    Но можно и как вы хотите, главное потом блог не закидывать, а писать и писать. :smile:

  9. >Скопированы страницы сайта из одного источника или >из разных – абсолютно неважно, главное не ставить >ссылку на оригинал.

    Главное, не ставить ссылку на страницу с оригиналом. А на морду сайта ставить желательно, если хотя бы правым боком левой пятки к СДЛ.

  10. Тааак, это уже интересней. Попробую без матов ) Ольга, почему вы не оплатили мой пост на блогуне? Обьясните пожалуйста, может индивидуум, который прописался гадить у меня в каментах, отстанет со своими глупостями?

  11. Очень интересный и главное уникальный пост, спасибо. Но по собственному опыту заметил, что если копируемый контент уже присутствует на нескольких сайтах, то через ПС он находится не будет СОВСЕМ, даже по НЧ.

    Так что, имхо, в любом случае необходим рерайт.

  12. >Главное, не ставить ссылку на страницу с оригиналом. А на
    >морду сайта ставить желательно, если хотя бы правым боком
    >левой пятки к СДЛ.

    Если говорить о том, как избежать склейки, то ссылку на сайт-источник ставить нельзя – ни на морду ни тем более на конкретную страницу. Если моральные убеждения так делать не позволяют – это другой вопрос. Но тогда не удивляйтесь, когда поисковики такие страницы поклеют.

  13. Белый негр, в понедельник, когда я увидела вариант исполнения статьи, то за что мне надо было переводить деньги? за тот бред с оскорблениями, что ты написал?
    была бы нормальная статья, я сразу бы перевела деньги.
    Предлагаю вариант, ты удаляешь ту статью со всеми комментариями и размещаешь нормальную. После чего я перевожу тебе деньги.

  14. Есть несколько сплогов. Гугля относиться более-мение, хотя часто выкидывает около 50% страниц с индекса, а вот яша совсем никак.

  15. А у меня сайты банили за дублирование, в не зависимости от местоположения и айпишников разных :cry:

  16. Не укажу какой сайт (на всякий случай), но наполнение таково- пишется с книжки, статьи в инете не уникальны, но при этом по-какой-то причине сайт отлично кушает яндекс, буквально час-два и новая страница в индексе, при чем отнюдь не внизу, по НЧ часто в топе. Другие поисковики игнорируют абсолютно, правда сайту без году неделя, прогнала по каталогам, жду, авось и они заметят) с яндекса идет неплохой трафик уже, правда все гадаю, за что он этот сайт так возлюбил и откуда узнал (на момент индексации первых страниц не было ни одной внешней ссылки)

  17. Simple, а ты уверен что за дублирование контента?

  18. Оля Иванова,
    Да, там больше придраться не к чему было. Красивый блог с уникальным дизайном, без рекламы и продажных ссылок, только половина статей дубли :grin:

  19. За дублированный контент поисковики запросто могут забанить сайт или пессимизировать (это вероятнее). Для того, чтобы полностью не забанили сайт, надо, чтобы и собственные статьи на сайте были.

    По поводу первичности источника контента…
    Гугл считает первоисточником контента тот сайт, у которого PR выше (читай количество и качество входящих ссылок). Поэтому часто получается, что сайт с ворованным контентом, но пиаристый, в выдаче, а первоисточник в бане или просто пессимизирован. До тех пор, пока поисковики не введут учет времени появления статьи, ситуация будет сохраняться.

  20. Яша сейчас безбожно выкидывает из индекса за дубли.
    Гугл как в англоязычной,так и в русской части за дубли санкций не применяет. Выводы сделаны на основании анализа более сотни собственных гавносайтов, как русских, так и английских. :smile:

  21. С одной стороны есть вебмастера-кадры, которые вообще не парятся насчет этого вопроса – синонимизатор или тому подобное запускают или втупую все тырят и имеют свой доход. Другие же попадают под различные штрафы.

  22. Сайт, дергающий контент из множества других сайтов – своего рода каталог, только называется по-другому. :mrgreen:

  23. Согласен с Sergey google за дубли не выкидывает!!! :smile:

  24. [...] Оля Иванова пишет: Получается для поисковика в результатах выдачи большое значение имеет географическая составляющая сайта – на какую аудиторию он рассчитан, так как число обратных ссылок на русский сайт значительно выше, чем на украинский. Тогда возникает вопрос, каким образом поисковик определяет какой из сайтов … Само по себе дублирование контента не может привести к тому, что сайт попадет в дополнительный индекс (suggestion results), хотя косвенно дублирование может повлиять на это. … [...]

  25. Спасибо за статью. ;-)

    P.S.
    Гугл , поисковик мирового масштаба и нечего его сравнивать с яшой.

  26. Полностью согласен с vin
    что копируемый контент уже присутствует на нескольких сайтах, то через ПС он находится не будет СОВСЕМ, даже по НЧ.

  27. За дублирование своих же собственных страниц (в пределах одного сайта) не наказывают. Но при продаже на них СЕО-ссылок могут наложить фильтр.

  28. Ну так в чем проблема то,меняем пару слов и все уже не Копипаст!) У меня есть сайты которые питаются с Одной БД, получается Контент Одинаковый а разные только Дизайны!

  29. Наказать то может не накажут, а вот вор часто может быть выдаче выше. К примеру, если у него более узкая тематика, если он обновляется чаще. Так же очень вредно, если контент сайта разворован не на содержание страницы, а для создания анкоров.

  30. Сайт, использующий контент других сайтов – своего рода каталог, только называется по-другому. Поэтому ничего страшного в виде санкций за копипаст статей, но не целых сайтов, не будет.

  31. Гугл , поисковик мирового масштаба и нечего его сравнивать с яшой.

    • В некоторых аспектах есть и преимущества яши перед гуглом, но только в некоторых местах и только для русского интернета

  32. у меня много раз выровали контент, создал сайт пример: создал сайт, залил контентом уникальным, конечно индексация сайта долже чем роскрученые, и вот сайт который был больше роскрученый потырил всё мои статьи (

  33. Для блогов и сайтов на вордпрессе актуальная проблема т.к. контент дублируется множество раз благодаря архивам автора, категориям и т.д.

    Но вот плохо ли это и стоит ли закрывать от индексации категории и архивы – хрен его знает. Я например не закрываю и пока не заметил чтобы это негативно отражалось на жизни сайта/блога.

  34. А как же тогда с форумами?
    Например, есть вопрос любой от человека «А», а человек «Б» просто скопировал статью с какого-нибудь сайта и вставил в ответ. А в то время, таких людей «А» и ответчиков, копирующих текст с других сайтов очень много. Получается, что форумы надо вообще забанивать при «рождении сайта»???

  35. Полезные советы

    Хочу сказать, что это сейчас вас не наказывает гугл, а потом методы ранжирования изменятся, и накажут. Но опять же, у вас не весь то контент одинаковый. В интернете можно найти 1000 сайтов на одном шаблоне и иногда схожей информацией, но всем хорошо)))

  36. Гугл красавец, он все кушает, места для хранения хватает. А в Яндексе пошли по другому пути – пусть вебмастера сами все очищают, ищут, а мы придем на готовенькое)

  37. да гугл по любому умнее, и яндекс нежно курит в сторонке

  38. Пока не наказывают, будут воровать… А не наказывают потому что трудно определить виновника…

Твиттер