комментарии: 163 19.03.2008 Оля Иванова @ Google, Блогерство, Интернет Маркетинг, Поисковые системы, Яndex

Дублирование контента. Часть вторая.

Сегодня решила продолжить тему дублирования содержания, уж очень она меня заинтересовала и как оказалось я упустила из виду Яndex и еще множество нюансов. В принципе, в интернете не так много информации по поводу отношения Яндекса к дублированию. Многие почему-то избегают этой темы, скорее всего из-за недостатка информации.

Вот что мне удалось найти:

Официальные лица Яндекса неоднократно заявляли, что они не будут бороться с воровством контента в сети. Официальный ответ А. Садовского:

… поиск Яндекса при обнаружении дубликатов пытается определить оригинал документа. Существующие алгоритмы, конечно, несовершенны и мы работаем над их улучшением. Что касается юридического регулирования, поисковые системы пока не могут идентифицировать авторство текста. В случае удаления из сети «тыренного» контента (например, в результате действий правообладателя), Яндекс также удалит его из базы по мере обхода роботом. Этот процесс можно ускорить, воспользовавшись формой http://webmaster.yandex.ru/delurl.xml

Поэтому можно сделать вывод, что Яндекс относится к дублированию аналогичным образом, как и Google. Т.е. при формировании результатов поиска он пытается отбросить дублирующие результаты, но зачастую может выкинуть и оригинал статьи. Все это происходит из-за невозможности разработать алгоритмы, которые гарантировали бы 100% определение. Вот поэтому имеют право на жизнь всевозможные сплоги и блоги, переписывающие содержание статьи.

Да и представьте ситуацию. У вас есть конкурент, которого вы хотите устранить, опустив его в выдаче в поисковых системах. И если бы поисковые системы наказывали за дубликацию информации, то вы могли бы разместить статьи с сайта конкурента на нескольких десятках ресурсов. После чего поисковая система наказала бы конкурента и вы в шоколаде. Но к счастью это не так. За дубликацию НЕ НАКАЗЫВАЮТ, как бы вы мне не доказывали мне обратное.

Признаюсь честно, у меня есть один собственный проект – блог (Адрес блога не буду раскрывать из собственных соображений. Названия используемых на блоге плагинов также. При желании, вы всегда сможете найти их в интернете.), так называемый сплог на английском языке. Для него я не пишу статей, они вытягиваются из RSS других блогов при помощи одного плагина к WordPress, а далее содержание статьи переписывается другим плагином, который заменяет слова на синонимы. Получается в каком-то смысле уникальный контент. Качество и читаемость текста конечно падает, не все предложения выглядят осмысленно, но не это главное в данном случае. Главное – минимальные временные затраты на ведение.

Блогом я абсолютно не занимаюсь, единожды все установив и настроив, я про него забыла – весь процесс автоматизирован. При этом постепенно растет число подписчиков, посещаемость, появляются обратные ссылки с других блогов. В общем проект развивается на мое искреннее удивление. Ведь я все-таки считала, что для успешного развития блога необходимо уделять ему много времени (как уделяю этому блогу), но как оказалось это не так. Теперь уже задумываюсь запустить сразу несколько десятков подобных ресурсов с различными тематиками, грамотно их перелинковать и зарабатывать на Adsense.

Ну а Google и не думает наказывать блог за дублирование контента. Большая часть статей присутствует в результатах поиска и есть масса переходов по низкочастотным запросам.

С этической точки зрения – это неправильно, все-таки человек вкладывает свое время и знания в написание статей. Также есть понятие авторского права. Но с другой стороны таким же образом берутся статьи с этого блога и большинство не размещает ссылку на источник. Я к этому отношусь спокойно, скорее просто привыкла. По началу меня это очень злило и я старалась выяснять отношения с хозяевами сплогов. Но сейчас пришла к выводу, что каждый зарабатывает как у него получается.

Еще мне понравилась фраза Zmok: “Пройдет время и Гугл купит Интернет :) А все мы будем ходить в гугле, есть гугл и ездить на гугле:)”. Я думаю примерно так в будущем и будет.

Зарегистрированная версия ePochta Extractor делает автосохранение результатов поиска каждые 60 секунд

Не понравилась статьяПонравилась статья (+1 бал, 3 голосов)

Теперь подписаться на свежие статьи и новости стало еще проще:

Статьи через RSS
Статьи на почту:

Отзывов (163) на "Дублирование контента. Часть вторая."

  1. >Да и представьте ситуацию. У вас есть конкурент, >которого вы хотите устранить, опустив его в выдаче в >поисковых системах. И если бы поисковые системы >наказывали за дубликацию информации, то вы могли бы >разместить статьи с сайта конкурента на нескольких >десятках ресурсов. После чего поисковая система >наказала бы конкурента и вы в шоколаде. Но к счастью >это не так. За дубликацию НЕ НАКАЗЫВАЮТ, как бы вы >мне не доказывали мне обратное.

    К счастью конкурента устранить таким способом не получится. Если сайт конкурента проиндексирован поисковиками, то он и будет считаться оригиналом, т.к. проиндексирован раньше. А за дублирование накажут Ваши сайты с дублированным контентом:)

    • Как будет выглядеть такое наказание сайтов? Можно пример более конкретный. Уж очень это интересно посмотреть на конкретном примере во времени…

    • А что если оригинальный текст у нулевого блога с медленной индексацией, а вор с авторитетом и может оказаться в индексе раньше оригинала? Тем более, что Яша, тестируя свой сервис по борьбе с воровством контента, пока не принимает туда блоги с ТИЦ 0.

    • дублировать очень плохо, не надо засирать интернет

      • Полностью поддерживаю. В интернете много текстовых бирж, где можно заказать уникальный контент.

  2. Я, конечно, не знаю, что там Яндекс отбрасывает или удаляет из базы, но просто на собственном опыте убедился, что по некоторым моим запросам Яндекс выдает на первых двух, трех страницах от 5 до 10 ссылок на разные сайты с одними и теми же статьями, а иногда даже больше.
    По этому поисковый робот – это тупая машина, и как бы алгоритмы не оптимизировали, толку все равно не будет.
    Ибо даже в жизни доказательство авторских прав зачастую приходится доказывать в судах. Если даже группа людей не может правильно определить, кто является автором произведения, то что говорить об алгоритмах, пусть даже самых хитроумных?

    • Согласен машина и впрямь не фантан, да и алгоритмы по определению авторства ну какие могут быть в инете для текста… Туманно…

  3. Гугл хоть и лидер в поиске, но не думаю что настанет время когда мы будем кушать гуглу и ею жить…
    акции Гугл за полгода упали в 2 РАЗА!!! и это не предел.
    стоит изобрести новую технологию поиска, запатентовать ее и не дать гуглу… все… писец бизнесу.
    к тому же есть неплохие стартапы… не помню как называется новый поисковик у которого один из девизов – «мы не боимся гугла» :smile:

  4. Привет Оль!
    Я совсем не спец в этом вопросе, но очень хочется сказать.
    Правильно zimik сказал про суды в реальной жизни. Мне так кажется, ч воровством нужно бороться, но даже яндексу такое не по силам. Да и не прав Садовский, взяв на себя роль присяжного. Воровство это позор любого общества, но оно существует всё время существования человека, как и проституция. И ничего с этим не поделаешь. А выдумки Я, направленные на эту борьбу, смахивают на отмывание бабок. :grin:
    Если уж начинать наводить порядок, то Яндексу нужно с себя начать. имхо. не истина, высказывания не блондинки, короче, я так думаю. :oops:

  5. вот мы подошли к сути -)
    яша, видимо, искусственно занижает позиции сайтов с помощью ВИЦ. у гугла тоже есть подобное, но за счет чего он занижает?
    несмотря на дублирование контента сплоги очень легко выходят в топ по различным НЧ запросам.

    • Думаю что у яши четкой линии в этом вопросе просто нет. Похоже, что все зависит от настроения – сегодня так, завтра все по другому…

    • Лююююдииии, ауууу! Вы чего? Кто вообще сказал, что поисковики – это хорошо. Это если в кратце мошенники, рекетиры. Вот смотрим. Я заплатил деньги провайдеру, который мне принёс интернет. Потом я заплатил самому интернету – хостингу, чтоб что-то моё было в интернете, жило. Ведь что такое интернет – это общая, всеобщая информационная сеть, где любой человек имеет право быть и теперь внимание …и размещать для людей или пользоваться размещённым. Но вот беда, заплатив всем, чтобы быть там – мне не даёт рекет быть там. Он встал между мной и интернетом и сказал – «Плати мне и только тогда ты будешь тут и тебя увидят. Но позвольте – я уже двоим заплатил. Короче, чтобы у тебя была возможность тут торговать – плати нам бабки!. Разве со стороны это не рекет. Откуда они – эти поисковики. Зачем они нам? А вы тут бьётесь спорами, кто кого и почему лучше проиндексирует. Да кто они такие? Так они ещё так жёстко пишут свои алгоритмы, что, как только у тебя заканчиваются деньги – ты не сможешь себя найти даже введя половину имени сайта. Вот так ребятки. Гнать их всех надо. Причём всем населением, тогда это быстро получится. Поисковик конечно нужен, но он должен быть единым – один и фнансово питаться от денег заплаченых провайдеру и хостингу. Мизерный процент не заметный, но в целом со всего мира это будет деньжищная лавина. Так же, как и один банк должен быть в стране. Все люди в нём, т.к. % всего от 1 до 4 и всем ништяк!

      • Странная позиция. Любой поисковик является частным ресурсом и может устанавливать свои правила. То что допустим Яндекс и Гугл имеют большую популярность, это исключительно их заслуга, соответственно все санкции наложенные на сайты, не выкидывают этот сайт из интернет, а всего лишь исключают или занижают его позиции в рамках поисковика. Думаю слово рекет здесь не очень подходит

  6. «… каждый зарабатывает как у него получается» – похоже блогосфера находится в фазе первичного накопления капитала/опыта. А там глядишь и общепринятые правила начнут вырисовываться. Конечно, что-то уже есть и сейчас, но многие эти негласные правила по-просту игнорируют.

  7. :neutral: Яндекс – очень странный. Ну тоесть сделан очень по-русски – как-нибудь, косо и криво, лишь бы живо. Особенно это наблюдается в апдейтах тИЦ. Вот в Гугле все обнуляется, датацентры считают, а здесь хрен поймешь что (((

  8. Хе… ну НИКОГДА Гугл НЕ купит весь Интернет! ;)

    Сила Гугла в том, что он лучше всех освоил бизнес-модель заработка на чужом контенте! Поисковые сервисы – это пока лидеры монетизации, и другие сервисы в этом далеко отстают… но с развитием соцалок юзер все больше ориентируется не только на поиск инфы, но и контактов с дальнейшим развитием связей и отношений… В этом традиционные поисковики абсолютно бессильны помочь… и ошибочно полагать, что самый ресурсоемкий поисковик «по индексации ключевых слов и ссылок на них» ДЕЙСТВИТЕЛЬНО является самым лучшим в плане удовлетворения запросов пользователей… думаю, что это продлится не долго и скоро будет предложен принципиально новый СЕМАНТИЧЕСКИЙ поиск… ;)

    А с Яндексом здесь все понятно: ссылки на «сложные» и «несовершенные» алгоритмы – дешевая отмазка, дабы не встревать в дрязги и сутяжничество «правообладателей» в борьбе за свой копирайт. Изначальное авторство контента установить можно! Сложно, но МОЖНО… ;)

  9. Имхо, доведение до ума системы определения авторства уникального контента неизбежно.

    Как вариант – создание единого сервиса, стандарт которого поддерживался всеми поисковыми системами. Так вот, написав (или отрерайтив :wink: ) статью, мы скармливаем ее сервису и указываем, на каком сайте (или на каких сайтах) позволяем этой статье висеть. Если кто-то другой копирует ее, без указания обратки, то ПС игнорируют эту дублированную страницу и, возможно, немного опускают сайт в общей выдаче.

    Но это, просто мысли :)

  10. Привет Оля!
    Спасибо что зашла ко мне, это было неожиданно и приятно.

    Vin – отличная идея, но… Вряд ли её станут использовать.
    Почему бы, тому же Яндексу это не сделать? с его-то мощностями, уже давно бы реализовали.
    Но… тогда, мозги не кому будет компостировать, оправдывая свой кривой алгоритм и бесконечное выпадение из индекса тысяч белых и пушистых сайтов.

  11. Неужели монополия гугла так уж очевидна?

  12. На каждое действие есть противодействие. Как поисковые системы не старались бы – всегда будет способ их обмануть, подсунуть дор, сплог, или еще что-то. Справедливость совершенствуется слишком медленно. Да и вообще – мне трудно поверить, что им (ПС) это вообще нужно. С ежегодными заработками в миллиарды долларов – всегда можно нанять одну-другую сотню программеров, математиков, ученых и создать «правильный» алгоритм. Звучит наивно, но так оно и есть. По-любому – половину дохода ПС получают от «черной» стороны Интернета.

  13. Наверно я старомодный.. Если бы узнал что моя девушка таким кидаловом занимается (сплогами), прятал бы деньги и ценные вещи в то время когда она ко мне приходит в гости – мало ли чего – «каждый зарабатывает как может».. Или просто с такой девушкой расстался – потому что такая может меня заменить не моргнув глазом на более богатенького..

    Не стоит такие вещи в полукорпоративных блогах постить!

  14. интересно, если у Вас, Ольга,трубу гопники отнимут и челюсть сломают – тоже в милицию обращаться не будем («понимаю, каждый зарабатывает как может»)?

  15. VVH, мне кажется вы подменяете понятия. Ведь копирование информации и видоизменение ее не является нарушением каких-либо законов. Это повседневная вещь.

    Поэтому мне непонятны ваши аналогии.
    Это паранойя.

  16. Ольга, за дублированный контент Яндекс наказывает, посмотрите на скрин Яндекса в посте

    http://mexboy.ru/?p=43

    причем наказал почему меня (автора) :smile:

    ———————————————-
    К счастью конкурента устранить таким способом не получится. Если сайт конкурента проиндексирован поисковиками, то он и будет считаться оригиналом, т.к. проиндексирован раньше. А за дублирование накажут Ваши сайты с дублированным контентом:)
    ———————————————–

    Вам видимо повезло, и вы не сталкивались с фильтром «ты последний»

  17. Вот том и проблема, что поисковик может отвечать лишь за дату ИНДЕКСАЦИИ контента!

    А как с абсолютной точностью определить дату его ПУБЛИКАЦИИ? ;)
    (Не забываем про то, что этот параметр можно легко фальсифицировать… )

    У авторов действительно ценного контента один путь – добиваться того, чтобы для начала сами поисковики научились уважать их права (раз уж они зарабатывают на индексации и ссылках на их контент). А уважение это будет видно в появлении процедур взаимоидействия юзера(автора контента) и поисковика, а точнее в появлении конечных веб-интерфейсов (и API для автоматизации этих механизмов).

    Тогда каждый сможет обратиться к поисковику и сказать: «Я, Вася1, вот мой Сайт1, а на нем мой Текст1 и это исключительно мой Текст1, потому что я его придумал!»

    У Гугла уже были судебные проблемы, связанные с агрегированием инфы с новостийных сайтов…

    Доживем ли? ;)

  18. Привет Оль!
    для предыдущего автора.
    Вы кмменты №9 не читали? Тут автор VIN уже предложил шикарную идею, могу лишь добавить, что Яндекса есть сервис инструментов для веб мастеров, вот там и можно сделать то, что предложил VIN, Только ПСЯ -это не нужно!
    И, никому порядок не нужен, до такой степени. Когда бардак кругом, воровать легче. Им упорядоченность важна, остальное по…
    Нет ничего проще, чем сделать такой сервис, который помогал бы заыиксить авторство или дату первого оригинального поста.

  19. Установить первоисточник публикации не просто, а очень просто. Для этого нужно, чтобы поисковики в принципе согласились на регистрацию сайта первоисточника. Технически такой сервис создать совсем не сложно.

  20. Прально Оля, каждый зарабатывает как может. И не стоит никого слушать. Смешно было читать одного комментатора, который девушку бросил бы из-за того, что та делает сплоги. :mrgreen: Это хит ,конечно.

  21. ИМХО бред БАН за тыренный контент получить раз плюнуть Надо писать свои статьи или хотябы переписывать чужие ато и так весь рунет превращается в ТЫРнет

  22. А я рад, что наши блоггеры, по большей части, соблюдают элементарную негласную человеческую этику, которая всё больше формируется в этику блогосферы рунета.

  23. Имхо, стучать в гугл и яшу в случае воровства контента бесполезно. Они не отвечают за содержимое. А вот если настучать провайдеру, он напугается – потому что суд с него спросит, а не с виртуального хозяина сплога…

  24. Hmm… Не много не соглашусь. То что не наказывают в смысле “банять” то “Да”, но то что понижают в выдаче, это однозначно. Это если не полностью 1:1 скопированныи текст, иначе это попадёт в “суплементал” и вы вообще не увидите эту страницу в выдаче. В отношерие ваших сплогов, то здесь работает правило “шинглов”, которое гласит что “уникальным считается текст где нет повторов на каждые 10 слов”, так что бы сделать уникальный текст, надо периписать каждое 7-8 слово, что ваш плагин и делает.

    “стоит изобрести новую технологию поиска, запатентовать ее и не дать гуглу… все… писец бизнесу.”
    Эх, мечты… Следует учесть что тот же гугл использует ту же теорию шинглов и принципе это не возможно (в теории – “Да”)

    “причем наказал почему меня (автора)”.
    В твоем случае все проще “у неё выше PR (Называй как хочешь ТИЦ, ИЦ и т.д алгоритм один и тот же)”. Отдали приоритет у кого выше.
    “Вам видимо повезло, и вы не сталкивались с фильтром “ты последний”.”
    “Есть такое слово”, работает когда одинаковые по “весу” страницы, ответ смотри выше.

  25. дублирование контента – проблема, причем весьма и весьма серьёзная. У меня пару раз бывали следующие проблемы – выкладываю нулёвый сайт он начинает индексироваться, в это время кто то вытягивает по рсс или просто парсит мой контент, и получается так, что написанный мною контент с точки зрения ПС принадлежит свороваашему его сайту :twisted:

  26. Яндекс не наказывает за плагиат. Сам проверял. Там есть другие приколы – сайт просто так может вылетать из индексации (тИЦ остаётся) :neutral:

  27. Дублирование информации, на мой взляд понятие двойственное. Конечно дублирование авторского текста ни хочет ни один блогер, но ………а как быть с общедоступной информации вселенского масштаба, будь то война, ураган и т.д тоесть то событие которое нельзя двойственное изложить?

  28. Я допускаю дублирование в малых количествах, ведь если,например, хорошая статья висит на малопосещаемом ресурсе, то она никому не видна и не нужна. А если ее скопировать на более авторитетный сайт, соответственно ценность возрастет в разы.

  29. А я рад, что наши блоггеры, по большей части, соблюдают элементарную негласную человеческую этику, которая всё больше формируется в этику блогосферы рунета.

  30. Автоматическое дублирование с дальнейшей уникализацией нормальная тема в seo. А просто копипастить конечно грех.

  31. Интересно как хорошо Яндекс будет определять копии. Если к примеру изменить в тексте 2% слов, то он уже не определит?

  32. а мне интересно: как живут такие сайты, где без дублированного контента не обойтись? новостные например, новости то во всем мире одни и те же..

  33. Воровство статей в интернете это мелочь в сравнении с тем что случается в реале. Есть у меня знакомые издатели, и от них я знаю следующую информацию. Существует такая практика, берется книга научно технической, тематики, либо по истории – археологии и прочее. Автор который написал, ушел в лучший мир.
    А кто-то берет, и выпускает полностью всю книгу, с небольшими поправками, под своим именем. Так что воровство статей, мелочи, целые книги в печатном виде воруют.

  34. Опыт хороший показан. Ноооо утомили сайты в выдаче поисковиков с одним и темже. Найти нужную информацию все сложнее.

  35. для быстрого поиска инфы сейчас приходится пользоваться и гуглом и яндексом паралельно.

  36. Гоша и Яша отличный тандем, хотя и рама тоже не плохой поисковик :smile:

  37. Яша не любит дубли, а так как яша поисковик рунета, то при продажи сылок и прочего заработка на сайте все ориентируются только на него! Я никогда бы не стал размещать копипаст на сайте!

  38. Два года прошло с написания автором этой статьи – а вопрос так и остается открытым и актуальным.
    Как внутри блога появится дублированный контент из-за архива или ярлыков – так сразу пессимизация блога поисковиком, а пойдешь в яндекс что-то искать, так на каждом втором одна и та же статья встречается:(

  39. Яндекс до сих пор не находит дубли, мои два сайта на cms идэнтичны, выдаются по некоторым запросам, друг за другом, например 8 и 9 позиция !

  40. ну давайте не будем забывать что и в Яше и в Гугле – работаю люди, и их алгоритмы пишут они же… а значит есть вероятность и появления ошибок и недоработок… вот из-за этого и получается такое – оригинал удаляют а копии оставляют или как у предыдущих – всё ок.!

  41. Краденый контент, избитая тема (работаю рерайтером, копирайтеров удаленно).
    До сих пор интересно если мой текст переписали (но процент совпадения имеется) то ведь уже точно не докажут? Не докажут. Тогда получается если переписать войну и мир – то можно стать ее автором. А так как это все домыслы, то и наказывать за воровство контента еще не будут лет 10))

  42. Может я конечно не к месту это пишу, но Яндекс меня просто достал!!! Идёт уже пятый месяц, как они меня индексировать не хотят!!!

  43. А тут уже ничего не поделаешь, если украли контент. Бороться с этим практически бесполезно. Легче просто смерится, тут я согласен. Сплоги и ГС – это отвратительно, но жизнь не справедлива….

  44. Ибо пишите сами или заказываейте копирайт :grin:

  45. Контент надо не только заказать, а еще и контролировать его «распространение».

  46. Однако, если дублированный контен размещен на более трастовом ресурсе – яндекс запросто посчитает его оригиналом. Недавно наблидала такой с раскрученным белым клиентским сайтом – клиент разрешил партнеру взять у него контент, партнер разместил его у себя, сайт клиента пропал из выдачи.. виноват оказался кто? правильно, оптимизатор.

  47. Наверное сейчас уже все изменилось, потому что у меня многие сайты с дубляжом просто попали под фильтр. Платоны в ответном письме указали – неуникальность контента:( А в гугле эти сайты до сих пор живы!

  48. chii, да у яндекса есть такая проблема: у кого больше Тиц, тот и первоисточник:(

  49. все что не запрещено – разрешено. мораль и этика – дело каждого.

  50. Как только начал читать статью, сразу подумал об Adsense :grin: .
    Спасибо за статью, многое разъяснилось, надеюсь все на самом деле так, как вы и описали. Обязательно поэкспериментирую.

  51. а разве нет плагинов или защиты от таго же wp o matic – вроде в нете где то видел такой плагин

  52. Есть много методов защиты от копирования – начиная от выключить copy/paste и заканчивая всплывающим окошком с предложением поставить ссылку на первоисточник.
    За два года яша уже начал строже относится к дублированию контента – под фильтр попадают сайты.
    Другое дело если ставится ссылка на оригинал – то все нормально

  53. Гугл может и не наказывает, в том смысле, что не удаляет, но ранжирование по этому признаку у него поставлено лучше, чем у Яндекса. Да и потом, попробуйте начать продавать ссылки на таких страницах: дубли быстренько поотваливаются из индекса.

  54. А я хочу выступить в защиту всех поисковых систем, в том числе и Яши. Прочитав все комментария, создалось впечатление, что многие из оппонентов «в чужом глазу видят соломинку, а вот в своем не видят и бревна». Может, стоит сначала начать с себя.

    Пишите интересные статьи, зачем дублировать. Занимайтесь своим любимым делом. А к поисковым системам, да и к другим веб-сервисам относиться нужно как к инструменту.

    Мы же когда берем молоток и забиваем гвоздь, не ругаем конструктора этого молотка, что у него не та форма и не тот вес. Мы просто берем и бьем по шапке гвоздя. И тут то же самое. Те люди которые работают в и улучшают поисковые системы такие же как и мы с вами, может быть чуть по опытней в каких-то вопросах, а возможно и дилетанты в бытовых вопросах и проблемах.

    Так давайте к ним да и ко всему сообществу www относиться как к себе, с Любовью.

  55. За дубли не наказывают в прямом смысле слова. Но страницу, которую сочтут дублем могут запросто выкинуть из индекса (а она вполне может оказаться продвигаемой). Сайт же полностью состоящий из копипаста рано или поздно вообще зафильтруют, если найдут хоть одну дополнительную причину.

  56. от копирования защититься нельзя..
    я думаю логично предполагать что кто раньше встал того и тапки..
    то бишь кто проиндексирован ранее того и материал

  57. Думаю нет смысла ругать поисковики за то что они не бояться с дублированием контента.. тем более есть способы защиты от этого (опять же используя известные алгоритмы ПС поиска оригинала)…. хотя с помощью тех же методов ожно и себе присвоить авторство статьи.. палка о двух концах конечно..

  58. вот и страшно попасть в плагиаторы с собственными статьями.

  59. Синонимизированный контент (переписанный) тот же Гугл давно научился отделять от действительно оригинального и качественного и ранжирует его априори ниже. Да я слышал, что и Яндекс какую-то аналогичную прогу прикупил…

  60. Boozy, за синонимайз яндекс просто банит, определяя его без всяких проблем. Это началось в 2009 году. А данная статья вышла в 2008.

  61. А перевод с других языков считается дублированием?

  62. Белый, если это автоперевод – сайт будет выкинут из индекса яндекса и очень быстро.

  63. Белый, если перевод ручной, то статьи будут считаться уникальными, а поисковики любят уникальный контент.

  64. Насколько я знаю, гугл сейчас очень активно борется с дублирующим контентом. Взять к примеру тот же поиск по изображениям. Есть у гугла такой механизм (принцип работы мне не известен) который с очень высокой точностью определяет копии тех же изображений…причем даже если они были осветлены, обрезаны и т.д. Позиция гугла очень проста: Хотите уникальных изображений? Берите фотоаппарат и вперед в поле фотографировать.

  65. Всех банить плагиатчиков и не церемониться.

  66. Я считаю,что плагиат,дело нехитрое,но напрочь лишено смысла,а плагиат без указания ссылки на первоисточник,вообще,неуважение к людям потратившим своё время и труд!а вот ре-копирайт,но своими словами,это уже меняет дело,если я пишу статью и по каким либо причинам,она уже есть,то можно и пошаманить с текстом!

  67. каждый зарабатывает как у него получается” – похоже блогосфера находится в фазе первичного накопления капитала/опыта. А там глядишь и общепринятые правила начнут вырисовываться. Конечно, что-то уже есть и сейчас, но многие эти негласные правила по-просту игнорируют ;-) ;-) ;-)

  68. Если разместить ворованный контент на более трастовом сайте, то санкции вполне вероятно получит оригинал :|

  69. Если разместить ворованный контент на более трастовом сайте, то санкции вполне вероятно получит оригинал
    ..
    хм… мне кажется это вата

  70. pr (69), почему? Многие об оэтом пишут и примеры приводят.

  71. Кто сильнее (трастовее) тот и прав.

  72. дождался 2-й части, спасибо

  73. всегда думал, что поисковая машина определяет точно оригинал по дате создания.

  74. Кстати, давненько вы про алгоритмы яндекса ничего не излагали. Нужны новые идеи как с ним бороться! ))

  75. Ну а если на самом сайте дублированный контент? как тогда быть? :idea:

  76. только 5% жителей рунета заполнят виртуальное пространство оргинальным контентом. Остальные 95% его переделывают и копируют. Если вашу статью стырили, то не обижайтесь – это нормально:)

  77. «…поиск Яндекса … пытается …»
    Это точно! Да только «пытается» он так, как его научили люди. А людям свойственно ошибаться.
    Как известно, не бывает программ без ошибок.

  78. что то Яша на дублирование ни сильно смотрит – у меня украли пост и он в рейтинге был намного выше чем мой!

  79. Ха, ну ничего, все поисковики наказывают за дублирование контента… Улучшаются алгоритмы! Скоро кто первый добавит – тот и автор, а остальные вообще учитыватся не будут!

  80. один из двух владельцов контента пострадает, как ни печально больше страдает автор материала. но прогресс не стоит на месте, алгоритмы улучшаются и рерайтинг не стоит на месте!

  81. Раньше я как-то боялся просто копировать контент с других сайтов, по-любому что-то переделывал. А тут прочитав обе статьи с комментами решил для себя, что бояться копипаста не стоит. Жизнь становится чуточьку легче)

  82. Я думаю, что алгоритм можно придумать, дата размещения в нете, кто первый разместил, тот и автор. То есть не тогда когда поисковик проиндексировал, а именно размещение. В этом русле поисковикам нужно работать.

  83. Вплоть до секундного размещения. Даже если по рсс ленте кто-то тут же разместит, это будет минимум несколько секунд. Просто вкладывать деньги в разработку таких алгоритмов, поисковики не хотят. А может они об этом не догадываются :lol:

  84. изза будлирование контента с моего сайта проинексировано тока 12 страниц.
    Буду исправлять свои ошибки.)

  85. «от копирования защититься нельзя..
    я думаю логично предполагать что кто раньше встал того и тапки..
    то бишь кто проиндексирован ранее того и материал»
    Это точно! Обсуждается давно на различных форумах.

  86. Александр

    Однозначно гугл более продвинут, яндекс с его заморочками начинает надоедать, если честно. Но с другой стороны он нужен и приходится и по его правилам играть.

  87. А я так понимаю – оригинал полюбому появляется раньше дубликата. Неужели такие мощные и продуманные поисковики не могут сравнить дату создания? Алгоритмы у них несовершенные… Конечно несовершенные. Ни с чего прислали от гугля бан в адсенсе без права восстановления. Сказали, что мол – накручивал. Ещё тогда, год назад я понял что у них алгоритмы несовершенные…

  88. Из-за дублирования контента сайт вылетает из поисковой системы, поэтому уж, если брать откудато текст, то лучше его рерайтить перед добавлением на свой сайт.

  89. Некоторый копипаст имеет иммунитет от бана, это те же магазины. Кроме того он любит скан, только не тот скан на которых клепают сателиты, а норомальный, где убраны все ошибки скана.

  90. копипаст – это реалия жизни и от него ни куда не денешься… У меня вопрос – а зачем Вам блог на английском языке? и названия прог не подскажете?

  91. как то страшно за свой блог
    по мнению читателей, статьи не плохие, могут и скопировать

    меня удивило устройство блога, который работает на граббере рсс с плагином синонимов. конечно же там тексты с нрузинским акцентом, но если это работает, то попробовать можно

    • Что бы не грабили с блога, по рсс. В блоге нужно поставить галочку, только анонсы. И как правило, если грабят по рсс то текст подвергают машинной уникализации и синонимизации.
      Хотя как показывает практика, даже копипаст живет. У меня поисковик фильмов, полностью сделан на копипасте. И нормально сидит в индексе и каждый день приходят уники.

  92. На счет гугла совершенно с Вами, Ольга, соглашусь! Не проходит много времени между тем, как гугл вечно что-то приобретет, что-то создаст и т.д.

  93. Вопрос очень интересный и ситуация неоднозначная. В связи с несовершенством алгоритмов украсть контент можно абсолютно свободно. При этом воришке ничего не будет, а автора могут пессимизировать. Я, например, всегда пишу уникальные статьи. Даже если рерайт или копирайт, всеравно слежу за уникальностью.

  94. Вопрос в статье поднят просто болезненный. Ну у кого не тырили… Вот поэтому права авторства должны быть каким то образом узаконены, вопрос кто быстрее это сделает. На мой взгляд Гугль все же более последователен в этих вопросах.

  95. К сожалению этот алгоритм Яндекса очень плохо работает, на сколько мне известно.
    Часто в результатах выдачи видишь вначале сайты с более высоким ТИЦ, а сайт автора того же текста в лучшем случае на третьем или седьмом месте.

  96. СПЕЦЫ СКАЖИТЕ ПОЖАЛУЙСТА КАКАЯ ДОЛЖНА БЫТЬ МИНИМАЛЬНАЯ УНИКАЛЬНОСТЬ ТЕКСТА, ЧТОБЫ САЙТ НЕ ВЫЛЕТЕЛ

  97. А если менять слова в тексте на синонимы и оставлять прилагательные? =)

  98. А если менять слова в тексте на синонимы и оставлять прилагательные? =)

    • Сделайте так и проверьте уникальность текста с помощью програмки Advego, сразу получите показатель уникальности вашего текста- из этого уже и делайте вывод, работает ли ваша технология…

  99. Порой, даже если и написал сам себе текст, довольный) проверил в Advego – уникальность 100% – хорошо, настроение поднялось) Поставил на сайт и какая то гадость его сперла, а яндекс в свою очередь определил первоисточником не тебя (какого то…), а ту гадость которая сперла твой текст(( Обидно(

    • Здесь много нюансов, может робот сайт воришки раньше посетил, может сайт более точно по теме статьи «заточен» и много всего еще.
      Но согласен, что это обидно если статья стоящая и грамотно написана.

  100. все поисковики любят контент от 500 слов, вот где проверяется уникальность. а заказывать платные статьи я думаю не стоит, лучше писать все самому руками и головой.

    • Полностью согласен насчет покупных статей. Если любишь свой блог, ценишь читателей, то лучше уж писать собственные статьи, пусть слабенькие с точки зрения копирайтинга, но зато с душой, а не написанные за 15 минут на автомате!

  101. Использовать чужой контент – это то несерьезно по-моему, разве что для сателлита.

  102. Что остается? Как себя защитить? Очень животрепещущая тема для тех кто пишет сам…

  103. Да про гугл, что купит все, по-моему правда, а вот про алгоритмы яндекса стока баек сложено, ну вообщем кто пытался с ним работать все сами могли оценить)))

  104. Это начинание яши поддерживаю целиком и полностью, надоел плагиат и копипаст в блогах. Неужели так сложно написать небольшой текст, в районе 1000 знаков собственными мозгами?!
    А насчет правового регулирования плагиата скажу отмечу, что уже сейчас готовится нормативная база для регулирования интернета и воровства в нем в том числе! Лет через 5-10 плагиат станет не выгодным и опасным занятием и постепенно изживет себя!

  105. Собственными мозгами конечно можно и нужно писать. Но на текущий момент я всё же на свой ресурс кроме своих статей выкладываю копипаст. Ибо не всегда есть возможность писать в сайт несколько оригинальных статей в день.

  106. что-то я сильно сомневаюсь что копипаст станет невыгоде!!!

  107. Яндекс ваще стал суров выкидывает в бан ща оч много сайтов

  108. У меня сайт пропал из Яндекса, а причину не знаю. Написала им они ответили, что разберутся. За что я в бане так и не знаю. А вот прочитав статью подумала, может из-за того, что я свои статьи с сайта (написанные мною) публиковала на многих ресурсах, иногда без ссылки на источник?

    • Они так и ответили, что разберутся? Зная Платонов Яндекса я бы очень удивился, если они на первое же письмо ответили бы не стандартной обтекаемой шаблонной фразой а именно обещанием разобраться :)

    • Вполне себе может быть, ведь получилось, что вы фактически подарили контент другим сайтам. А если у них еще и пузомерки больше чем у вас, то наверняка Яндекс засчитает авторство статьи этому ресурсу.

  109. Они так и ответили, что разберутся? Зная Платонов Яндекса я бы очень удивился, если они на первое же письмо ответили бы не стандартной обтекаемой шаблонной фразой а именно обещанием разобраться

  110. В который раз убедился, что на каждое действие существует противодействие )) Заменил слова синонимами и поисковые боты видят новый уникальный контент… Прикольно!

  111. У яндекса кроме тореного контента других проблем хватает. Если сайт и проиндесирован раньше, все равно можно сделать дубляж контента и пародию на дизайн, Яндекс сначала склейку сделает и понизит сайт конкурента в выдаче. Если жалоба от владельца сайта придет, то хорошо, а нет, то и Яндекс молчать будет…

  112. Очень понравилось описание автоматизированного блога… Если так пойдет, то скоро в интернете вообще не найдешь авторский контент…

  113. Нужно использовать синонимы и всьо будет хорошо

  114. Скоро можно будет взять текст конкурента и удалить из Яндекса))))))

  115. А я еще где то читал, что поисковики моментально просматривают статьи в жж и liveinternet.ru как только они добавляются туда. И ваш уникальный контент, если робот зашол к вам на сайт позже чем в эти блоги, автоматически прикрепляется роботом к этим блогам. А вы расцениваетесь поисковым роботом как вор контента.

  116. Да блин, а Серега прав и докажи потом что ты не жираф. Думаю не настолько фатально все будет происходить, ведь все ресурсы которые поддерживают написание статей на своих площадках типа жж и прочих запросто могут угодить в бан. Или я не прав?

  117. нужно писать уникальный контент и почаще обновлять сайт…и заставить робота жить у вас на сайте

  118. Masha, тут еще и от возраста зависит.
    У меня пара молодых сайтов, домены дропы с тиц правда, добавлял каждый день статьи, уник, человеку понятен, а в индекс не лезет. Бот яши заходит раз в неделю если повезет… А Гугл сожрал уже весь.
    Хотя блогу год, и народ подтянулся немного, тот индексируется быстро. Правда один гад появился, ворует новости, в день или через день после публикации, хоть ссылки оставляет. Вот думаю – абузить его или пусть живет?

  119. И всё-таки Яндекс в сравнении с Гуглом заметно тормозит..а жаль, ведь большинство в России пользуются Яндексом..

  120. как по мне в гугле больше находит инфы, но всё равно в основном всё зависит от ТИЦа ИМХО

  121. Другими словами, статья о кросс-постинге? ТОлько я не понял выводы статьи, это плохо? Хорошо? Работает? Вредит?

    • По части копирования информации – хорошо тем, чью информацию перенесли на свой сайт, если эта информация успела проиндексироваться яндексом. Сайт-первоисточник «растет в глазах Яндекса».

  122. Этот вопрос меня тоже давным-давно мучает! Устала объяснять руководителю о том, что копирование новостей с других сайтов один в один чревато! Вроде бы согласится на время, потом снова начинает: давай вот отсюда нам новость разместим, ещё оттуда и понеслось… Уфф…

  123. Полезные советы

    Это у гугла хорошо получается в англоязычных странах разбираться в дублировании контента, поиска первоисточника, а у нас умом россию не понять…

  124. Полезные советы

    И я вот чето не пойму, у вас уже не дуфоллов блог? У меня плагины показывают что нет….

  125. Обидно то, что если сайт молодой, плохо индексируется, то новость быстрее появиться у того «вора», если его сайт более раскручен и он будет считаться первоисточником.

  126. Да яндекс на порядок отстаёт от гугла и его постояные выкрутасы зачастую просто убивают. даже жаль, что у нас так много народа пользуется именно Яшей

  127. Это конечно плохо, что у таких поисковиков как яша и гугл нет такой функции, тех кто копирует статьи надо наказывать, жестоко наказывать

  128. В яндексе в мастерской есть такая услуга как заявить о своем авторстве на контент, но пока очень слабо это направление развивается и при том что Тий сайта должно быть не менее 10 так что рядовые пока отдыхают

  129. В любом случае, кто бы что не говорил, имхо эта проблема в будущем решится. Точно так же как и с авторством книг или музыки. Плохо это или хорошо, но все в глубине сердца понимают, что это неизбежно. Весь вопрос в том когда это осуществится.

  130. Нет пока законов четких не будет и их выполнений тут такая же ситуация будет что и с фильмами музыкой программами, с одного компа на др перелеваться все будет, это вам не запад, чтоб послушать песню сначало покупают ее в на интернет ресурсе

  131. Никакого наказания со стороны поисковиков не будет в ближайшее время. Да, сайт-плагиатор может загреметь под фильтр. Но с таким же успехом это может произойти и сайтом-оригиналом. Об алгоритмах Яндекса, затачиваемых напильником, вообще говорить смешно.

  132. бывает дубль проходит в яндексе – при наличии обратной ссылки на источник – в этом случае все будет честно. Да и много таких сайтов существует и довольно неплохо..

  133. мдаа, как правило, сначала, все говорят что пишут для людей, позже выесняется, что мысль банальна, -как бы по выгодней представить площадку перед рекламо дателем. и начинают думать как и к чему отнесется поисковик.

    • лучше уникального текста не чего нет – по Advego Plagiatus от 93 % и заточеный ключами ) поисковик такой текст примет с раскрытыми руками

      • Странно, везде пишут по-разному. Я часто слышу, что уникальность должна быть не менее 95%. Потом в Адвего ведь настройки можно разные выставить, например 4 шингла/4 слова или 3х3.

  134. Хорошо, что яндекс идет на встречу авторам. Только пока они не сильно торопятся.

  135. да нечего гадать, просто нанадо сильно переусердствовать с перелинковкой и всякими информерами на главной странице

  136. Яндекс постоянно придумывает в помощь вебмастерам что то новенькое, жаль, что не всегда это работает на нас!

  137. Шикарно, я так и догадывался, что не столь важно, копированный контент или нет, главное все делать с умом. Тогда все будет в порядке.