Защита контента от копирования

Content is king

Без контента (то есть «наполнения» — текстов, иллюстраций и так далее) сайт не будет работать и приносить прибыль. Согласитесь, трудно представить себе человека, который что-то купит у фирмы, предлагающей нечто вроде «Страница в разработке» или «Тест ТЕСТ тест тест». Эта аксиома не требует доказательств, а потому сразу перейдем к вопросам о том, где взять контент, и как защитить его от копирования.

Контент можно:

  1. создать самостоятельно — способ весьма трудоемкий (к тому же вы вряд ли являетесь специалистом по копирайтингу, то есть написанию продающих текстов, профессиональным фотографом и иллюстратором);

  2. заказать в специализированной компании или у фрилансера — это оптимальный вариант (диапазон цен очень широк: от 70 рублей за страницу средненького текста до 4000-6000 долларов за полное наполнение сайта профессионально подготовленными материалами);

  3. украсть у конкурентов или на сайтах аналогичной тематики (причем эту «операцию Ы» можно провести как без стеснения — заимствовать тексты и картинки целиком, так и с некоторой степенью порядочности — с рерайтом). Рерайт — это переписывание чужого текста своими словами (точнее, обычной заменой каждого третьего-пятого слова синонимом).

Очевидно, что для любого серьезного проекта подходят только первые два варианта. Третий же будет для честных людей постоянной опасностью — особенно потому, что поисковые системы наказывают («пессимизируют», понижают в результатах поиска) сайты с дублирующимся контентом. Самое неприятное, что они не пытаются определить первоисточник! Проблема защиты от копирования особенно актуальна, если у вас очень хороший и часто обновляющийся контент, и его воруют чуть ли не в режиме реального времени.

Если вы приняли решение не использовать «контрафактный» контент, то защита интеллектуальной собственности и пресечение попыток воровства станет важной задачей. И, повторимся, дело не только в принципиальности и том, что «вор должен сидеть в тюрьме», а именно в политике поисковых систем по отношению к копиям вашего контента. Вам придется либо защищать свой контент, либо постоянно его заменять, переписывать, — а это недешевое удовольствие.

Итак, у владельца сайта и оригинального контента есть две задачи:

  1. принять превентивные меры для защиты интеллектуальной собственности;

  2. вовремя обнаруживать и пресекать попытки копирования текстов и прочих материалов в досудебном и судебном порядках.

Предупреждающие меры защиты контента

К сожалению, пока ни Яндекс, ни Google не предоставляют инструментария или официальной процедуры подтверждения прав на контент. Поэтому приходится ставить эксперименты и пытаться выяснить, по каким критериям поисковики определяют первоисточники.

  1. Достаточно известный (потому, что он работающий) способ закрепить за собой статус первоисточника — приобретать на каждый материал несколько входящих ссылок с достаточно длинными анкорами-цитатами из защищаемого контента. Согласно результатам многих проверок, если на текст есть ссылки с цитатами из него же, поисковик с гораздо меньшей вероятностью сочтет первоисточником этого материала другой сайт.

  2. Еще один очевидный метод — писать тексты таким образом, чтобы их было трудно поставить на сайт другой организации без коренной переделки. К сожалению, этот способ работает только против мелких воришек, рыщущих по сети в поисках наполнения для своих СДЛ («сайтов для людей»). Если же контент копируется с цель наполнения сателлитов и прочих «сайтов не для людей», его содержание не имеет значения. Таким «текстовым гангстерам» важны только тематика и оригинальность (отсутствие множества копий в интернете).

  3. Может помочь простое размещение предупреждения о том, что контент защищается юридически. Поскольку у копипастеров есть огромный выбор контента для кражи, они могут оставить ваш сайт в покое. А вот ставить «водяные знаки» на иллюстрациях не стоит: это раздражает посетителей вашего сайта, а от копирования практически не защищает. Также мы не рекомендуем пользоваться различными плагинами и скриптами, запрещающими копирование текста, вставляющими какие-то дополнительные строки и т.п. Все это может быть воспринято поисковой системой как попытка обмана, клоакинга (подмены контента). Сайт, применяющий такие хитрости — пусть и с благими намерениями — достаточно сильно рискует выпасть из результатов поиска или заметно потерять позиции.

Помимо технических способов защиты, будьте готовы защищать свои интересы в суде. Конечно, нужно заранее просчитать, будет ли рентабельно оформление авторских прав на контент (в том числе и вновь создаваемый), а также юридическое обслуживание в целом. Может оказаться, что проще смириться и переписывать, пусть и за деньги, украденные тексты заново. Консультации по поводу защиты авторских прав на контент вы всегда можете получить в компании «

Сенешаль Нейман

»: она специализируется как раз на правовых аспектах интеллектуальной собственности в интернете.

Служба внешней разведки

Как можно обнаружить, что у вас украли тексты? Существует несколько сервисов, способных помочь в несении почетного караула. Конечно, если текста на сайте немного, можно делать проверку и вручную: просто брать произвольный кусок текста (не слишком большой) и задавать его Яндексу и Google как поисковый запрос, предварительно заключив в кавычки.

Перечисленные ниже сервисы работают по такому же принципу, просто облегчая работу по нажиманию волшебных хоткеев Ctrl-C и Ctrl-V.

  1. Программа Double Content Finder от сервиса textbroker.ru. Простой интерфейс без изысков. Позволяет провести поиск копий текста из файла или размещенного на указанной веб-странице.

  2. Веб-сервис copyscape.com. Классика проверки текстов на уникальность. Даже в бесплатном функционале предоставляет неплохие возможности. Проверку проводит на основе обращений к Google. За сравнительно же небольшие деньги CopyScape предоставляет более продвинутый сервис: полную проверку всех страниц сайта (их ведь может быть несколько тысяч), а также периодическую автоматическую проверку. У сервиса есть и API, что позволит при желании написать собственный скрипт.

  3. Проверить, не украли ли у вас иллюстрации и изображения (с некоторой степенью точности) поможет сервис TinEye.

Как защитить контент

Если проверка выявила наличие копий, необходимо связаться с владельцами этих сайтов. К сожалению, далеко не всегда владельцы подобных ресурсов оставляют какую бы то ни было контактную информацию. В этом случае есть два пути:

  1. попытаться получить ее с помощью whois-сервиса, предоставляющего всю открытую информацию по домену (например, http://whois.org/). Но далеко не во всех доменных зонах есть требования к владельцам доменов о предоставлении оригиналов документов, поэтому многие недобросовестные личности оставляют в whois произвольные или неполные данные.

  2. связаться с хостером, в дата-центрах которого размещен сервер сайта-вора.

Чтобы определить хостера по домену, существует несколько методов.

  • Первый — посмотреть ns-серверы в той же самой whois-информации. Очень часто в них указывается домен хостера, хотя некоторые сайты могут пользоваться своими DNS.

  • Достаточный объем информации можно получить с использованием DNS Lookup — например, удобного сервиса http://www.lookupserver.com/.

Далее можно отправить хостеру или администрации дата-центра письмо с уведомлением о ситуации и готовности передать дело в суд. Полезно перевести это типовое письмо на английский, так как многие «копипастеры» размещают свои сайты не на российских хостингах. В некотором проценте случаев хостер отреагирует закрытием сайта-вора, однако некоторые «абузоустойчивые» хостинги сами основаны и поддерживаются киберпреступниками. Ни на какие юридические уведомления они реагировать не будут, а сами серверы физически расположены далеко за пределами России — в странах, где интернет-право не регулирует такие вопросы. К сожалению, пока слабость юридических процедур не позволяет обеспечить решение вопроса в пользу правообладателя в ста процентах случаев.

Однако можно попробовать зайти с другого конца: если вы позаботились о регистрации прав на контент, следует написать в службу поддержки поисковика и объяснить ситуацию. Но при этом документы на контент не должны вызывать сомнений, а ваш сайт — не быть спам-площадкой или тем, что поддержка поисковика может классифицировать как «мусорный» ресурс.

Выводы

Итак, если написать достаточное количество писем всем людям и службам, способным повлиять на присутствие украденного у вас контента в сети, в каком-то проценте случаев можно добиться результата. Однако велика вероятность и отсутствия реакции. В этом случае нужно переписать контент — если, конечно, вы не озаботились его защитой с помощью ссылок с анкорами-цитатами.