Проверка уникальности текста от А до Я

Проверка статьи на уникальность позволяет определить процентное соотношение текста, не имеющее совпадений с другими публикациями в Интернете. Эта техническая процедура помогает не только выделиться среди конкурентов с точки зрения читателей, но и в «глазах» поисковых роботов получить более высокие оценки качества ресурса. Уникальный экспертный контент может получать более высокие позиции в поисковой выдаче, особенно, если при этом информация полезна и легко воспринимается. Люди чаще делятся такой информацией, расшаривают её в лентах социальных сетей, обсуждают с коллегами и друзьями.

Однако, это требуется далеко не всегда, а порой может нанести вред. Так, например, когда копирайтеру поручают написать материал о технических характеристиках какого-то механизма, он тут же сталкивается с проблемой неуникальности списка техпараметров и начинает искать выход из сложившейся ситуации: вместо единиц измерения в системе СИ появляются тонны, метры, меняются реальные размеры устройств. На что не идут ради заветного показателя 100% уникальности.

Когда тексту нужна проверка уникальности:

  • при оформлении ключевых страниц сайта (о магазине, главной страницы и т.д.);
  • в описании рубрик интернет-магазинов;
  • в информационных статьях, в том числе публикуемых на страницах сайта компании или в блоге интернет-магазина.

В каких случаях на копи-паст можно закрыть глаза:

  • технические характеристики, системные требования;
  • ингредиенты в рецептах;
  • страницы Доставка, Оплата, Возврат товаров;
  • список симптомов или лекарств при определенной болезни;
  • описание компании в списке фирм;
  • выдержки из законов, цитаты;
  • текст для карточки товара.

Пошаговая инструкция эффективной проверки

Для анализа текста на уникальность достаточно выполнить 4 простых шага:

  1. Копируем всё, кроме главного заголовка (обычно это h1, название статьи, рубрики или товара).
  2. Вставляем в анализатор.
  3. Запускаем проверку.
  4. Если результат ниже ожидаемого, отправляем текст на доработку автору либо вносим правки самостоятельно.

Как только желаемый порог уникальности достигнут, можно публиковать материал на сайт.

Важно! Если ранее не было опыта анализа уникальности документов, не стоит верить на слово результату первого попавшегося под руку сервиса или программы. Лучше прогнать проверку в разных местах и дальше работать с тем, который показал наиболее точный результат.

Как проверить большой текст

Каждый анализатор уникальности текстовых файлов имеет строго заданный лимит на число вводимых символов. Например, у онлайн сервиса Text.ru ограничение в 15 000 знаков. При этом статьи в некоторых тематиках могут быть объемом в 40 000 и более.

Текст большого материала, который не лезет целиком, разбивают на несколько частей и работают с ними по отдельности.

Важно! При проверке отдельных фрагментов статьи-лонгрида можно упустить проблемные места на стыках, поэтому, чтобы точно определить уникальность, места стыков следует проверять дополнительно.

Для уверенности проверку длинной статьи (лонгрида) делают поэтапно. Для наглядности разберем на примере двух небольших фрагментов текста.

Анализируем поочередно куски текста.

Создаем фрагмент на стыке и дополнительно проверяем его. Брать полные предложения не обязательно, особой разницы нет.

Чем проверить уникальность теста

Определять уникальность текста можно как онлайн сервисами, так и специальными программами, которые устанавливаются на компьютер. Все они имеют свои сильные и слабые стороны, а также определенные ограничения при работе.

Справка! Приведенные ниже плюсы и минусы сервисов и софта — это сугубо личное мнение, основанное на реальном опыте работы с ними и трудностях, которые возникали в процессе.

1. Онлайн сервисы

1.1. Text.ru.

Достоинства:

  • качественный анализ на уникальность и рерайт, что делает сервис лучшим по мнению редакции;
  • помогает искать сайты, ворующие контент (после проверки выдаются ссылки на все копии);
  • можно игнорировать свой сайт, чтобы сервис не учитывал совпадение с ним;
  • автоматическая проверка орфографии.

Недостатки:

  • очередь на проверку;
  • бесплатно проверяется только текст, за анализ документа или сайта нужно платить;
  • иногда выдает 100% при проверке заведомо неуникального текста (редко, но возможно);
  • ограничение в 15 000 символов для одного текста.

Чтобы начать работу, регистрация не требуется. У зарегистрированных пользователей и PRO-аккаунтов расширены лимиты, том числе меньше очередь.

Ссылка: https://text.ru/


1.2. Content Watch.

Достоинства:

  • можно игнорировать определенный сайт, указав ссылку на него;
  • помогает искать воров контента;
  • автоматическая регулярная проверка сайта.

Недостатки:

  • без регистрации лимит 10 000 символов;
  • находит меньше копий, чем Text.ru;
  • до 3 проверок в день;
  • довольно часто выдает высокий уровень уникальности (80-90%) для копипаста, за счет чего сложно сделать выводы, на самом деле оно так или это глюк алгоритма.

Ссылка: https://content-watch.ru/text/


1.3. Антиплагиат.

Достоинства:

  • на проверку можно добавить текст в 100 000 символов.

Недостатки:

  • требуется регистрация и авторизация;
  • без оплаты не доступен полный отчет;
  • между проверками нужно ждать 5 мин. 40 сек;
  • не индексирует соц.сети, развлекательные сайты и ряд других типов площадок (можно брать инфу оттуда и проверка покажет 100% оригинальность, хотя по факту будет совсем иначе);
  • для копипаста с информационных сайтов выдает 100% уникальность.

Ссылка: https://www.antiplagiat.ru/


1.4. Антиплагиат Онлайн на Адвего.

Достоинства:

  • максимальная длина текста — 100 000 знаков;
  • SEO-анализ;
  • проверка орфографии (подчеркивает ошибки).

Недостатки:

  • для работы требуется авторизация через социальные сети или регистрация в системе;
  • авторизованному пользователю доступно 3000 символов для проверки, по исчерпанию лимита дальше платно.

Ссылка: https://advego.com/antiplagiat/


1.5. Plagiarisma.

Достоинства:

  • не обнаружено.

Недостатки:

  • лимит 2000 символов (если больше, все равно работает и текст не обрезает);
  • разбивает текст на отдельные предложения, при этом подзаголовки приклеиваются к соседним словам без пробела;
  • анализ полного копипаста выдает 100% уникальности по Yahoo и Google вне зависимости от точного поиска (пробовал включить и отключить эту опцию);
  • нет проверки в Яндексе.

Ссылка: http://plagiarisma.ru/


1.6. Сервис от pr-cy.ru.

Достоинства:

  • показывает тошноту, время на чтение, стоп слова и водность.

Недостатки:

  • ограничение в 1000 символов на текст;
  • перед началом анализа нужно каждый раз вводить капчу.

Ссылка: https://pr-cy.ru/unique/


1.7. Онлайн проверка etxt.ru.

Достоинства:

  • 2 режима: обнаружение копий и рерайтинга.

Недостатки:

  • без регистрации доступна проверка до 3000 знаков (после регистрации 5000, для тех, кто работает с биржей до 10 000);
  • очередь на проверку;
  • находит мало копий (для поиска сайтов, ворующих контент, не подойдет);
  • нельзя выбрать проверку на копии и рерайт одновременно, только одно из двух.

Ссылка: https://www.etxt.ru/antiplagiat/


1.8. Проверка контента на уникальность MegaIndex Tools.

Достоинства:

  • проглатывает текст в 100 000 знаков.

Недостатки:

  • очень долго анализирует даже маленькие статьи по 5000 символов.

Ссылка: http://tools.megaindex.ru/text_uniq/


1.9. Антиплагиат от be1.ru.

Достоинства:

  • полностью бесплатный;
  • покажет сайты с копипастом (ориентир — до 50% уникальности);
  • загружает до 100 страниц сайта.

Недостатки:

  • максимальная длина текста 10 000 символов;
  • выдает странные завышенные цифры (у 100% копипаста по версии be1.ru 50% уника по всем копиям), на что также жалуются люди в отзывах.

Ссылка: https://be1.ru/antiplagiat-online/


1.10. Antiplagius.

Достоинства:

  • максимум 200 000 символов.

Недостатки:

  • нет бесплатных проверок.

Больше подойдет школьникам и студентам, для кого нужен Антиплагиат.ВУЗ. Не вижу смысла платить за проверку в Text.ru или на Etxt — это всё проверяется бесплатно.

Ссылка: https://antiplagius.ru/proverka-unikalnosti-onlajn.html


1.11. Руконтекст.

Достоинства:

  • не обнаружено.

Недостатки:

  • непонятно, что и как проверяет — на 100% копипаст выдает 99% уникальности.

Есть подозрения, что Руконтекст работает только с курсовыми, дипломами и прочими подобными документами.

Ссылка: https://text.rucont.ru/


1.12. Экспресс проверка в Яндексе.

Достоинства:

  • моментальный результат;
  • подходит для поиска сайтов, растащивших контент или определения первоисточника в случае, когда автор решил сдать чужой текст;
  • можно повторить в любом другом поисковике (Google, Bing, Yahoo, Mail и т.д.).

Недостатки:

  • нельзя сразу проверить весь текст, только небольшими фрагментами, по 2-3 предложения (1 средний абзац), лимит — 40 слов (лишнее обрезает);
  • показывает только полные копии (рерайт не видно).

Для проверки копируем фрагмент текста в поисковую строку. Жмем справа кнопку «Найти» или Enter на клавиатуре и наслаждаемся результатом.

Ссылка: https://yandex.ru/


2. Программы

Если требуется определять уникальность регулярно и на объемах, рекомендую изучить список десктопных программ, которые нужно скачивать и устанавливать к себе на компьютер. Только так можно добиться удобной и в то же время продуктивной работы на объемах.

2.1. Advego Plagiatus.

Достоинства:

  • работает с текстами более 100 000 знаков;
  • 2 режима проверки (быстрая и глубокая);
  • выбор кодировки;
  • можно игнорировать домены (чтобы не обращать внимания на свой сайт);
  • подключаются антикапча и прокси;
  • работает под Mac OS;
  • очищает текст от html-тегов.

Недостатки:

  • неудобно работать со списками URL адресов.

Качество проверки на высоком уровне даже при выбранном «Быстром» режиме.

Скачать бесплатно: https://advego.com/plagiatus/ (есть версии под Windows, Mac OS и Linux).


2.2. AntiPlagiarism.net.

Достоинства:

  • 8 режимов проверки (стандартная, экспресс, глубокая, на рерайт, пакетная, SEO, проверка сайта и картинок);
  • режимы можно комбинировать (например, сразу на рерайт и уникальность);
  • работает с текстами объемом свыше 100 000 знаков;
  • высокое качество результата (зависит от настроек);
  • подключение прокси и антикапчи.

Недостатки:

  • при обновлении могут слететь все настройки.

Скачать бесплатно:

Win

Linux

Mac OS


2.3. Плагиата.Нет.

Достоинства:

  • работает с текстом, общий объем которого свыше 100 000 знаков;
  • в настройках можно найти поисковые запросы для разных поисковых систем, которые используются при анализе;
  • можно игнорировать домен при поиске;
  • 5 режимов поиска (высшая школа, быстрый, глубокий, научный и проф анализ);
  • проверка орфографии;
  • интерфейс похож на MS Word.

Недостатки:

  • не нашел, как привязать антикапчу — Google достает с выбором светофоров на картинках, что критично на объемах;
  • для 100% копипаста выдает общую долю заимствований 0% (т.е., по мнению программы текст уникальный).

Мне такая программа не подошла.

Скачать бесплатно: http://mywebs.ru/plagiatanet.html


Рейтинг: ТОП-5 инструментов

В своей практике тестировал различные инструменты для проверки текста на уникальность, включая все вышеперечисленные. Рекомендовать могу следующие (на 1 месте лучший из всех по мнению редакции):

МестоНазваниеТипЛимитыОчередьКачество проверкиАвтоматизация
1AntiPlagiarism.netПрограммаНетНетВысокое*Бесплатно
2Текст.руОнлайн сервис15 000 символов для текста, число проверок без ограниченийЕстьВысокоеПлатно
3Advego PlagiatusПрограммаНетНетХорошееНет
4Поисковая строкаПСНетНетВысокое**Макрос
5Content WatchОнлайн сервис10 000 символов для текста, 3 проверки в день без регистрацииНетХорошееНет

* При моих настройках (что выставить, показано ниже).
** При анализе напрямую через поисковик нет % уникальности и не покажет рерайт, только сайты, где размещен точно такой же текст (подсвечивает жирным).

В конечном счете остановился на программе от биржи Etxt по ряду причин:

  • при моих настройках там стабильный % по результату, пока не появится новых воришек, уникальность не меняется сама по себе;
  • проверяет сразу на рерайт (если информация взята с 1-2 источников и плохо переработана, это видно даже при высокой уникальности);
  • есть пакетная проверка (можно проверить целый раздел сайта и скачать себе результаты или посмотреть их в программе);
  • нет очередей, быстро проверяет;
  • всё бесплатно.

Справка! Text.ru хорош, но там иногда ошибочно выдает 100% и для запуска повторной проверки нужно что-то менять в тексте, иначе анализ не запустится снова. И огромные очереди. Когда необходимо проверить 10-30 материалов, подобные манипуляции отнимают уйму времени и сил.

Далее рассмотрим более детально мой формат работы с программой AntiPlagiarism.net со всеми настройками (раньше она называлась Etxt Антиплагиат).

Настройка параметров качественной проверки

При использовании онлайн-сервисов проверки достаточно просто поместить в окошко текст и запустить анализ. Если же мы имеем дело с приложением, то здесь есть ряд параметров, которые позволяют влиять на качество, скорость и глубину проверки.

Дальше я покажу, какие параметры выставлены в AntiPlagiarism.net у меня. Вы же можете экспериментировать и искать более эффективные настройки под свой проект.

окно программы Etxt Антиплагиат

Так выглядит окно программы AntiPlagiarism.net

Чтобы открыть настройки, можно пройти в меню по пути: Операции — Настройки.

Либо нажать сверху на шестерёнку.

Далее идем по закладкам.

Большинство параметров вкладки Общие видно на скриншоте. Поисковые системы: Yandex, Rambler, Yahoo. Google не беру, т.к. с ним практически при каждом запросе будет лезть капча (сложная, с угадыванием картинок — долго и муторно её разгадывать). Если нужно проверить парочку документов, можно включить Гугл и дополнительно проверить в нем.

Шрифт и цвет фона на вкладке Редактор можно выставить любой, это не влияет на результат.

Важно! Автоматическую проверку обновлений отключаем. После обновления могут слететь все настройки и еще далеко не факт, что будет работать так же, как и до обновы в плане качества анализа.

На вкладке Другие выставляем настройки соединения, как на скриншоте. После чего надо определиться, есть ли желание самостоятельно вводить капчу. Если не знаете, что это такое и пока непонятно, в блоке Защита от автопоиска ставим галочку Показывать капчу (Ya, Ni, Qi, Ra, Go) и снимаем под этим, рядом с пунктом Использовать сервис антикапчи. После чего в ходе сканирования страниц программа будет выдавать окошки, где надо угадывать картинки или вводить обрывки фраз — это и есть капча.

Если не хочется тратить на это время, ниже разберем, как разгадку капчи автоматизировать.

Массовая проверка страниц сайта на уникальность

Проверка 1-2 текстов происходит простым копированием тела документа в окно анализа. Когда же появляется необходимость проверки уникальности целого сайта, например, в 500 страниц и более, по одной проверять крайне неэффективно. Для таких случаев есть несколько вариантов так называемой пакетной проверки, т.е. мы отсылаем в программу адреса страниц и на выходе получаем результат по каждой из представленных ссылок.

В своей практике я использую функционал Проверка сайта, куда разом можно выгрузить 100 ссылок на уже существующие в сети документы.

Для удобства создаем обычный текстовый файл, где с новой строки указываем свои URL-адреса для анализа. Загружаем в Etxt Антиплагиат и запускаем проверку.

Результат можно выгрузить в Excel или бегло изучить в интерфейсе самой программы.

Рассмотрим алгоритм массовой проверки конкретнее на примере одного из моих сайтов. Для начала нужен текстовый файл, куда вставляем ссылки на проверяемые документы.

Внимание! Цифры от 1 до 5 слева — это автоматическая простановка номера строки. Их не надо вбивать у себя, если пользуетесь обычным блокнотом. У вас должны быть только ссылки. Причем, ваши, а не мои :)

Переходим в Проверку сайта, открываем файл. Окно программы приобретет примерно такой вид:

Нажимаем кнопку Проверить уникальность. Программа начинает сканирование.

Важно! Во время сканирования нельзя нажимать что-либо в окне программы. Исключение — если надо экстренно прервать процесс анализа (что-то забыли или не то отправили на обработку). В противном случае софт может зависнуть и придется закрывать через диспетчер задач и запускать всё заново.

По окончанию получаем итог пакетной проверки в журнале. Конкретно в моём случае сайт старый и его давным давно растащили, с уникальностью совсем беда.

Журнал можно перемотать выше и посмотреть, какие именно сайты скопировали ваш контент и сколько их на данный момент, если речь идет о старом проекте, или посмотреть источники, откуда автор-халявщик брал вам информацию для совсем свежего материала.

Например, так:

Для сравнения прогнал эту же статью в Text.ru и Content Watch. Вот их результаты:

Текст ру нашел даже двух воришек. Помимо спецтехники появился новый фигурант — некий comhom.

Контент Вотч показывает 100% уникальность текста. Несмотря на то, что 2 других сервиса говорят об обратном.

Автоматизация процесса

Когда проверка уникальности приобретает масштабный характер, мало кому придется по вкусу сидеть и целыми днями разгадывать капчу, чтобы проанализировать сотни и тысячи страниц текста. С гуглом это надоест и на 10 страницах.

На помощь приходят сервисы антикапчи. Их существует несколько, Etxt поддерживает следующие:

Суть в том, что мы платим примерно $1 за 1000 разгаданных капч и забываем об этом процессе, просто введя свой личный код в настройки программы на вкладке Другие.

В этом случае процесс проверки перестает быть полностью бесплатным, $1-2 придется вложить. Это позволит грузить пакеты ссылок на проверку и заниматься своими делами, пока программа анализирует уникальность без вашего участия.

Какой процент уникальности текста считается хорошим

Идеал — 100%. С этим всё ясно, но далеко не всегда такое достижимо. В своих проектах я придерживаюсь планки в 90-95%, с погрешностью на заведомо не уникальные куски технических параметров или симптомов болезней, которые иногда можно оформлять таблицами в виде картинок. При условии, что это не обедняет текст и там будут слова из этого абзаца, разбросанные хаотично по телу документа. В совсем уж технических планка может опускаться до 80%. Если ниже — контент перерабатывается до более высоких показателей. У кого-то цифры могут отличаться.

Тип текста Допустимый % уникальности
технический от 80%
медицинский от 80-90%
юридический от 70%

Ответы на частые вопросы

1. Сохранится ли уникальность статьи, если добавить её в Оригинальные тексты Яндекса?

Нет. В Яндекс Вебмастере есть уточнение, что они ничего не гарантируют.

Когда-то пользовался, но в 2015 году мой игровой сайт частично растащили на вики-страницы Вконтакте и полностью скопировали под Украину. Все тексты статей на тот момент были добавлены в Оригинальные. Страницы Вконтакте стали ранжироваться вместе с моими, где-то ниже, где-то выше, а в Украине мой сайт полностью исчез из выдачи и его место занял чужой копипаст. Администрация Яндекса и Вконтакте поставили меня перед фактом, что в рунете всегда так :) на том и разошлись.

Было предложено решать вопрос своими силами: написать администратору группы, хозяину домена и т.д. Но только новичок будет делать копипаст на себя. Как правило, это дохлый номер.

2. Что делать, если у текста низкая уникальность?

Надо смотреть по ситуации: если речь о только что написанном тексте, который предстоит опубликовать на свой информационный сайт или сдавать заказчику, тогда переписывать. Исключение — дорвеи и прочие сайты на копи-пасте.

Если же речь о карточке товара, то можно оставить её не уникальной. При продвижении магазинов это особой роли не играет. Главное — чтобы текст был взят там, где это не запрещено. Иначе могут быть нехорошие последствия и в конечном итоге все-равно придется переписывать.

Сохраните себе статью, чтобы не потерять!
Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Политика конфиденциальности