Студентам на заметку. Можно ли обойти антиплагиат с текстом

Антиплагиат выявляет текст, созданный ChatGPT (новость от мая 2023 года).

Для начала, как "Антиплагиат" распознает сгенерированный текст.

В основном они работают по одному и тому же принципу: смотрят на "предсказуемость" каждого следующего слова в тексте. Например, если дополнять приложение "Каждый день он ходит на…", то очевидные ответы - "работу" или "учебу". Нейросети, особенно устаревшие, составляют именно такие предсказуемые цепочки, чтобы не потерять связность. Людям тоже свойственна шаблонность, но не на протяжении всего текста. Такую последовательность и вычисляют сервисы, но чем сложнее нейросеть - тем сложнее и разнообразнее генерация текста.

Детектор обучен и протестирован на большом наборе данных, поэтому риск ложного срабатывания минимален, уверяют в "Антиплагиате".

В Тинькофф журнале писали о практическом опыте проверки:

✖

В итоге: четыре текста из шести не прошли проверку - "Антиплагиат" определил работу нейросети.

У них появилась отметка "Подозрительные". Причем система распознала и старую модель GPT-3 - она справилась хуже всех, - и актуальные GPT-3.5 и GPT-4.

Полностью прошли проверку "Антиплагиата" только те тексты, которые изначально сгенерировали на английском языке, а потом пропустили через переводчик.

Части работ, которые не прошли изначально Антиплагиат, заново переписали через ChatGPT с запросом: "Перепиши этот текст так, чтобы он был оригинальным и проходил проверку сервисов, которые определяют, что текст сгенерировала нейросеть. Сделай его более читаемым". Перегенерация не помогла. "Антиплагиат" снова выделил больше половины текста красным, а оригинальность упала на долю процента.

Другим пользователям удалось обойти проверку "Антиплагиата".

Александр Жадан, который написал диплом с помощью ChatGPT и прославился этим, тоже опробовал новую функцию "Антиплагиата". Он отправил на платную проверку девять страниц своего диплома. Сервис посчитал весь документ подозрительным и отметил, что три страницы сгенерированы в нейросетях. Затем Жадан попросил ChatGPT переписать текст, поменять структуру и сделать его более читаемым. В итоге "Антиплагиат" не нашел сгенерированные фрагменты.

В комментариях к треду Жадана предположили, что сервис проверки на нейросетевые тексты хуже работает с большими объемами. Пользователи считают, что он помечает красным простые предложения, которые многократно повторяются в интернете.

В "Антиплагиате" обратили внимание на тред Жадана и признали, что проверку сервиса можно обойти. В пресс–службе считают, что Жадану помогло редактирование текста: "Любое вмешательство человека в сгенерированный ИИ текст, конечно же, "очеловечивает" его, позволяя обойти алгоритм распознавания". Для обхода "Антиплагиата" понадобилось значительное время на работу с чат–ботом, посчитали разработчики системы.

Выводы:

1. Если вы полностью генерировали научную работу в ChatGPT, то, скорее всего, "Антиплагиат" отметит текст как подозрительный.

2. Если вы полностью генерировали научную работу в ChatGPT на английском языке, а потом перевели на русский язык, "Антиплагиат" не отметит текст как подозрительный.

3. Если вы использовали ChatGPT для сбора и упорядочивания информации при написании научной работы, часть редактировали, а часть переписывали вручную, то, вероятнее всего, "Антиплагиат" не распознает сгенерированный текст.

4. Лучше следить за тенденциями в этом направлении. 28 июня на конференции RuCode студенты расскажут, как они вычисляли сгенерированные тексты в рамках программы "Поймай ChatGPT". Можно будет послушать разработчиков ТОП–5 проектов по определению работы ИИ в написании текста.
Студенческие проекты — хороший способ понять на каком уровне индустрия и как скоро предыдущие выводы перестанут срабатывать.
С профессиональной точки зрения выступит Андрей Грабовой из Антиплагиата с темой: "ChatGPT: как жить с машинной генерацией в научном сообществе".
Можно приехать и поучаствовать лично или посмотреть онлайн–трансляцию (все бесплатно, но нужна регистрация).

Источник:

#ChatGPT #антиплагиат #курсовая

Fishki в Телеграм

Посты на ту же тему

Попугай и теннисный мяч

Люстра с новогодними подарками чуть не упала на головы женщин в салоне красоты

Сурикаты в Челябинском зоопарке впервые увидели снег

8 комментариев

Правила

!!! Оскорбления в комментариях автора поста или собеседника. Комментарий скрывается из ленты, автору выписывается бан на неделю. Допускаются более свободные споры в ленте с политикой, но в доступных, не нарушающих УК РФ, пределах.

! Мат на картинке/в комментарии. Ваш комментарий будет скрыт. При злоупотреблении возможен бан.

! Флуд - дублирующиеся комментарии от одного и того же пользователя в разных постах, систематические ложные вызовы модераторов с помощью функции @moderator, необоснованные обращения в техническую поддержку сайта, комментарии не несущие смысловой нагрузки и состоящие из хаотичного набора букв. Санкции - предупреждение с дальнейшим баном при рецидиве.

! Публикация рекламных постов. Несогласованное размещение рекламного материала, влечет незамедлительную приостановку действий учетной записи пользователя.

! Публикация материала, запрещенного на территории РФ и преследуемого УК РФ. Незамедлительная приостановка действия учетной записи пользователя.

! Мультиаккаунты. Использование нескольких активных аккаунтов, принадлежащих одному пользователю (исключение - дополнительный аккаунт для обращения в тех. поддержку при блокировке основного аккаунта) запрещено. За нарушение предусмотрено отключение основного аккаунта с возможной дальнейшей блокировкой любого аккаунта от данного пользователя.

Правила

! Мат на картинке/в комментарии. Ваш комментарий будет скрыт. При злоупотреблении возможен бан.

Лучший комментарий

Атомный Крот

2 года назад

А это вообще не задача "Антиплагиата", определять персональное авторство предъявленного ему текста.

Его задача - определить, публиковался ли этот конкретный текст где-то ранее, частями или целиком, или нет.

"Плагиа т (фр. plagiat от лат. plagiatus похищенный) умышленно совершаемое физическим лицом незаконное использование или распоряжение охраняемыми результатами чужого творческого труда" (С) Вики

Если текст - новый (по большей части) то плагиата нет. Потому что нейросеть не запрещает использовать генерируемые ей тексты любым, кто их ей заказал, соответственно, нет факта нарушения авторских прав нейросети, что было бы наказуемо как "незаконное использование".

И - да, положение о "передаче Заказчику прав на использование результатов работы, выполненной Исполнителем" включается сплошь и рядом в тексты стандартных договоров.

Поэтому даже юридически, подозреваю, ушлых студентов наказывать не за что. Никто же не запрещает ему пользоваться, например, калькулятором или компьютером для получения тех или иных вычислительных результатов. А в случае использования компьютера - еще и позволяет пользоваться разными текстовыми редакторами, в т.ч. с функциями поиска и коррекции грамматических ошибок, а не требует от студента написать все от руки чернильной ручкой.

Показать комментарий полностью

Удалить комментарий?

Удалить Отмена

Павел Бреусов

14k

2 года назад

А ещё чуть ли не половина аккаунтов с данного чата с3,1415жжена, то есть риск отдать свои данные мошонкам, просто зарегившись там ну очень велик.

-1

Удалить комментарий?

Удалить Отмена

au3

10k

2 года назад

"Если вы полностью генерировали научную работу в ChatGPT на английском языке, а потом перевели на русский язык, "Антиплагиат" не отметит текст как подозрительный."

Но подозреваю, что любой человек скажет "что за херня с автопереводчика"?

Удалить комментарий?

Удалить Отмена

Roman

au3

2 года назад

Если удосужится открыть.

Удалить комментарий?

Удалить Отмена

Показать 8 комментариев

Студентам на заметку. Можно ли обойти антиплагиат с текстом, созданным ChatGPT

Попугай и теннисный мяч

Люстра с новогодними подарками чуть не упала на головы женщин в салоне красоты

Сурикаты в Челябинском зоопарке впервые увидели снег

8 комментариев