Фото: пресс-служба ИТМО

Группа российских ученых создала инструмент, который с точность до 94% может выявить работу нейросети в тексте, что позволит определять кем он написан: человеком или искусственным интеллектом. Об этом сообщает Запорожское агентство новостей.

«Генеративные модели обучаются на текстах людей, но их стиль „письма все еще остается специфическим: ИИ (искусственный интеллект — прим. ЛИЦ) строит однообразные и шаблонные фразы, слишком предсказуемую структуру предложений, использует много повторов. Кроме того, нейросети часто создают несуществующие ссылки, делают логические ошибки, используют прямые кальки при переводе с английского языка на русский“, — цитирует агентство заявление пресс-службы Санкт-Петербургского национального исследовательского университета информационных технологий, механики и оптики (ИТМО).

Детектор опирается на две независимые большие языковые модели и сравнивает, насколько текст «удивительный» или «неожиданный» для них. Если мнение моделей сильно расходится, то текст, скорее всего, написан нейросетью. Для корректной работы с русским языком исследователи добавили анализ лингвистических признаков текста: длины слов и предложений, распределения частей речи, разнообразия лексики, читаемости и других. На основе всех признаков классификатор-нейросеть выдает один из трех ответов о происхождении текста: «человек», «ИИ», «перефразированный ИИ».

Сервис станет подспорьем в работе СМИ, а также при проверке работ в вузах и корпоративных документов в компаниях.