Российские разработчики создали AI-детектор GigaCheck для определения текстов, написанных нейросетью

На технологической конференции GigaConf 2024 исследователи Сбера и компании SberDevices представили GigaCheck — детектор для определения авторства русскоязычных текстов. Решение предоставляется по API и встраивается в любые сторонние приложения.
Редакция сайта
Редакция сайта
Российские разработчики создали AI-детектор GigaCheck для определения текстов, написанных нейросетью
Unsplash
GigaCheck позволяет с высокой точностью устанавливать, кем был написан текст — человеком или ИИ. За последний месяц с помощью детекторы специалисты выявили 6% из 220 000 статей на новостных ресурсах, которые были написаны генеративными нейросетями.

На данный момент точность работы GigaCheck составляет 94,7%. Показатель ближайшего конкурента — не более 85%. Так что на сегодняшний день российский инструмент — самый достоверный детектор подобного рода.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Сейчас GigaCheck дает обобщенную оценку авторства. Если в одном тексте использованы как фрагменты, написанные человеком, так и фрагменты, сгенерированные искусственным интеллектом, то определение авторства осуществляется по преобладающему контенту. В ближайшее время детектор научится определять, какие именно фрагменты текста были сгенерированы LLM.

детектор для определения текстов, сгенерированных ИИ
Unsplash
Продолжение ниже Продолжение

Работу детектора текстов оценят эксперты, занимающиеся проверкой подлинности научных публикаций, диссертаций и дипломов. Владельцы пабликов в соцсетях с помощью детектора смогут быстро обнаруживать созданные генеративными моделями комментарии и посты. Редакторы и все, принимающие работу копирайтеров, также получат эффективный инструмент для ее проверки и оценки.

«До сих пор вероятность создания подобного работающего детектора текстов считалась крайне низкой. Многие эксперты расценивали эту задачу как практически нерешаемую. Для разработки такого сервиса требуются серьезные ресурсы и большие объемы данных. Но даже неограниченных ресурсов может оказаться недостаточно. Например, компания OpenAI, один из признанных лидеров в области разработки систем искусственного интеллекта, в начале 2023 года анонсировала свой детектор для англоязычных текстов, но со временем была вынуждена закрыть доступ к нему из-за невысокой точности. Тем важнее достижение нашей команды, которой, несмотря на все сложности, удалось разработать собственную эффективную технологию», — отмечает Сергей Марков, управляющий директор Управления экспериментальных систем машинного обучения SberDevices. 

Сейчас протестировать возможности разработки можно в свободном доступе на сайте и через бота в Telegram. Для коммерческого использования бизнес может оставить заявку, чтобы получить доступ к детектору.