Детектор автора текста

Добрый день! Подскажите какую практику лучше использовать для определения текста написанного chatgpt. Суть: юзеры генерируют много контента и обманывают этим бесполезным мусором. Есть задача обучить модель которая бы выдавала 0…1, где 0 - скорее всего текст написал юзер, ближе к 1 - чатгпт (он имеет характерные отличия, но нужно писать кучу регулярок и не всегда они ловят). На вход хочу подать тексты юзеров и чата, промаркированных зарание 0 и 1 соотв. Или так это не работает? Спасибо!

Приветствую @Aleksander ,

Точно этой проблеме посвящено соревнование RuATD-2022. Список принятых статей выложен на страничке соревнования. Данные находятся в репозитории соревнования.

1 Like