На каком конфиге лучше обучать интент на определенные запросы на русском. Намерения могут быть уточнения времени, места, услуги или просто предложения “мысли в слух”, которые ничего по сути не запрашивают у бота.
@bairto Выбор конфига сильно зависит от количества классов и размера обучающей выборки. Рекомендую посмотреть на FAQ конфиги, если датасет небольшой, или конфиг на основе русского BERTа, если датасет большой.
при тренировке не совсем понятно как должен выглядеть файл данных.
text_3 класс_1, класс_0, класс_2
text_3 - это фраза который пишет пользователь?
класс_1 - это один из намерении? т.е одна фраза и несколько намерении сразу?
между классами понятно что запятыми разделяется а как между текст и классом? Как выглядит еще test и valid? Можно пример файл данных?
@bairto прошу прощение за подздний ответ.
Если речь идеть про FAQ модели, то файл данных должен представлять из себя csv c двумя колонками, Question - фраза одного намерения и Answer ответ, который следует дать (намерение). Пример можно найти тут http://files.deeppavlov.ai/faq/school/faq_school.csv