Занимался задачей semantic sentence similarity и решил попробовать решение от DeepPavlov.
Возникли следующие вопросы:
- Есть ли более очевидный туториал, где поэтапно(или подробнее) описано дообучение предобученной модели на своих данных. Просто из доков не совсем очевидно. А также тюн модели
- В доках пишется, что Вы используете сиамские сети для данной задачи, а есть ли где-нибудь информация о самой архитектуре модели (слои и прочее). Возможно в гите не достаточно хорошо посмотрел
- Модель для пары фраз выдает в конечном итоге предложение: “это пара” или “это не пара” на англ.яз. Есть ли возможность выдавать что-то типа вероятности [0,1]?
- Получилось ли у вас решить проблему с отрицаниями? Например, если сравнивать 2 предложения “я хочу торт” и “я не хочу торт”, то результат - “это не пара”. Просто, я пробовал предобученную модель на датасете от paraphraser.ru/download/ и если на их тестовом датасете прогонять, то все хорошо, но если в их тестовом датасете подать пары фраз по их тематике, но структура: “я хочу торт” и “я НЕ хочу торт”, то он не определяет, что это не пара. Возможно я что-то не так делаю.
Спасибо!