Добрый день!
Я пытаюсь делать первые шаги в данном вопросе, еще разбираюсь в терминологии. Вопрос: Для задачи Question Answering Model for SQuAD dataset используется BERT модель. Как мне использовать другую BERT модель(стороннюю)? Если это возможно, то какие настройки нужно выполнить. Модель хотел взять отсюда: https://lang.org.ua/uk/models/#anchor6.
Буду благодарен за ответ.
Добрый день!
По ссылке написано, что модель была обучена с помощью оригинального кода https://github.com/google-research/bert.
Веса не будут напрямую совместимы с моделями, которые мы делаем в DeepPavlov.
Чтобы использовать модель по ссылке в DeepPavlov надо будет взять один из конфигурационных файлов (например, https://github.com/deepmipt/DeepPavlov/blob/master/deeppavlov/configs/squad/squad_ru_bert.json) и поменять save_path
/load_path
у squad_bert_model
на пути до model.ckpt архива, поменять пути до vocab.txt
и bert_config.json
. В коде bert_squad заменить tf.variable_scope('squad')
на tf.variable_scope('cls/squad')
.
Второй вариант, обучить на SQuAD 2.0 + SberSQuAD самостоятельно.
Спасибо за ответ
чт, 14 мая 2020 г., 14:03 Yura Kuratov via DeepPavlov Community Forum <deeppavlov@discoursemail.com>: