Тренировка готовой модели ELMo

Приветствую. Не совсем понимаю, какие шаги требуется проделать, чтобы потренировать готовую ELMo модель на своих данных с использованием deeppavlov

Не могли бы вы описать шаги, которые требуется проделать, или указать пример в документации.

1 Like

Доброго времени суток!
1. выбрать подходящую модель см. документацию

LM model pre-trained on ru-news dataset ( lines = 63M, tokens = 946M, size = 12GB ), model is available by elmo_lm_ready4fine_tuning_ru_news configuration file or elmo_lm_ready4fine_tuning_ru_news_simple configuration file.

LM model pre-trained on ru-twitter dataset ( lines = 104M, tokens = 810M, size = 8.5GB ), model is available by elmo_lm_ready4fine_tuning_ru_twitter configuration file or elmo_lm_ready4fine_tuning_ru_twitter_simple configuration file.

LM model pre-trained on ru-wiki dataset ( lines = 1M, tokens = 386M, size = 5GB ), model is available by elmo_lm_ready4fine_tuning_ru_wiki configuration file or elmo_lm_ready4fine_tuning_ru_wiki_simple configuration file.

2. установить зависимости модели

python -m deeppavlov install <path_to_config>

к примеру для elmo_lm_ready4fine_tuning_ru_news

python -m deeppavlov install elmo/elmo_lm_ready4fine_tuning_ru_news

3. скачать веса модели

python -m deeppavlov download <path_to_config>

4. подготовить свои данные

формат датасета: одна строка - это одно предложение (фрагмент текста, лучше предложение, так ELMo обучалась)

5. запустить обучение

python -m deeppavlov train <path_to_config>


Все описанное выше есть здесь в документации.