Всем привет.
Я использую deeppavlov для реврайтинга текста. Подключаю так:
syntax_model = build_model(configs.syntax.syntax_ru_syntagrus_bert, download=True)
tokenizer = GPT2Tokenizer.from_pretrained("sberbank-ai/rugpt3large_based_on_gpt2")
model = GPT2LMHeadModel.from_pretrained("sberbank-ai/rugpt3large_based_on_gpt2"
На сервере когда запускаю, то каждый раз идет скачивание
in 'deeppavlov.core.data.utils'['utils'] at line 95: Downloading from http://files.deeppavlov.ai/deeppavlov_data/syntax_parser/syntax_ru_syntagrus_bert.tar.gz to /root/.deeppavlov/models/syntax_ru_syntagrus_bert.tar.gz
Скачивание продолжается до 3 часов. И так каждый раз при перезапуске сервера.
Можно ли как-то брать это из кеша?
У меня приложение загружается из докера и я пробую использовать в докер-компоусе инструкцию
volumes:
- ./deeppavlov:/root/.deeppavlov
чтобы вроде как из кеша бралось, но оно не берется из кеша, а каждый раз перезакачивается.
Вместе с тем часто закачка прерывается по таймауту, так как я запускаю приложение через gunicorn.
Кстати, у меня приложение на Flask написано. И если бы можно было как-то использовать deevpavlov из docker (Docker Hub) и подключиться к нему через Flask, то было бы хорошо?