Привязать Torch Transformers Classifier Model к cudа с определенным индексом

bbkjunior · February 14, 2021, 2:57pm

Привет!

Я хочу воспользоваться Torch Transformers Classifier Model на сервере с несколькими видеокартами, однако при передаче аргумента ‘gpu’ в ‘device’ модель помещается на базовую карточку. Полагаю причиной этой является 75 строчка в torch_model.py. Есть ли способы как-то это обойти и разместить модель на определнной вдиелокарте?

Я со своей стороны пробовал после инициализации модели просто поменять значение параметра device у объекта классифиатора, это получалось сделать, однако при запуске обучения выдается ошибка RuntimeError: arguments are located on different GPUs

danielkornev · February 17, 2021, 12:11pm

Привет! сорри, что не сразу ответили.

Можно - и вы можете прямо сейчас сделать PR к нам, чтобы это попало в библиотеку

yurakuratov · February 26, 2021, 12:49pm

Видимые карточки можно управлять переменной окружения CUDA_VISIBLE_DEVICES.
Например, можно разрешить запуск только на одной карте номер 2 (номер из nvidia-smi):

export CUDA_VISIBLE_DEVICES=2; python my_script.py

Topic		Replies	Views
Обучение модели на GPU DeepPavlov Library	5	273	August 27, 2023
Проблемы с обучением на GPU модели ner_rus_bert Models	1	664	April 15, 2020
Упала точность обучения DeepPavlov Library	8	71	July 30, 2024
Дообучение ner_ontonotes_bert_mult_torch на своих данных DeepPavlov Library	3	641	December 3, 2021
Скорость работы NER на TESLA P100 (сравнение CPU vs GPU) DeepPavlov Library	1	371	January 9, 2020

Привязать Torch Transformers Classifier Model к cudа с определенным индексом

Related topics