Скорость работы NER на TESLA P100 (сравнение CPU vs GPU)

miteigi · December 27, 2019, 1:02pm

Протестировал на GPU скорость работы извлечения именованных сущностей от DeepPavlov. Многоязычная модель - ner_ontonotes_bert_mult.
Тест проводился в докере, запрос к модели через предоставляемый API.

Стенд 1. Intel Core i7-6700: 4 × 3.4ГГц 64Гб
Стенд 2. GPU TESLA P100 16GB

Загружалась книжка на 14 тыс. предложений.
Стенд 1 = 806 секунд - пачками по 1 предложений (если делать больше замедляется)
Стенд 2 = 125 секунд - пачками по 100 предложений (если делать больше ошибка размера)
(модель ner_rus_bert на GPU - 93 секунды)

GPU отработал быстрее в 6,5 раз, что очень мало, на взгляд моих ожиданий.

Это адекватная скорость работы таких моделей или я мог что-то неправильно сделать?

yurakuratov · January 9, 2020, 11:32am

Да, для этой NER модели мы наблюдаем примерно такую же разницу в скорости работы для CPU и GPU.

А ner_rus_bert оказался быстрее из-за токенизации, в этой модели используется словарь для русского языка и разбиение на токены оказывается короче по сравнению с multilingual словарем.

Topic		Replies	Views
Обучение модели на GPU DeepPavlov Library	5	272	August 27, 2023
Проблемы с обучением на GPU модели ner_rus_bert Models	1	663	April 15, 2020
Как уменьшить время отклика модели ner_rus_bert? Models	1	334	April 9, 2020
Можно ли запустить DeepPavlov Docker GPU на Windows 7 DeepPavlov Library	1	441	December 27, 2019
Дообучение модели ner_rus_bert. Проблема с длиной входной последовательности в данных Models	5	1700	April 5, 2020

Скорость работы NER на TESLA P100 (сравнение CPU vs GPU)

Related topics