Решение задачи MaskedLM с помощью библотеки

igorkoch · June 18, 2020, 8:40am

Добрый день! Хотелось бы узнать можно ли как-нибудь решить задачу с пропуском слов (Masked Language Model) используя возможности библиотеки и модель RuBert? Суть задачи такова: обучиться на своем наборе специфических русскоязычных текстов. И затем получить метрики: насколько точно она справилась с распознаванием пропущенных (mask) слов.
Еще насколько я понял у transformer есть класс “BertForMaskedLM”, который потенциально может помочь в решении задачи.
Заранее спасибо за ответ

yurakuratov · July 27, 2020, 7:54am

Добрый день!

В библиотеке DeepPavlov нет функционала предобучения модели BERT на задаче MLM.

Для того, чтобы обучить RuBERT мы использовали официальный код от Google Research с изменениями для multi-gpu обучения https://github.com/deepmipt/bert
Этот код логгирует метрики на задаче MLM и NextSentencePrediction.

Второй вариант: использовать BertForMaskedLM из Transformers и подгружать в него веса модели RuBERT.

Topic		Replies	Views
Дообучение ruBERT на специфическом корпусе для задачи классификации DeepPavlov Library	8	3569	June 30, 2022
Задача предсказания следующего предложения для RuBERT Models	2	1268	January 24, 2020
Использование векторизации RUBERT DeepPavlov Library	3	976	December 9, 2019
RuBERT и Tensorflow 2 DeepPavlov Library	1	1788	August 24, 2020
Дообучить TransformersBertEmbedder Models	1	322	November 2, 2021

Решение задачи MaskedLM с помощью библотеки

Related topics