Вопрос по NER обученной на своих данных

a3198i · May 31, 2019, 10:12am

Здравствуйте!

Для начала хотелось бы поблагодарить всех разработчиков за отличную работу. Я натренировала уже несколько компонентов на своих данных, и все они показывают очень хороший результат.
Но у меня все же есть вопрос: после тренировки NER на своих данных, он не всегда может правильно распознать начало и продолжение фразы (B и I), при этом правильно распознав сами теги. Например, в предложении он может может присутствовать только продолжение какого-то тега (I) без его начала (B).
Не подскажете, почему возникла такая проблема и можно ли ее как-то исправить? Может ли это быть из-за тренировочных данных?

Заранее спасибо!

acriptis · May 31, 2019, 11:17am

Если проблема с распознаванием начала и продолжений фразы, то проблема, вероятно, растет из недотренированности CRF слоя (если вы его исопльзуете).
Какая у вас конфигурация модели?

a3198i · May 31, 2019, 11:44am

Я использую стандартную конфигурацию, ничего в ней не меняла.

Melmarn · October 22, 2019, 10:16am

@a3198i Алина, удалось ли “победить” описанную проблему? У меня получился такой же результат - некоторые NERы маркируются только тегами I-… Я пока сделала маленький “костылик” - просто исправляю первый тег I на B. Но не уверена, что это правильно.

Topic		Replies	Views
Как правильно подготовить данные для модели NER DeepPavlov Library	1	457	April 17, 2019
NER - name being tagged as "I-PER" alone (ner_conll2003_bert) Models	6	142	April 24, 2024
Обучение NER на своих данных DeepPavlov Library	2	883	July 18, 2019
Ner_few_shot_ru Models	7	691	July 22, 2022
Training NER model on my own tags DeepPavlov Library	3	235	May 20, 2024

Вопрос по NER обученной на своих данных

Related topics