Как правильно подготовить данные для модели NER

Melmarn · April 17, 2019, 8:14am

Добрый день,
подскажите, пожалуйста: для обучения NER модели нужно отобрать только те предложения, в которых есть теги B и I, или предложения с исключительно нейтральными тегами О тоже нужны?
Оставлять ли --DOCSTART–?

mu-arkhipov · April 17, 2019, 12:12pm

Предложения с “О” тоже нужны. Идеальный случай, когда пропорции тагов во время обучения и во время инференса совпадают. Есть ли в предложениях таги или нет - не важно нужно обучаться на этом. Если оставить только примеры где таги есть, сетка будет чаще размечать сущности там где их нет (понизится Precision).

Topic		Replies	Views
Вопрос по NER обученной на своих данных DeepPavlov Library	3	444	October 22, 2019
Возможности обученных NER-моделей DeepPavlov Library	2	1099	March 1, 2019
Обучение NER на своих данных DeepPavlov Library	2	865	July 18, 2019
Дообучение предобученной NER модели Welcome to the DeepPavlov Community Forum	3	461	May 14, 2024
Выделение сути предложения DeepPavlov Library	1	357	June 2, 2020

Как правильно подготовить данные для модели NER

Related topics