Всем добрый вечер.
Пытаюсь доучить модель на своих довольно шумных данных. Подготовил разметку и запускаю обучение по инструкции:
Сначала дописал в конфиг путь к данным
config_dict[‘dataset_reader’][‘data_path’] = путь
затем вызываю обучение
ner_model = train_model(config_dict, download=True)
Но никак не могу понять почему выскакивает ошибка:
ERROR in ‘deeppavlov.core.common.params’[‘params’] at line 112: Exception in <class ‘deeppavlov.models.torch_bert.torch_transformers_sequence_tagger.TorchTransformersSequenceTagger’>
Traceback (most recent call last):
File “/usr/local/lib/python3.7/dist-packages/deeppavlov/core/common/params.py”, line 106, in from_params
component = obj(**dict(config_params, **kwargs))
File “/usr/local/lib/python3.7/dist-packages/deeppavlov/models/torch_bert/torch_transformers_sequence_tagger.py”, line 250, in init
**kwargs)
File “/usr/local/lib/python3.7/dist-packages/deeppavlov/core/models/torch_model.py”, line 98, in init
self.load()
File “/usr/local/lib/python3.7/dist-packages/deeppavlov/models/torch_bert/torch_transformers_sequence_tagger.py”, line 373, in load
self.model.load_state_dict(checkpoint[“model_state_dict”])
File “/usr/local/lib/python3.7/dist-packages/torch/nn/modules/module.py”, line 1045, in load_state_dict
self.class.name, “\n\t”.join(error_msgs)))
RuntimeError: Error(s) in loading state_dict for BertForTokenClassification:
size mismatch for classifier.weight: copying a param with shape torch.Size([37, 768]) from checkpoint, the shape in current model is torch.Size([16, 768]).
size mismatch for classifier.bias: copying a param with shape torch.Size([37]) from checkpoint, the shape in current model is torch.Size([16]).
Если оставлять путь к своим данным по умолчанию как указан в конфиге, то этой ошибки нет. Стоит прописать путь и не работает.
Подскажите, что я делаю не так? По инструкции этого вроде достаточно?