Ответ на вопрос из своих данных

Igor · October 29, 2019, 5:35pm

Добрый день
Подскажите как сделать поиск ответа на вопрос из своего текста , к примеру из книги “Война и Мир”? . Кто такая Наташа Ростова ? И попутно вопрос, какой максимальный объём текста можно обработать в SQuAD ?
Спасибо.

yurakuratov · October 31, 2019, 10:18am

Вы можете собрать свою ODQA (Open Domain Question Answering):
ODQA состоит из двух основных частей:

retrieve - поиск релевантного документа (абзац, глава из книги)
reader - поиск ответа в документе (например BERT или R-NET, представленные в нашей библиотеке)

Длина текста для R-Net ограничена только доступной видеoпамятью, а для BERT - 512 subtoknes, включая вопрос и спец символы. Для того, чтобы подавать в BERT более длинные тексты есть *infer.json (длинный текст режется на части и ответ ищется в каждой из них), их можно найти в SQuAD configs.

Как собрать свою ODQA можно почитать вот тут: https://medium.com/deeppavlov/open-domain-question-answering-with-deeppavlov-c665d2ee4d65

Igor · November 18, 2019, 6:18pm

Спасибо. Получилось. Правда результат не очень нравится, нормальный ответ где-то 1 из 4. Возможно ответы будут лучше если их брать не с середины предложения а с начала. У вас нет готовых скриптов под это ? Думаю как вариант отсчитывать от позиции ответа до первой встреченной большой буквы.

Topic		Replies	Views
Поиск по тексту, как в демо DeepPavlov Library	4	607	July 2, 2020
Выбор модели ODQA или KBQA Models	3	333	October 19, 2021
Get top_n answers in odqa Models	1	305	July 18, 2020
ODQA: отвечает неправильно и не так как DrQA? DeepPavlov Library	11	1194	December 28, 2020
How to have control over ODQA module output? DeepPavlov Library	1	354	August 21, 2019

Ответ на вопрос из своих данных

Related topics