文档问答(document QA)


文档问答指的是从非结构化文档中提取答案。

近年来基于深度神经网络的机器阅读理解 ( Machine Reading Comprehension,MRC ) 技术得到了快速的发展,逐渐成为问答和对话系统中的关键技术。

MRC模型以问题和文档为输入,通过阅读文档内容预测问题的答案。根据需要预测的答案形式不同,阅读理解任务可以分为填空式 ( Cloze-style )、多项选择式 ( Multi-choice )、片段提取式 ( Span-extraction ) 和自由文本 ( Free-form )。

在实际问答系统中,最常使用的是片段提取式阅读理解(MRC),该任务需要从文档中提取连续的一段文字作为答案。

相关