-
题名两阶段文档筛选和异步多粒度图多跳问答
- 1
-
-
作者
张雪松
李冠君
聂士佳
张大伟
吕钊
陶建华
-
机构
安徽大学计算机科学与技术学院
中国科学院自动化研究所模式识别国家重点实验室
清华大学自动化系
-
出处
《计算机技术与发展》
2024年第1期121-127,共7页
-
基金
国家重点研发计划(2020AAA0140003)
浙江实验室开放研究项目(2021KH0AB06)
北京市科委、中关村管委会计划(Z211100004821013)。
-
文摘
多跳问答旨在通过对多篇文档内容进行推理,来预测问题答案以及针对答案的支撑事实。然而当前的多跳问答方法在文档筛选任务中旨在找到与问题相关的所有文档,未考虑到这些文档是否都对找到答案有所帮助。因此,该文提出一种两阶段的文档筛选方法。第一阶段通过对文档进行评分且设置较小的阈值来获取尽可能多的与问题相关文档,保证文档的高召回率;第二阶段对问题答案的推理路径进行建模,在第一阶段的基础上再次提取文档,保证文档的高精确率。此外,针对由文档构成的多粒度图,提出一种新颖的异步更新机制来进行答案预测以及支撑事实预测。提出的异步更新机制将多粒度图分为异质图和同质图来进行异步更新以更好地进行多跳推理。该方法在性能上优于目前主流的多跳问答方法,验证了该方法的有效性。
-
关键词
多跳问答
文档筛选
多粒度图
异步更新
答案预测
-
Keywords
multi-hop question answering
document filtering
multi-granularity graph
asynchronous update
answer prediction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-