基于BiDAF多文档重排序的阅读理解模型被引量：4

Reading Comprehension Model Based on BiDAF and Multi-document Reordering

下载PDF

导出

摘要随着互联网的兴起和发展,数据规模急速增长,如何利用机器阅读理解技术对海量的非结构化数据进行解析,从而帮助用户快速、准确地查找到满意答案,是目前自然语言理解领域中的一个热门课题。该文通过对机器阅读理解中的深度神经网络模型进行研究,构建了RBiDAF模型。首先,通过对DuReader数据集进行数据探索,并对数据进行预处理,从中提取出有利于模型训练的特征。其次在BiDAF模型的基础上提出了基于多文档重排序的RBiDAF机器阅读理解模型,该模型在BiDAF模型四层网络框架的基础上添加了ParaRanking层。其中在ParaRanking层,该文提出了多特征融合的ParaRanking算法,此外在答案预测层,提出了基于先验知识的多答案交叉验证算法,进而对答案进行综合预测。在"2018机器阅读理解技术竞赛"的最终评测中,该模型表现出了不错的效果。 Exploiting the deep neural network model in machine reading comprehension,this paper presents the RBiDAF model.Firstly,by the data exploration to the DuReader dataset and the preprocessing of the data,the features beneficial to model are extracted.Then,based on the BiDAF model,a machine reading comprehension model for multi-document reranking is proposed,named RBiDAF.This model adds a paragraph-ranking-layer to the fourlayer standard BiDAF model,in which we design the ParaRanking algorithm with multi-feature fusion.Additionally,in order to predict a comprehensive answer,we propose the multi-answer cross validation algorithm based on prior knowledge.Finally,the RBiDAF model has shown good results in the 2018 NLP Challenge on Machine Reading Comprehension

作者杨志明时迎成王泳潘昊杰毛金涛 YANG Zhiming;SHI Yingcheng;WANG Yong;PAN Haojie;MAO Jintao(Institute of Software,Chinese Academy of Sciences,Beijing 100190,China;University of Chinese Academy of Sciences,Beijing 100049,China;DeepWise on Artificial Intelligence Robot Technology (Beijing)Co.Ltd,Bcijing 100085,China)

机构地区中国科学院软件研究所中国科学院大学深思考人工智能机器人科技(北京)有限公司

出处《中文信息学报》 CSCD 北大核心 2018年第11期117-127,共11页 Journal of Chinese Information Processing

基金国家自然科学基金(61303155) 中国科学院2017年度大学生创新实践项目基金(118900FA12)

关键词机器阅读理解多文档投票 ParaRanking machine reading comprehension multi-document voting ParaRanking

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献14

1李济洪,杨杏丽,王瑞波,张娜,李国臣.基于规则的中文阅读理解问题回答技术研究[J].中文信息学报,2009,23(4):3-9. 被引量：1
2尹伊淳,张铭.一种基于数据重构和富特征的神经网络机器阅读理解模型[J].中文信息学报,2018,32(11):112-116. 被引量：4
3顾健伟,曾诚,邹恩岑,陈扬,沈艺,陆悠,奚雪峰.基于双向注意力流和自注意力结合的机器阅读理解[J].南京大学学报（自然科学版）,2019,55(1):125-132. 被引量：1
4徐丽丽,李茹,李月香,郭少茹,谭红叶.面向机器阅读理解的语句填补答案选择方法[J].计算机工程,2018,44(7):183-187. 被引量：5
5梁小波,任飞亮,刘永康,潘凌峰,侯依宁,张熠,李妍.N-Reader:基于双层Self-attention的机器阅读理解模型[J].中文信息学报,2018,32(10):130-137. 被引量：11
6黄立威,江碧涛,吕守业,刘艳博,李德毅.基于深度学习的推荐系统研究综述[J].计算机学报,2018,41(7):1619-1647. 被引量：419
7万静,郭雅志.基于多段落排序的机器阅读理解研究[J].北京化工大学学报（自然科学版）,2019,46(3):93-98. 被引量：3
8姜文超,庄志刚,涂旭平,利传杰,刘海波.结合外部知识的动态多层次语义抽取网络模型[J].模式识别与人工智能,2019,32(5):455-462. 被引量：2
9张禹尧,蒋玉茹,毛腾,张仰森.MCA-Reader:基于多重联结机制的注意力阅读理解模型[J].中文信息学报,2019,33(10):73-80. 被引量：4
10张超然,裘杭萍,孙毅,王中伟.基于预训练模型的机器阅读理解研究综述[J].计算机工程与应用,2020,56(11):17-25. 被引量：13

引证文献4

1徐霄玲,郑建立,尹梓名.机器阅读理解的技术研究综述[J].小型微型计算机系统,2020,41(3):464-470. 被引量：5
2黄敏珍.金融领域机器阅读理解模型[J].现代计算机,2020,26(13):17-21.
3包玥,李艳玲,林民.抽取式机器阅读理解研究综述[J].计算机工程与应用,2021,57(12):25-36. 被引量：7
4武迪,马宁,郭泽晨,吕文蓉.基于注意力机制的机器阅读理解模型研究[J].西北民族大学学报（自然科学版）,2022,43(3):21-27.

二级引证文献9

1李珂,陈彦如,郑文蛟,化柏林.基于机器阅读理解的新闻时间线挖掘与展示[J].情报理论与实践,2022,45(4):184-189. 被引量：2
2仇亚进,奚雪峰,崔志明,盛胜利,周悦尧.多跳式机器阅读理解研究进展综述[J].计算机技术与发展,2023,33(2):9-16. 被引量：1
3张睿,陈羽中.一种增强机器阅读理解鲁棒性的上下文感知多任务学习框架[J].小型微型计算机系统,2023,44(7):1486-1493. 被引量：1
4吴春燕,李理,黄鹏程,刘知贵,张小乾.融合动态卷积注意力的机器阅读理解研究[J].计算机技术与发展,2023,33(7):160-166.
5温雪岩,谷训开,李祯,黄英来,黄鹤林.融合释义与双向交互的成语阅读理解方法研究[J].广西师范大学学报（自然科学版）,2023,41(6):70-79.
6刘青,陈艳平,邹安琪,秦永彬,黄瑞章.面向小样本抽取式问答的多标签语义校准方法[J].应用科学学报,2024,42(1):161-173.
7王勇,陈秋怡,苗夺谦,杨宁创.一种多任务联合训练的机器阅读理解模型[J].小型微型计算机系统,2024,45(6):1398-1404.
8吴迪,马超,段晓旋.外部注意力增强语义交互的阅读理解模型[J].计算机工程与设计,2024,45(7):2097-2103.
9卢心陶,戚晓伟.一种面向机器阅读理解系统的问题意图识别方法[J].河北软件职业技术学院学报,2024,26(3):25-30.

1宁伟东,师东菊,迟桂华,赵兴艳.大数据在我国医养机构的应用探究[J].计算机产品与流通,2018,7(6):248-248. 被引量：1
2赵文玉,周栋,曹步清,刘建勋.结合文档处理与查询处理技术的Web服务搜索方法[J].计算机集成制造系统,2018,24(7):1830-1837.
3邓晓杰.AutoCAD在道路工程制图中的技巧总结[J].电脑迷,2018(11):177-177.
4郑玉昆,李丹,范臻,刘奕群,张敏,马少平.T-Reader:一种基于自注意力机制的多任务深度阅读理解模型[J].中文信息学报,2018,32(11):128-134. 被引量：8
5王国星,王华民,陆萍.于“四个理解”上着力在局部探究中发展——对一堂数学展示课的教学感悟[J].中国数学教育（高中版）,2018,0(12):41-45.
6罗文馨,王园园.技术主题演化研究方法综述[J].知识管理论坛,2018(5):255-265. 被引量：6
7梅梅,刘颖,唐小利,张玢.微博非结构化数据的情绪挖掘方法及在旅游预测中的应用[J].情报资料工作,2019,40(1):64-72. 被引量：10
8霍欢,王忠萌.基于深度层次特征的阅读理解模型[J].中文信息学报,2018,32(12):132-142. 被引量：1
9金芝,刘芳,李戈.程序理解:现状与未来[J].软件学报,2019,30(1):110-126. 被引量：13
10张现洪.技术治理与治理技术的悖论与迷思[J].浙江学刊,2019(1):160-165. 被引量：70

中文信息学报

2018年第11期

浏览历史

内容加载中请稍等...

基于BiDAF多文档重排序的阅读理解模型被引量：4

同被引文献14

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于BiDAF多文档重排序的阅读理解模型 被引量：4

同被引文献14

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于BiDAF多文档重排序的阅读理解模型被引量：4