中文机器阅读理解的鲁棒性研究被引量：4

Robustness of Chinese Machine Reading Comprehension

下载PDF

导出

摘要为了更好地评价阅读理解模型的鲁棒性,基于Dureader数据集,通过自动抽取和人工标注的方法,对过敏感、过稳定和泛化3个问题分别构建测试数据集。还提出基于答案抽取和掩码位置预测的多任务学习方法。实验结果表明,所提方法能显著地提高阅读理解模型的鲁棒性,所构建的测试集能够对模型的鲁棒性进行有效评估。 In order to better evaluate the robustness of Machine Reading Comprehension(MRC)models,this paper builds three test sets from Dureader by automatically extracting and manually annotating,consisting of oversensitivity,over-stability,and generalization.In addition,this paper proposes a multi-task learning framework with answer extraction task and masked position prediction task.Experimental results demonstrate that proposed method gains significant robustness improvements and show the effectiveness of the three test sets on evaluating the robustness of MRC models.

作者李烨秋唐竑轩钱锦邹博伟洪宇 LI Yeqiu;TANG Hongxuan;QIAN Jin;ZOU Bowei;HONG Yu(School of Computer Science and Technology,Soochow University,Suzhou 215000;Institute for Infocomm Research,Singapore 138632)

机构地区苏州大学计算机科学与技术学院新加坡资讯通信研究院

出处《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2021年第1期16-22,共7页 Acta Scientiarum Naturalium Universitatis Pekinensis

基金国家自然科学基金(61703293,61672368,61672367) 江苏高校优势学科建设工程项目资助。

关键词机器阅读理解鲁棒性中文语料库 machine reading comprehension robustness Chinese corpus

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献11

1钱锦,黄荣涛,邹博伟,洪宇.基于多任务学习的生成式阅读理解[J].中文信息学报,2021,35(12):103-111. 被引量：4
2王小捷,白子薇,李可,袁彩霞.机器阅读理解的研究进展[J].北京邮电大学学报,2019,42(6):1-9. 被引量：9
3张超然,裘杭萍,孙毅,王中伟.基于预训练模型的机器阅读理解研究综述[J].计算机工程与应用,2020,56(11):17-25. 被引量：13
4石磊,王毅,成颖,魏瑞斌.自然语言处理中的注意力机制研究综述[J].数据分析与知识发现,2020,4(5):1-14. 被引量：63
5顾迎捷,桂小林,李德福,沈毅,廖东.基于神经网络的机器阅读理解综述[J].软件学报,2020,31(7):2095-2126. 被引量：40
6余同瑞,金冉,韩晓臻,李家辉,郁婷.自然语言处理预训练模型的研究综述[J].计算机工程与应用,2020,56(23):12-22. 被引量：50
7曹卫东,李宏伟,王怀超.基于协同注意力和自适应调整的阅读理解模型[J].计算机工程与设计,2020,41(12):3525-3531. 被引量：5
8代寒静,涂新辉.基于Pre-RoBERTa-MTL的中文机器阅读理解模型[J].计算机应用,2020,40(S02):12-18. 被引量：4
9包玥,李艳玲,林民.抽取式机器阅读理解研究综述[J].计算机工程与应用,2021,57(12):25-36. 被引量：7
10叶俊民,赵晓丽,杜翔,姚贤坦.片段抽取型机器阅读理解算法研究[J].计算机应用研究,2021,38(11):3268-3273. 被引量：3

引证文献4

1高俊杰,行覃杰,谭红叶.面向阅读理解过敏感性和过稳定性的数据增强研究[J].山西大学学报（自然科学版）,2022,45(4):1023-1029.
2谭红叶,行覃杰.面向鲁棒性增强的多任务机器阅读理解[J].计算机工程与科学,2023,45(2):363-369.
3马宁,吕文蓉,郭泽晨.面向机器阅读理解的医学域数据集MedicalQA[J].中国科学数据（中英文网络版）,2024,9(1):356-365.
4吴迪,马超,段晓旋.外部注意力增强语义交互的阅读理解模型[J].计算机工程与设计,2024,45(7):2097-2103.

1王浩男,高扬,冯俊兰,胡珉,王惠欣,柏宇.基于细粒度可解释矩阵的摘要生成模型[J].北京大学学报（自然科学版）,2021,57(1):23-30.
2孙驰,杜军威,李浩杰.基于段落选择的分层融合阅读理解模型[J].青岛科技大学学报（自然科学版）,2021,42(2):104-111.
3贾伟良.基于知识图谱的电厂设备异常检测[J].河南科技,2021,40(2):15-17.
4杜悦,王东波,江川,徐润华,李斌,许超,徐晨飞.数字人文下的典籍深度学习实体自动识别模型构建及应用研究[J].图书情报工作,2021,65(3):100-108. 被引量：23
5孙乾宇,张振东.基于YOLOv3增强模型融合的人流密度估计[J].计算机系统应用,2021,30(4):271-276. 被引量：3
6吴开顺,郑道远,陈妍伶,曾林芸,张嘉辉,柴生华,徐文杰,杨永亮,李圣文,刘袁缘,方芳.中国典型城市建筑物实例数据集[J].中国科学数据（中英文网络版）,2021,6(1):184-192. 被引量：9
7王帅,郭锐锋,董志勇,王鸿亮,张晓星.混合现实装配检测中深度学习的数据增强方法[J].计算机集成制造系统,2021,27(3):716-727. 被引量：7
8孙鑫,王平平,洪雅妮.内容语言融合型课堂中教师支架多模态研究[J].中国外语,2021,18(1):63-71. 被引量：12
9李超然,肖飞,樊亚翔,唐欣,杨国润.基于深度学习的锂离子电池SOC和SOH联合估算[J].中国电机工程学报,2021,41(2):681-691. 被引量：51

北京大学学报（自然科学版）

2021年第1期

浏览历史

内容加载中请稍等...

中文机器阅读理解的鲁棒性研究被引量：4

同被引文献11

引证文献4

相关作者

相关机构

相关主题

浏览历史

中文机器阅读理解的鲁棒性研究 被引量：4

同被引文献11

引证文献4

相关作者

相关机构

相关主题

浏览历史

中文机器阅读理解的鲁棒性研究被引量：4