基于多尺度卷积的阅读理解候选句抽取

Evidence Sentence Extraction for Reading ComprehensionBased on Multi-scale Convolution

下载PDF

导出

摘要机器阅读理解作为检验机器是否具有理解人类自然语言能力的重要任务之一,受到了越来越广泛的关注。该文针对选择型阅读理解任务中特征提取不全面和交互不充分的问题,提出一种基于多尺度卷积的候选句抽取模型。首先,使用预训练模型编码句子语义信息,并利用多种特征辅助编码提升模型性能。其次,为了充分利用文本信息,采用多尺度卷积捕捉不同尺度的文本特征。再次,使用Focal Loss解决阅读理解中正负样本不均衡的问题,最后,选取top-20作为候选句。该文的方法在两个阅读理解选择题数据集上进行测试,实验结果表明,多尺度卷积模型效果优于基线模型,F1值较最优基线模型结果分别提升3.66%和4.82%,验证了方法的有效性。 Machine reading comprehension is a popular task to test whether a machine can understand natural language.Aiming at the choice reading comprehension items,we propose a multi-scale convolution based evidence sentence extraction model to extract more comprehensive features.Firstly,we utilize the pre-trained model to encode the semantic information for sentences,and use various features to assist the encoding to improve the performance of the model.Then,the multi-scale convolution is adopted to capture the text features at different scales,with the focal loss to alleviated the unbalanced sample issue.Finally,top-20 sentences are selected as the evidence sentences.Experimented on two datasets of reading comprehension,the proposed method improves the F 1 values by 3.66%and 4.82%,respectively,compared with the optimal baseline models.

作者李沫谦杨陟卓李茹王笑月吉宇 LI Moqian;YANG Zhizhuo;LI Ru;WANG Xiaoyue;JI Yu(School of Computer and Information Technology,Shanxi University,Taiyuan,Shanxi 030006,China;Key Laboratory of Computation Intelligence and Chinese Information Processing of Ministry of Education,Shanxi University,Taiyuan,Shanxi 030006,China)

机构地区山西大学计算机与信息技术学院山西大学计算智能与中文信息处理教育部重点实验室

出处《中文信息学报》 CSCD 北大核心 2024年第8期128-139,157,共13页 Journal of Chinese Information Processing

基金国家重点研发基金(2018YFB1005103) 山西省基础研究计划面上项目(20210302123469) 国家自然科学基金(61936012)。

关键词机器阅读理解候选句抽取多尺度卷积 machine reading comprehension evidence sentence extraction multi-scale convolution

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1崔镇关,靳懿德.机器学习在中国海外投资效率预警中的应用——来自“一带一路”沿线国家的证据[J].金融理论与实践,2023(5):13-25.
2李宁.水稻直播施肥机关键部件设计[J].农机使用与维修,2023(8):10-12.
3马冬梅,王鹏宇,郭智浩.一种基于注意力机制的轻量级语义分割[J].计算机工程与科学,2024,46(8):1503-1512.
4李忠艳,石兴亮.数字物流对城乡融合发展理论逻辑——基于扎根理论研究[J].商业经济,2024(9):63-67.
5王晓燕(文/图),李菲菲(文/图),郑峻鹏(文/图),窦远洋(文/图).十三陵林场无人机巡护古树[J].绿化与生活,2024(7):41-41.
6刘洋,翟锐,巩坤.异常检测在网络安全防护中的应用研究[J].邮电设计技术,2024(8):24-28.
7秦锋,赵艳.机器学习算法在青藏高原孢粉-气候定量重建中的尝试[J].第四纪研究,2024,44(3):704-714.
8陆素芬,欧小玉,谢丽莎,黄柳琴,陆俊宇,王爱娟.共价有机框架材料的制备及其对水体中刚果红的吸附性能研究[J].化工科技,2024,32(3):54-60.
9杨宗颖.人类音乐的“祛魅”与“复魅”——评《音乐人类:一种地球上的生命史》[J].乐府新声（沈阳音乐学院学报）,2024(2):58-68.
10杨舒文.从弗朗西斯·培根到芝加哥波普——身体形象语言的隐喻[J].艺术设计研究,2024(4):103-111.

中文信息学报

2024年第8期

浏览历史

内容加载中请稍等...

基于多尺度卷积的阅读理解候选句抽取

相关作者

相关机构

相关主题

浏览历史