面向问题生成的预训练模型适应性优化方法研究

Adaptive Optimization Method of Pre-trained Language Model for Question Generation

下载PDF

导出

摘要问题生成的核心任务是“在给定上下文语境的前提下,对目标答案自动生成相应的疑问句”。问题生成是自然语言处理领域中富有挑战性的任务之一,其对可靠的语义编码和解码技术有着极高的要求。目前,预训练语言模型已在不同自然语言处理任务中得到广泛应用,并取得了较好的应用效果。该文继承这一趋势,尝试将预训练语言模型UNILM应用于现有“基于编码和解码架构”的问题生成系统中,并集中在其适应性问题上开展研究。该文针对预训练模型在解码阶段频繁出现的“暴露偏差”和“掩码异构”问题,分别研究了基于随机抗噪和迁移学习的训练方法,借以提升UNILM在问题生成过程中的适应能力。同时,该文在SQuAD数据集上开展问题生成实验,实验结果证明,随机抗噪和迁移学习都能优化UNILM的解码性能,使之在答案可知场景的数据划分split1和split2上,分别将BLEU4指标提升到20.31%和21.95%;并在答案不可知场景的split1数据集上将BLEU4指标提升到17.90%。 Automatically question generation(QG for short)is to automatically generate the corresponding interrogative sentence of the target answer under the given context..In this paper,we take advantage of pre-trained language model and apply the UNILM on encoder-decoder framework of question generation.In particular,in order to solve the problems of"exposure bias"and"mask heterogeneity"in the decoding phase of model,we examine the noise-aware training method and transfer learning on UNILM to raise its adaptability Experiments on SQuAD show that our best model yields state-of-the-art performance in answer-aware QG task with up to 20.31%and 21.95%BLEU score for split1 and split2,respectively,and in answer-agnostic QG task with 17.90%BLEU score for split1.

作者苏玉兰洪宇朱鸿雨武恺莉张民 SU Yulan;HONG Yu;ZHU Hongyu;WU Kaili;ZHANG Min(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China)

机构地区苏州大学计算机科学与技术学院

出处《中文信息学报》 CSCD 北大核心 2022年第3期91-100,共10页 Journal of Chinese Information Processing

基金国家自然科学基金(62076174) 江苏省研究生科研与实践创新计划项目(SJCX20_1064)。

关键词问题生成暴露偏差问答数据集迁移学习 question generation exposure bias question-answering dataset transfer learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1张争信.问题导向下小学高年级语文阅读教学的优化路径探索[J].成功（上）,2021(12):160-162.
2丁美荣,刘鸿业,徐马一,龚思雨,陈晓敏,曾碧卿.面向机器阅读理解的多任务层次微调模型[J].计算机系统应用,2022,31(3):212-219. 被引量：2
3瞿中,陈雯.基于空洞卷积和多特征融合的混凝土路面裂缝检测[J].计算机科学,2022,49(3):192-196. 被引量：7
4胡月,周光有.基于Graph Transformer的知识库问题生成[J].中文信息学报,2022,36(2):111-120. 被引量：4
5刘伯霞,刘杰,程婷,王田.国外城市更新理论与实践对我国的启示[J].城乡建设,2022(6):45-48. 被引量：6
6石航,刘瑞芳,刘欣瑜,陈泓宇.基于文章和近答案句信息的问题生成模型[J].中文信息学报,2021,35(8):127-134. 被引量：3
7张峰,左效平.借道辅助圆观景四边形——特殊四边形问题的解法赏析[J].初中数学教与学,2022(4):26-28.
8于尊瑞,毛震东,王泉,张勇东.基于预训练语言模型的关键词感知问题生成[J].计算机工程,2022,48(2):125-131. 被引量：1
9王汉谱,瞿玉勇,刘志豪,谷旭轩,贺志强,彭怡书,何伟.基于FCN的图像语义分割算法研究[J].成都工业学院学报,2022,25(1):36-41. 被引量：4
10凌晓楠,赵媛,尹维维.破解初任教师的发展难题[J].教育家,2022(12):52-53.

中文信息学报

2022年第3期

浏览历史

内容加载中请稍等...

面向问题生成的预训练模型适应性优化方法研究

相关作者

相关机构

相关主题

浏览历史