指针生成网络和覆盖损失优化的Transformer在生成式文本摘要领域的应用被引量：3

Application of Transformer optimized by pointer generator network and coverage loss in field of abstractive text summarization

下载PDF

导出

摘要针对生成式文本摘要应用场景,提出了以Transformer为基础的摘要模型,并在Transformer模型中加入了指针生成(Pointer Generator)网络和覆盖损失(Coverage Loss)进行优化。首先,提出了基于Transformer模型作为基础结构的方法,利用其注意力机制更好地捕捉上下文的语意信息。然后,在模型的损失函数中引入Coverage Loss来惩罚不断出现的重复的词的分布和覆盖范围,从而解决Transformer模型中的注意力机制在生成式任务中出现不断生成同一个词的问题。最后,在模型中加入了Pointer Generator网络,从而允许模型从源文本中复制词用作生成词来解决词表无法覆盖(OOV)的问题。探索了改进后的模型是否减少了不准确的表达以及重复出现相同词的现象是否得以解决。该模型相较于原始的Transformer模型在ROUGE-1评测函数上得分提升了1.98个百分点、ROUGE-2评测函数上得分提升0.95个百分点,在ROUGE-L评测函数上得分提升了2.27个百分点,并提升了摘要结果的可读性及准确性。实验结果表明,Transformer在加入Coverage Loss和Pointer Generator网络后可应用于生成式文本摘要领域。 Aiming at the application scenario of abstractive text summarization,a Transformer-based summarization model with Pointer Generator network and Coverage Loss added to the Transformer model for optimization was proposed.First,the method based on the Transformer model as the basic structure was proposed,and its attention mechanism was used to better capture the semantic information of the context.Then,the Coverage Loss was introduced into the loss function of the model to punish the distribution and coverage of repeated words,so as to solve the problem that the attention mechanism in the Transformer model continuously generates the same word in abstractive tasks.Finally,the Pointer Generator network was added to the model,which allowed the model to copy words from the source text as generated words to solve the Out of Vocabulary(OOV)problem.Whether the improved model reduced inaccurate expressions and whether the phenomenon of repeated occurrence of the same word was solved were explored.Compared with the original Transformer model,the improved model improved the score on ROUGE-L evaluation function by 1.98 percentage points,the score on ROUGE-2 evaluation function by 0.95 percentage points,and the score on ROUGE-L evaluation function by 2.27 percentage points,and improved the readability and accuracy of the summarization results.Experimental results show that Transformer can be applied to the field of abstractive text summarization after adding Coverage Loss and Pointer Generator network.

作者李想王卫兵尚学达 LI Xiang;WANG Weibing;SHANG Xueda(School of Computer Science and Technology,Harbin University of Science and Technology,Harbin Heilongjiang 150080,China)

机构地区哈尔滨理工大学计算机科学与技术学院

出处《计算机应用》 CSCD 北大核心 2021年第6期1647-1651,共5页 journal of Computer Applications

基金国家自然科学基金资助项目(61673142)。

关键词生成式文本摘要注意力机制 TRANSFORMER 覆盖损失指针生成网络 abstractive text summarization attention mechanism Transformer coverage loss pointer generator network

分类号 TP389.1 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1巩轶凡,刘红岩,何军,岳永姣,杜小勇.带有覆盖率机制的文本摘要模型研究[J].计算机科学与探索,2019,13(2):205-213. 被引量：8

二级参考文献1

1Ayana,Shi-Qi Shen,Yan-Kai Lin,Cun-Chao Tu,Yu Zhao,Zhi-Yuan Liu,Mao-Song Sun.Recent Advances on Neural Headline Generation[J].Journal of Computer Science & Technology,2017,32(4):768-784. 被引量：5

共引文献7

1王帅帅,徐臻.融合关键字的注意力机制的淋巴水肿病历诊断推理算法[J].智能计算机与应用,2022,12(2):178-181.
2王天罡,张晓滨,马红叶,蔡宏伟.可解释的层次注意力机制网络危重症预警[J].计算机工程与应用,2021,57(5):131-138. 被引量：1
3黄佳佳,李鹏伟.基于变分自编码器的生成式文本摘要研究[J].计算机应用研究,2021,38(3):705-709. 被引量：3
4邹蕾,崔斌,樊超,孙豫峰.基于双向编码文本摘要-长短期记忆-注意力的检察建议文本自动生成模型[J].科学技术与工程,2021,21(25):10780-10788. 被引量：9
5李维乾,蒲程磊.融合指针网络的Transformer摘要生成模型的改进[J].西安工程大学学报,2022,36(2):94-100.
6张琼霞,王大寒,朱顺痣.基于偏旁部首计数分析网络的零样本汉字识别[J].贵州大学学报（自然科学版）,2023,40(6):69-77.
7邸剑,刘骏华,曹锦纲.利用BERT和覆盖率机制改进的HiNT文本检索模型[J].智能系统学报,2024,19(3):719-727.

同被引文献20

1葛斌,李芳芳,郭丝路,汤大权.基于知网的词汇语义相似度计算方法研究[J].计算机应用研究,2010,27(9):3329-3333. 被引量：66
2孔钦,叶长青.基于案例推理的故障诊断算法[J].计算机系统应用,2016,25(1):181-186. 被引量：9
3宋英华,余侃,吕伟,刘丹.城市公交车火灾事件案例相似度匹配研究[J].中国安全科学学报,2017,27(4):163-168. 被引量：6
4张山清,普宗朝,李新建,吉春容.气候变化对新疆苹果种植气候适宜性的影响[J].中国农业资源与区划,2018,39(8):255-264. 被引量：27
5杨峰,张月琴,姚乐野.基于情景相似度的突发事件情报感知实现方法[J].情报学报,2019,38(5):525-533. 被引量：38
6邱俊安,邱奇志,周三三,陈先桥,贺宜.词语语义相似度在突发事件案例检索中的应用[J].武汉理工大学学报（信息与管理工程版）,2020,42(3):272-278. 被引量：4
7郭旭超,唐詹,刁磊,周晗,李林.基于部首嵌入和注意力机制的病虫害命名实体识别[J].农业机械学报,2020,51(S02):335-343. 被引量：20
8赵鹏飞,赵春江,吴华瑞,王维.基于注意力机制的农业文本命名实体识别[J].农业机械学报,2021,52(1):185-192. 被引量：30
9汪成亮,黄利莹,赵凯.多粒度时空事件序列相似度算法研究[J].北京理工大学学报,2021,41(1):102-111. 被引量：2
10徐绪堪,李一铭.基于情景相似度的突发事件多粒度响应模型研究[J].情报科学,2021,39(2):18-23. 被引量：11

引证文献3

1陈钢,陈健鹏,佘祥荣,秦加奇,陈剑.基于关键词生成的网格事件相似度并行计算[J].计算机系统应用,2022,31(6):48-55.
2蒲攀,张越,刘勇,聂炎明,黄铝文.Transformer优化及其在苹果病虫命名实体识别中的应用[J].农业机械学报,2023,54(6):264-271. 被引量：3
3刘志敏,张琨,朱浩华.基于Transformer模型的文本自动摘要生成[J].计算机与数字工程,2024,52(2):482-486.

二级引证文献3

1许鑫,马文政,张浩,马新明,乔红波.基于融合对抗训练的农作物品种信息抽取方法[J].农业机械学报,2023,54(12):272-279.
2侯琛,牛培宇.农业知识图谱技术研究现状与展望[J].农业机械学报,2024,55(6):1-17. 被引量：4
3王春山,张宸硕,吴华瑞,朱华吉,缪祎晟,张立杰.基于连续提示注入与指针网络的农业病害命名实体识别[J].农业机械学报,2024,55(6):254-261.

1蔡中祥,孙建伟.融合指针网络的新闻文本摘要模型[J].小型微型计算机系统,2021,42(3):462-466. 被引量：14
2孟琭,李诚新.双特征模型核相关滤波目标跟踪算法[J].中国图象图形学报,2019,24(12):2183-2199. 被引量：7
3王鹄.一道简单习题的“特殊”处理[J].中小学数学（小学版）,2021(1):75-76.
4周欣华.给乏味的复习课加点“料”——小学低年级语文复习有效性研究[J].黑龙江教育（教育与教学）,2021(6):74-77.

计算机应用

2021年第6期

浏览历史

内容加载中请稍等...

指针生成网络和覆盖损失优化的Transformer在生成式文本摘要领域的应用被引量：3

参考文献1

二级参考文献1

共引文献7

同被引文献20

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

指针生成网络和覆盖损失优化的Transformer在生成式文本摘要领域的应用 被引量：3

参考文献1

二级参考文献1

共引文献7

同被引文献20

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

指针生成网络和覆盖损失优化的Transformer在生成式文本摘要领域的应用被引量：3