通过N-gram增强局部上下文视野感知的中文生成式摘要

Chinese Abstractivte Summarization with Local Context Augmentation via N-gram

下载PDF

导出

摘要基于序列到序列模型的生成式文档摘要算法已经取得了良好的效果。鉴于中文N-gram蕴含着丰富的局部上下文信息,该文提出将N-gram信息整合到现有模型的神经框架NgramSum,即利用N-gram信息增强神经模型局部上下文语义感知能力。该框架以现有的神经模型为主干,从本地语料库提取N-gram信息,提出了一个局部上下文视野感知增强模块和一个门模块,并来分别对这些信息进行编码和聚合。在NLPCC 2017中文单文档摘要评测数据集上的实验结果表明:该框架有效增强了基于LSTM、Transformer、预训练模型三种不同层次的序列到序列的强基线模型,其中ROUGE-1/2/L相较基线模型平均分别提高了2.76,3.25,3.10个百分点。进一步的实验和分析也证明了该框架在不同N-gram度量方面的鲁棒性。 The abstractive document summarization algorithm based on sequence-to-sequence model has achieved good performance.Given that the rich local contextual information contained in Chinese n-grams,this paper proposes NgramSum to integrate n-gram information into the neural framework of the existing model..The framework takes the existing neural model as the backbone,extracts n-grams information from the local corpus,and applies the n-gram information to augment the local context via a gate module.The experimental results on the dataset of NLPCC2017 shared task3 show that the framework effectively enhances the sequence-to-sequence strong baseline model of LSTM,Transformer,and pre-trained model with an average of 2.76%,3.25%and 3.10%increase,respectively,according to the ROUGE-1/2/L scores.

作者尹宝生安鹏飞 YIN Baosheng;AN Pengfei(Human-Computer Intelligence Research Center,Shenyang Aerospace University,Shenyang,Liaoning 110136,China)

机构地区沈阳航空航天大学人机智能研究中心

出处《中文信息学报》 CSCD 北大核心 2022年第8期135-143,153,共10页 Journal of Chinese Information Processing

基金国防技术基础项目(JSQB2017206C002)。

关键词生成式文摘 N-GRAM 局部上下文视野感知增强门模块 abstractive summarization N-gram local contextual visual perception augmentation gate module

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1侯丽微,胡珀,曹雯琳.主题关键词信息融合的中文生成式自动摘要研究[J].自动化学报,2019,45(3):530-539. 被引量：29
2魏文杰,王红玲,王中卿.基于文本结构和图卷积网络的生成式摘要[J].中文信息学报,2021,35(3):78-87. 被引量：1

二级参考文献9

1刘挺,吴岩,王开铸.自动文摘综述[J].情报科学,1998,16(1):63-69. 被引量：10
2纪文倩,李舟军,巢文涵,陈小明.一种基于LexRank算法的改进的自动文摘系统[J].计算机科学,2010,37(5):151-154. 被引量：15
3任昭春,马军,陈竹敏.基于动态主题建模的Web论坛文档摘要[J].计算机研究与发展,2012,49(11):2359-2367. 被引量：8
4彭帝超,刘琳,陈广宇,陈海东,左伍衡,陈为.一种新的视频摘要可视化算法[J].计算机研究与发展,2013,50(2):371-378. 被引量：2
5莫鹏,胡珀,黄湘冀,何婷婷.基于超图的文本摘要与关键词协同抽取研究[J].中文信息学报,2015,29(6):135-140. 被引量：11
6刘康,张元哲,纪国良,来斯惟,赵军.基于表示学习的知识库问答研究进展与展望[J].自动化学报,2016,42(6):807-818. 被引量：27
7奚雪峰,周国栋.面向自然语言处理的深度学习研究[J].自动化学报,2016,42(10):1445-1465. 被引量：226
8赵京胜,朱巧明,周国栋,张丽.自动关键词抽取研究综述[J].软件学报,2017,28(9):2431-2449. 被引量：91
9陈伟宏,安吉尧,李仁发,李万里.深度学习认知计算综述[J].自动化学报,2017,43(11):1886-1897. 被引量：38

共引文献28

1石磊,阮选敏,魏瑞斌,成颖.基于序列到序列模型的生成式文本摘要研究综述[J].情报学报,2019,38(10):1102-1116. 被引量：13
2陶兴,张向先,郭顺利,张莉曼.学术问答社区用户生成内容的W2V-MMR自动摘要方法研究[J].数据分析与知识发现,2020,4(4):109-118. 被引量：8
3叶俊民,罗达雄,陈曙.基于短文本情感增强的在线学习者成绩预测方法[J].自动化学报,2020,46(9):1927-1940. 被引量：14
4吕瑞,王涛,曾碧卿,刘相湖.TSPT:基于预训练的三阶段复合式文本摘要模型[J].计算机应用研究,2020,37(10):2917-2921. 被引量：3
5柴悦,赵彤洲,江逸琪,高佩东.基于Att-iBi-LSTM的新闻主题词提取方法研究[J].武汉工程大学学报,2020,42(5):575-580.
6谢谦,董立红,厍向阳.基于Attention-GRU的短期电价预测[J].电力系统保护与控制,2020,48(23):154-160. 被引量：48
7宁珊,严馨,徐广义,周枫,张磊.融合关键词的中文新闻文本摘要生成[J].计算机工程与科学,2020,42(12):2265-2272. 被引量：5
8谭金源,刁宇峰,祁瑞华,林鸿飞.基于BERT-PGN模型的中文新闻文本自动摘要生成[J].计算机应用,2021,41(1):127-132. 被引量：12
9黄佳佳,李鹏伟.基于变分自编码器的生成式文本摘要研究[J].计算机应用研究,2021,38(3):705-709. 被引量：3
10蓝雯飞,周伟枭,许智明,朱容波,罗一凡.基于混合过滤编码的神经中文生成式摘要[J].中南民族大学学报（自然科学版）,2021,40(3):305-311.

1范艺华,董张玉,杨学志.结合上下文编码与特征融合的SAR图像分割[J].中国图象图形学报,2022,27(8):2527-2536. 被引量：3
2崔泽茹,王胜平,陈小叶,黎宏涛.基于点云的船闸精细化三维建模[J].海洋测绘,2022,42(5):64-67. 被引量：1
3周果,季彬,方晓平.多对多越库配送绿色车辆路径问题及算法研究[J].铁道科学与工程学报,2022,19(8):2202-2210. 被引量：5
4刘璐,张春柯,颜建军,郭睿,王忆勤,燕海霞,张叶青.冠状动脉不同阻塞程度冠心病患者的中医脉图特征参数分析[J].北京中医药大学学报,2022,45(8):835-841. 被引量：6
5杨雯,胡文佳,陈彬,谭红建,董鹏,俞炜炜,杜建国.基于MaxEnt模型的中国近海主要石首鱼科鱼类潜在适生区[J].生态学杂志,2022,41(9):1825-1834. 被引量：4

中文信息学报

2022年第8期

浏览历史

内容加载中请稍等...

通过N-gram增强局部上下文视野感知的中文生成式摘要

参考文献2

二级参考文献9

共引文献28

相关作者

相关机构

相关主题

浏览历史