融合多层注意力表示的中文新闻文本摘要生成被引量：1

CHINESE NEWS TEXT SUMMARIZATION GENERATION BASED ON MULTI-LEVEL ATTENTION REPRESENTATION

下载PDF

导出

摘要针对现有的文本摘要模型词向量表意不全面,且难以对远距离词句进行表征,提出一种融合多层注意力表示的中长文本摘要方法。通过抽取式技术将新闻文本进行分割,得到主体文本和辅助文本;将主体文本进行图卷积神经网络的学习和依存句法分析,得到词向量的图卷积表示和依存词对信息,同时对辅助文本进行高频主题词的挖掘;将这三种信息融合送入Transformer序列模型中,并对编码器和解码器的局部注意力稍作修改,使其能够更多地关注主题相关的部分和依存句法结构;生成文本摘要。在公共文本摘要数据集NLPCC 2017上的实验表明,该方法能够得到较高的ROUGE分数,生成质量更好的文本摘要。 In view of the fact that the word vector of the existing text summarization model is not comprehensive and difficult to represent the long-distance words and sentences,this paper proposes a medium long text summarization method with multi-level attention representation.The news text was segmented by extractive technology to get the main text and auxiliary text.The main text was studied by graph convolution neural network and dependency syntax analysis to obtain the graph convolution representation of word vector and the information of dependent word pairs.At the same time,the auxiliary text was mined with high-frequency topic words.These three kinds of information were fused into the transformer sequence model.The local attention of the encoder and decoder was modified to make them pay more attention to the topic related parts and dependency syntactic structure.The text summary was generated.Experiments on the public text summarization dataset NLPCC 2017 show that this method can get higher ROUGE scores and generate better quality text summaries.

作者王骞雷景生唐小岚 Wang Qian;Lei Jingsheng;Tang Xiaolan(Shanghai University of Electric Power,Shanghai 201300,China)

机构地区上海电力大学

出处《计算机应用与软件》北大核心 2023年第10期191-198,共8页 Computer Applications and Software

基金国家自然科学基金项目(61672337)。

关键词文本摘要生成 TextRank 图卷积神经网络依存句法分析 Transformer序列模型 Text-summary generation TextRank Graph convolution neural network Dependency syntax analysis Transformer sequence module

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献4

1张云纯,张琨,徐济铭,袁卫平,蔡颖,高雅.基于图模型的多文档摘要生成算法[J].计算机工程与应用,2020,56(16):124-131. 被引量：5
2罗芳,汪竞航,何道森,蒲秋梅.融合主题特征的文本自动摘要方法研究[J].计算机应用研究,2021,38(1):129-133. 被引量：5
3宁珊,严馨,徐广义,周枫,张磊.融合关键词的中文新闻文本摘要生成[J].计算机工程与科学,2020,42(12):2265-2272. 被引量：5
4倪海清,刘丹,史梦雨.基于语义感知的中文短文本摘要生成模型[J].计算机科学,2020,47(6):74-78. 被引量：4

二级参考文献18

1黄波,刘传才.基于加权TextRank的中文自动文本摘要[J].计算机应用研究,2020,37(2):407-410. 被引量：21
2李蕾,钟义信,郭祥昊.面向特定领域的理解型中文自动文摘系统[J].计算机研究与发展,2000,37(4):493-497. 被引量：14
3付玲,张晖.结合LDA和谱聚类的多文档摘要[J].计算机工程与应用,2013,49(16):142-145. 被引量：8
4夏天.词语位置加权TextRank的关键词抽取研究[J].现代图书情报技术,2013(9):30-34. 被引量：76
5王俊丽,魏绍臣,管敏.基于图排序算法的自动文摘研究综述[J].计算机科学,2015,42(12):1-7. 被引量：12
6阳小兰,杨威,钱程,朱福喜.融合HowNet和BTM模型的短文本聚类方法[J].计算机工程与设计,2017,38(5):1258-1263. 被引量：9
7蒲梅,周枫,周晶晶,严馨,周兰江.基于加权TextRank的新闻关键事件主题句提取[J].计算机工程,2017,34(8):219-224. 被引量：11
8李航,唐超兰,杨贤,沈婉婷.融合多特征的TextRank关键词抽取方法[J].情报杂志,2017,36(8):183-187. 被引量：33
9于广川,贺瑞芳,刘洋,党建武.融合语境分析的时序推特摘要方法[J].软件学报,2017,28(10):2654-2673. 被引量：3
10王玮,欧阳纯萍,阳小华,罗凌云,刘志明.融合句子情感和主题相似性的中文新闻文本情感摘要[J].计算机应用研究,2017,34(12):3543-3546. 被引量：4

共引文献15

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2陈红.基于事件时序关系的自动摘要抽取[J].盐城工学院学报（自然科学版）,2021,34(1):31-35.
3张晨阳,杜义华.短文本自动生成技术研究进展[J].数据与计算发展前沿,2021,3(3):111-125. 被引量：1
4邹蕾,崔斌,樊超,孙豫峰.基于双向编码文本摘要-长短期记忆-注意力的检察建议文本自动生成模型[J].科学技术与工程,2021,21(25):10780-10788. 被引量：9
5邓涵兮,陈志华.基于网络评论的美食推荐系统[J].中国传媒科技,2022(3):39-41. 被引量：1
6侯伟立.翻译机器人英文文本自动查错系统设计[J].自动化与仪器仪表,2022(4):232-236. 被引量：2
7田媛,郝文宁,陈刚,靳大尉,邹傲.基于多粒度语义交互的抽取式多文档摘要[J].计算机系统应用,2022,31(7):186-193. 被引量：1
8谷莹,李贺,祝琳琳.融合主题聚类和语义图模型的产品评论自动摘要方法研究[J].图书情报工作,2022,66(13):118-126. 被引量：6
9徐飞,彭佳佳,刘军,杨博.基于多特征融合的TextRank新闻自动摘要模型[J].计算机系统应用,2023,32(2):242-249.
10陈媛媛,王磊.基于融合关键词和对比学习训练的生成式报告摘要模型研究——以中国智库报告为例[J].农业图书情报学报,2023,35(6):72-82.

同被引文献10

1赵伟,王文娟,任彦凝,刘群,胥钟予,彭露.基于改进Transformer的生成式文本摘要模型[J].重庆邮电大学学报（自然科学版）,2023,35(1):185-192. 被引量：7
2卢经纬,郭超,戴星原,缪青海,王兴霞,杨静,王飞跃.问答ChatGPT之后:超大预训练模型的机遇和挑战[J].自动化学报,2023,49(4):705-717. 被引量：51
3张琪,范永胜,金独亮.基于MMR和WordNet的新闻文本摘要生成研究[J].西南师范大学学报（自然科学版）,2023,48(5):77-86. 被引量：2
4刘蓓,许卓明,陶皖,刘三民.少样本关系抽取研究综述[J].计算机工程与应用,2023,59(15):27-37. 被引量：2
5祁鹏年,廖雨伦,覃飙.基于深度学习的中文命名实体识别研究综述[J].小型微型计算机系统,2023,44(9):1857-1868. 被引量：13
6施国良,周抒,王云峰,施春江,刘亮.基于改进多头注意力机制的专利文本摘要生成研究[J].数据分析与知识发现,2023,7(6):61-72. 被引量：1
7赵冠博,张勇丙,毛存礼,高盛祥,王奉孝.融入领域知识的跨境民族文化生成式摘要方法[J].南京大学学报（自然科学版）,2023,59(4):620-628. 被引量：2
8魏鑫炀,秦永彬,唐向红,黄瑞章,陈艳平.融合法条的司法裁判文书摘要生成方法[J].计算机工程与设计,2023,44(9):2844-2850. 被引量：2
9杨波,孙晓虎,党佳怡,赵海燕,金芝.面向医疗问答系统的大语言模型命名实体识别方法[J].计算机科学与探索,2023,17(10):2389-2402. 被引量：13
10徐月梅,胡玲,赵佳艺,杜宛泽,王文清.大语言模型的技术应用前景与风险挑战[J].计算机应用,2024,44(6):1655-1662. 被引量：8

引证文献1

1裴炳森,李欣,蒋章涛,刘明帅.基于大语言模型的司法文本摘要生成与评价技术研究[J].数据与计算发展前沿（中英文）,2024,6(6):62-73.

1夏虞南.“书”类文献的政治哲学新解读--从葛觉智《中国早期政治合法性的调解》谈起[J].国际儒学（中英文）,2023,3(1):158-162.
2徐薇薇,马晶淼,陈金芳,李娜娜,王静.癌症患者出院准备的研究现状及热点分析[J].中华护理教育,2023,20(8):981-985. 被引量：2
3刘丹霓.16世纪复调音乐书籍中的“副文本”研究[J].天津音乐学院学报,2022(4):33-42. 被引量：1
4张倩倩,张祎,李浩,马媛媛,罗向阳.基于特征选择和图卷积表示的JPEG图像隐写者识别[J].通信学报,2023,44(7):218-229.
5邓雨秋,闫伟娜.话语共建与仪式互动:卡塔尔世界杯开幕式伴随文本研究[J].全媒体探索,2023(2):89-91.
6张少茹,周云舒,张若弟,刘世莉,陈晓华,王卓,陈志强.多参数MRI影像组学模型鉴别高级别胶质瘤与原发性中枢神经系统淋巴瘤的价值[J].磁共振成像,2023,14(10):53-57. 被引量：4
7李月,李琳,陈丽,王槐彬.基于图神经网络的学习推荐算法研究[J].现代计算机,2023,29(16):27-32. 被引量：1
8丁邱,严馨,刘艳超,徐广义,邓忠莹.融合回答者排序得分的CQA答案摘要方法[J].陕西理工大学学报（自然科学版）,2023,39(5):38-46.
9原静.通过跨学科教学达到协同育人[J].中国中小学美术,2023(7):35-35.
10高玮军,刘健,毛文静.基于T-HDGN模型的对话摘要生成方法[J].计算机工程,2023,49(10):80-88. 被引量：1

计算机应用与软件

2023年第10期

浏览历史

内容加载中请稍等...

融合多层注意力表示的中文新闻文本摘要生成被引量：1

参考文献4

二级参考文献18

共引文献15

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合多层注意力表示的中文新闻文本摘要生成 被引量：1

参考文献4

二级参考文献18

共引文献15

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合多层注意力表示的中文新闻文本摘要生成被引量：1