面向连贯性强化的无真值依赖文本摘要模型被引量：1

Abstractive Text Summarization Model with Coherence Reinforcement and No Ground Truth Dependency

下载PDF

导出

摘要技术旨在凝练给定文本,以篇幅较短的摘要有效反映出原文核心内容。现阶段,生成型文本摘要技术因能够以更加灵活丰富的词汇对原文进行转述,已成为文本摘要领域的研究热点。然而,现有生成型文本摘要模型在产生摘要语句时涉及对原有词汇的重组与新词的添加,易造成摘要语句不连贯、可读性低。此外,通过传统基于已标注数据的有监督训练提升摘要语句连贯性,需投入较高的数据成本,致使实际应用受限。为此,提出了一种面向连贯性强化的无真值依赖文本摘要(生成)模型(ATS;G)。该模型在仅给定原文本的限制条件下,一方面,基于原文本的编码结果,产生语句抽取标识,刻画对原文关键信息的筛选过程,由解码器对筛选后的语句编码进行解码;另一方面,基于解码器输出的原始词汇分布,分别按"概率选择"与按"Softmax-贪婪选择"产生两类摘要文本。综合语句连贯性与语句内容两方面,构建两类摘要文本的总体收益后,利用自评判策略梯度,引导模型学习关键语句筛选以及对所筛选关键语句进行解码,生成语句连贯性高、内容质量好的摘要文本。实验表明,即便不给定任何事先标注的摘要真值,所提出模型的摘要内容指标总体上仍优于现有文本摘要方法;与此同时,ATS;G生成的摘要文本在语句连贯性、内容重要性、信息冗余性、词汇新颖度和摘要困惑度方面亦优于现有方法。 Automatic text summarization aims to compress a given document,which can efficiently reflect the main idea of the source document with a short summary.At present,abstractive summarization method has become a research hotspot in the field of text summarization because it can paraphrase the source document with flexible and abundant vocabulary.However,existing abstractive summarization model reorganizes original words and adds new words when generating summary.That’s why it can easily cause the inconsistency and low readability.In addition,the traditional supervised learning based on labeled data requires high cost to improve the coherence of summary sentences,which limits the practical application.Therefore,this paper proposes an abstractive text summarization model with coherence reinforcement and no ground truth dependency(ATS_CG).On the one hand,based on the embdding of the source document,the model generates extractive label to describe the filtering process of the key information.And then,the filtered sentence embeddings are decoded by the decoder.On the other hand,based on the original word probability distribution output by the decoder,two types of summarization are generated according to“probability selection”and“Softmax-greedy selection”.And then,the model will compute the overall rewards of the two types of summarization from the two aspects of coherence and content.Next,the model will learn to filter key sentences and decode them through the self-critical policy gradient,so as to generate abstractive summarizaion with high coherence and quality.Experiments show that ATS_CG is superior to the existing text summarization methods in terms of evaluation scores on the whole,even without any ground truth.At the same time,abstractive summarization generated by ATS_CG is also better than the existing methods in coherence,relevance,redundancy,novelty and perplexity.

作者陈共驰荣欢马廷淮 CHEN Gongchi;RONG Huan;MA Tinghuai(School of Artificial Intelligence(School of Future Technology),Nanjing University of Infomation Science&Technology,Nanjing 210044,China;School of Computer Science,Nanjing University of Information Science&Technology,Nanjing 210044,China)

机构地区南京信息工程大学人工智能学院(未来技术学院) 南京信息工程大学计算机学院(软件学院、网络空间安全学院)

出处《计算机科学与探索》 CSCD 北大核心 2022年第3期621-636,共16页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金(62102187) 江苏省自然科学基金(基础研究计划)(BK20210639) 2021年江苏省省级大学生创新创业训练计划项目(202110300093Y) 国家重点研发计划(2021YFE0104400)。

关键词自动文本摘要自然语言处理强化学习信息检索与集成 automatic text summarization natural language processing reinforcement learning information retrieval and integration

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1李金鹏,张闯,陈小军,胡玥,廖鹏程.自动文本摘要研究综述[J].计算机研究与发展,2021,58(1):1-21. 被引量：49
2王侃,曹开臣,徐畅,潘袁湘,牛新征.基于改进Transformer模型的文本摘要生成方法[J].电讯技术,2019,59(10):1175-1181. 被引量：11

二级参考文献3

1秦兵,刘挺,陈尚林,李生.多文档文摘中句子优化选择方法研究[J].计算机研究与发展,2006,43(6):1129-1134. 被引量：13
2曹洋,成颖,裴雷.基于机器学习的自动文摘研究综述[J].图书情报工作,2014,58(18):122-130. 被引量：16
3王俊丽,魏绍臣,管敏.基于图排序算法的自动文摘研究综述[J].计算机科学,2015,42(12):1-7. 被引量：12

共引文献58

1SHI Hui,WANG Tiexin.A Hybrid Method of Extractive Text Summarization Based on Deep Learning and Graph Ranking Algorithms[J].Transactions of Nanjing University of Aeronautics and Astronautics,2022,39(S01):158-165. 被引量：1
2宁珊,严馨,徐广义,周枫,张磊.融合关键词的中文新闻文本摘要生成[J].计算机工程与科学,2020,42(12):2265-2272. 被引量：4
3郑海斌,陈晋音,章燕,张旭鸿,葛春鹏,刘哲,欧阳亦可,纪守领.面向自然语言处理的对抗攻防与鲁棒性分析综述[J].计算机研究与发展,2021,58(8):1727-1750. 被引量：9
4王晴.基于统计的多文本网站文本内容抽取算法[J].安徽电子信息职业技术学院学报,2021,20(4):6-12. 被引量：2
5邹蕾,崔斌,樊超,孙豫峰.基于双向编码文本摘要-长短期记忆-注意力的检察建议文本自动生成模型[J].科学技术与工程,2021,21(25):10780-10788. 被引量：9
6王亮,肖易寒.Transformer网络在雷达辐射源识别中的应用[J].应用科技,2021,48(5):81-85. 被引量：4
7李伯涵,李红莲.一种融合关键词的生成式摘要方法[J].计算机应用研究,2021,38(11):3289-3292. 被引量：2
8高巍,马辉,李大舟,于沛,孟智慧.基于FA-TR模型的中文文本摘要生成[J].计算机工程与设计,2021,42(12):3445-3452.
9王倩影,邓亚男.基于深度模型的商品描述文案生成[J].信息技术与信息化,2021(11):28-31.
10黄淼,陈仁,钟浩,王强钢,文旭.面向电力系统潮流仿真的语音交互研究[J].电工电能新技术,2021,40(12):40-47. 被引量：3

同被引文献13

1阿布都克力木·阿布力孜,张雨宁,阿力木江·亚森,郭文强,哈里旦木·阿布都克里木.预训练语言模型的扩展模型研究综述[J].计算机科学,2022,49(S02):43-54. 被引量：11
2李大舟,于沛,高巍,马辉.基于编解码器结构的中文文本摘要[J].计算机工程与设计,2021,42(3):696-702. 被引量：10
3蔡中祥,孙建伟.融合指针网络的新闻文本摘要模型[J].小型微型计算机系统,2021,42(3):462-466. 被引量：14
4邹蕾,崔斌,樊超,孙豫峰.基于双向编码文本摘要-长短期记忆-注意力的检察建议文本自动生成模型[J].科学技术与工程,2021,21(25):10780-10788. 被引量：9
5陈德,宋华珠,张娟,周泓林.融合BERT和记忆网络的实体识别[J].计算机科学,2021,48(10):91-97. 被引量：5
6周蔚,王兆毓,魏斌.面向法律裁判文书的生成式自动摘要模型[J].计算机科学,2021,48(12):331-336. 被引量：7
7梁梦英,李德玉,王素格,廖健,郑建兴,陈千.Senti-PG-MMR:多文档游记情感摘要生成方法[J].中文信息学报,2022,36(3):128-135. 被引量：3
8郑承宇,王新,王婷,尹甜甜,邓亚萍.基于Stacking-Bert集成学习的中文短文本分类算法[J].科学技术与工程,2022,22(10):4033-4038. 被引量：9
9孙宝山,谭浩.基于ALBERT-UniLM模型的文本自动摘要技术研究[J].计算机工程与应用,2022,58(15):184-190. 被引量：5
10孙凯丽,罗旭东,罗有容.预训练语言模型的应用综述[J].计算机科学,2023,50(1):176-184. 被引量：9

引证文献1

1裴炳森,李欣,胡凯茜,孙泽宇.基于知识增强预训练模型的司法文本摘要生成[J].科学技术与工程,2024,24(20):8587-8597.

1赵玉颖.思政课高质量实践教学评价及改革路径分析[J].红河学院学报,2021,19(6):96-99. 被引量：5
2王宗辉,李宝安,吕学强,游新冬.BETES:一种中文长文档抽取式摘要方法[J].小型微型计算机系统,2022,43(1):42-49. 被引量：3
3银伟.茶文化背景下高校英语翻译教学思路研究[J].福建茶叶,2021,43(5):249-250.
4吴子仪,李邵梅,张建朋,姜梦函.基于重要性筛选与语义聚类的本体摘要技术[J].信息工程大学学报,2021,22(6):716-721.
5韩虎,赵启涛,孙天岳,刘国利.面向社交媒体评论的上下文语境讽刺检测模型[J].计算机工程,2021,47(1):66-71. 被引量：5
6王文斌,赵传博,赵云.BIM技术在发电站建筑工程中的研究与应用[J].武汉大学学报（工学版）,2021,54(S01):194-197. 被引量：5
7朱杰,张宏军,廖湘琳,田江鹏.基于主题模型的地理环境时空数据隐含语义理解[J].测绘学报,2021,50(10):1404-1415. 被引量：3
8郑方舟.基于复制和覆盖率机制的生成式文本摘要方法研究[J].长江信息通信,2022,35(2):154-156.
9刘延飞,李慧,何玉杰.文本风格转换模型的平衡性改进方法研究[J].兵器装备工程学报,2021,42(11):163-168.
10陈婷.高考作文语言:连贯达意缜密[J].中学语文,2022(2):26-28.

计算机科学与探索

2022年第3期

浏览历史

内容加载中请稍等...

面向连贯性强化的无真值依赖文本摘要模型被引量：1

参考文献2

二级参考文献3

共引文献58

同被引文献13

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向连贯性强化的无真值依赖文本摘要模型 被引量：1

参考文献2

二级参考文献3

共引文献58

同被引文献13

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向连贯性强化的无真值依赖文本摘要模型被引量：1