基于双编码器结构的文本自动摘要研究被引量：6

Research on Automatic Text Summarization Based on Dual-Encoder Structure

下载PDF

导出

摘要为了解决序列到序列模型中编码器不能充分编码源文本的问题,构建一种基于双编码器网络结构的CGAtten-GRU模型。2个编码器分别使用卷积神经网络和双向门控循环单元,源文本并行进入双编码器,结合2种编码网络结构的输出结果构建注意力机制,解码器端使用GRU网络融合Copy机制和集束搜索方法,以提高解码的准确度。在大规模中文短文本摘要数据集LCSTS上的实验结果表明,与RNN context模型相比,该模型的Rouge-1、Rouge-2和Rouge-L分别提高0.1、0.059和0.046。 This paper constructs a CGAtten-GRU model based on dual-encoder network structure to solve the problem that the encoder cannot fully encode the source text in the sequence-to-sequence(seq2seq)model.The two encoders use Convolutional Neural Network(CNN)and Bidirectional Gated Recurrent Unit(BiGRU)respectively,and the source text enters the two encoders in parallel.An attention mechanism is constructed by means of the outputs of two encoding networks.The decoder uses GRU network combining the Copy mechanism and the beam search method to improve the accuracy of decoding.Experimental results on large-scale Chinese short text summarization dataset LCSTS show that compared with the RNN context model,the proposed model improves Rouge-1 by 0.1,Rouge-2 by 0.059,and Rouge-L by 0.046.

作者冯读娟杨璐严建峰 FENG Dujuan;YANG Lu;YAN Jianfeng(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China)

机构地区苏州大学计算机科学与技术学院

出处《计算机工程》 CAS CSCD 北大核心 2020年第6期60-64,共5页 Computer Engineering

基金国家自然科学基金(61572339,61272449) 江苏省科技支撑计划重点项目(BE2014005)。

关键词自然语言处理生成式摘要卷积神经网络门控循环单元注意力机制序列到序列模型 Copy机制 Natural Language Processing(NLP) abstractive summarization Convolutional Neural Network(CNN) Gated Recurrent Unit(GRU) attention mechanism sequence-to-sequence(seq2seq)model Copy mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1726
2彭敏,高斌龙,黄济民,刘纪平.基于高质量信息提取的微博自动摘要[J].计算机工程,2015,41(7):36-42. 被引量：7
3庞磊,李寿山,周国栋.基于情绪知识的中文微博情感分类方法[J].计算机工程,2012,38(13):156-158. 被引量：32

二级参考文献39

1Pang Bo,Lee L,Vaithyanathan S.Thumbs up?SentimentClassification Using Machine Learning Techniques[C]//Proc.ofConference on Empirical Methods in Natural Language Processing.[S.l.]:ACM Press,2002.
2Kim Soo-Min,Hovy E.Automatic Detection of Opinion BearingWords and Sentences[C]//Proc.of International Joint Conferenceon Natural Language Processing.Jeju Island,Korea:[s.n.],2005.
3Yu Hong,Hatzivassiloglou V.Towards Answering OpinionQuestions:Separating Facts from Opinions and Identifying thePolarity of Opinion Sentences[C]//Proc.of Conference onEmpirical Methods in Natural Language Processing.Sapporo,Japan:[s.n.],2003.
4Hu Minqing,Liu Bing.Mining and Summarizing CustomerReviews[C]//Proc.of Conference on Knowledge Discovery andData.[S.l.]:ACM Press,2004.
5Cui Hang,Mittal V,Datar M.Comparative Experiments onSentiment Classification for Online Product Reviews[C]//Proc.ofthe 21st National Conference on Artificial Intelligence.[S.l.]:ACM Press,2006.
6Kim Soo-Min,Hovy E.Automatic Identification of Pro and ConReasons in Online Reviews[C]//Proc.of the 21st InternationalConference on Computational Linguistics and the 44th AnnualMeeting of the Association for Computational Linguistics.Sydney,Australia:[s.n.],2006.
7Zhao Jun,Liu Kang,Wang Gen.Adding Redundant Features forCRFs-based Sentence Sentiment Classification[C]//Proc.ofConference on Empirical Methods in Natural Language Processing.[S.l.]:ACM Press,2008.
8Go A,Bhayani R,Huang Lei.Twitter Sentiment ClassificationUsing Distant Supervision[Z].2009.
9Pak A,Paroubek P.Twitter as a Corpus for Sentiment Analysisand Opinion Mining[C]//Proc.of Language Resources andEvaluation Conference.Lisbon,Portugal:[s.n.],2010.
10Jiang Long,Yu Mo,Zhou Ming,et al.Target-dependent TwitterSentiment Classification[C]//Proc.of the 49th Annual Meeting ofthe Association for Computational Linguistics.Portland,USA:[s.n.],2011:151-160.

共引文献1762

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104. 被引量：1

同被引文献106

1许奎,冷艳梅.新时代中国特色国家审计项目组织管理影响因素研究——基于访谈和问卷的调查分析[J].审计研究,2022(5):49-55. 被引量：2
2李煜,徐安琪.普通人的爱情观研究——兼开放式问题的量化尝试[J].社会科学,2007(7):132-141. 被引量：12
3王俊芳,时俊卿.问卷调查的类别、优缺点及实施[J].教育科学研究,2004(9):58-59. 被引量：3
4陈燕敏,王晓龙,刘远超,楼喜中.一种基于文章主题和内容的自动摘要方法[J].计算机工程与应用,2004,40(33):11-14. 被引量：12
5莫燕,王永成.中文文献摘要的自动编制[J].现代图书情报技术,1993(3):10-12. 被引量：15
6王永成.自动编制文献摘要及知识的自动提取[J].现代图书情报技术,1993(3):13-13. 被引量：1
7武庆玲.定量项目问卷的编码要求及原则[J].市场研究,2006(5):44-47. 被引量：1
8黄水清,李志燕,梁刚.面向计算机类文献的自动摘要系统的研究与实现[J].图书与情报,2006(3):93-97. 被引量：1
9肖富群.调查研究中开放式问题的编码[J].统计与决策,2007,23(5):73-74. 被引量：3
10官礼和.Internet网络新闻文本自动摘要的研究[J].计算机工程与设计,2007,28(14):3518-3520. 被引量：9

引证文献6

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2邹蕾,崔斌,樊超,孙豫峰.基于双向编码文本摘要-长短期记忆-注意力的检察建议文本自动生成模型[J].科学技术与工程,2021,21(25):10780-10788. 被引量：9
3蒋杰.面向主题的无监督文本摘要生成方法[J].电脑知识与技术,2021,17(28):127-130.
4周蔚,王兆毓,魏斌.面向法律裁判文书的生成式自动摘要模型[J].计算机科学,2021,48(12):331-336. 被引量：7
5蔡瑞初,张盛强,许柏炎.基于结构感知混合编码模型的代码注释生成方法[J].计算机工程,2023,49(2):61-69. 被引量：3
6刘培莹,安建业.调查问卷中开放题文本答案编码方法研究综述[J].统计学与应用,2023,12(5):1464-1476.

二级引证文献19

1赵嘉昕,崔喆.面向法律判决文书的长文档抽取式文摘方法——BIGDCNN[J].计算机应用,2023,43(S01):67-74. 被引量：1
2朱威,马小明,张纲,周忠志,薛原,邓艾东.基于GraphSage和自注意力机制的滚动轴承半监督故障诊断方法[J].信息化研究,2023,49(4):48-54.
3王倩影,邓亚男.基于深度模型的商品描述文案生成[J].信息技术与信息化,2021(11):28-31.
4刘宇枝,陈博,赵鑫,李翠荣.基于TextRank的医院信息智能处理方法研究[J].粘接,2022(9):178-182. 被引量：2
5魏斌.法律人工智能:科学内涵、演化逻辑与趋势前瞻[J].浙江大学学报（人文社会科学版）,2022,52(7):49-67. 被引量：15
6孙凯丽,罗旭东,罗有容.预训练语言模型的应用综述[J].计算机科学,2023,50(1):176-184. 被引量：9
7高景芳.新文科建设的几点冷思考[J].牡丹江教育学院学报,2022(11):89-93. 被引量：1
8刘燕.基于层次语言的英语语法纠错系统研究[J].自动化与仪器仪表,2023(2):190-194.
9宋小祎,张若定,张妍,张梅山,黎家通.基于深度学习的跨自然语言与程序语言生成任务综述[J].信息安全学报,2023,8(3):65-84.
10颜婷婷,戎慧敏.基于BERT-Transformer的跨语言文本摘要技术研究[J].平顶山学院学报,2023,38(5):61-64.

1缪永伟,刘家宗,陈佳慧,舒振宇.基于生成对抗网络的点云形状保结构补全[J].中国科学：信息科学,2020,50(5):675-691. 被引量：7
2陈鹏,王子磊.融合深度学习与搜索的实时策略游戏微操方法[J].计算机工程,2020,46(6):50-59.
3罗文华,李孟林.面向法庭科学的多属性中文短文本作者归属[J].中国刑警学院学报,2020(2):119-123.
4张哲璇,龙腾,徐广通,王仰杰.重访机制驱动的多无人机协同动目标搜索方法[J].航空学报,2020,41(5):215-227. 被引量：13

计算机工程

2020年第6期

浏览历史

内容加载中请稍等...

基于双编码器结构的文本自动摘要研究被引量：6

参考文献3

二级参考文献39

共引文献1762

同被引文献106

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于双编码器结构的文本自动摘要研究 被引量：6

参考文献3

二级参考文献39

共引文献1762

同被引文献106

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于双编码器结构的文本自动摘要研究被引量：6