基于语义感知的中文短文本摘要生成模型被引量：4

Chinese Short Text Summarization Generation Model Based on Semantic-aware

下载PDF

导出

摘要文本摘要生成技术能够从海量数据中概括出关键信息,有效解决用户信息过载的问题。目前序列到序列模型被广泛应用于英文文本摘要生成领域,而在中文文本摘要生成领域没有对该模型进行深入研究。对于传统的序列到序列模型,解码器通过注意力机制将编码器输出的每一个词的隐藏状态作为原始文本完整的语义信息来生成摘要,但是编码器输出的每一个词的隐藏状态仅包含前、后词的语义信息,不包含原始文本完整的语义信息,导致生成摘要缺失原始文本的核心信息,影响生成摘要的准确性和可读性。为此,文中提出基于语义感知的中文短文本摘要生成模型SA-Seq2Seq,以结合注意力机制的序列到序列模型为基础,通过使用预训练模型BERT,在编码器中将中文短文本作为整体语义信息引入,使得每一个词包含整体语义信息;在解码器中将参考摘要作为目标语义信息计算语义不一致损失,以确保生成摘要的语义完整性。采用中文短文本摘要数据集LCSTS进行实验,结果表明,模型SA-Seq2Seq在评估标准ROUGE上的效果相对于基准模型有显著提高,其ROUGE-1,ROUGE-2和ROUGE-L评分在基于字符处理的数据集上分别提升了3.4%,7.1%和6.1%,在基于词语处理的数据集上分别提升了2.7%,5.4%和11.7%,即模型SA-Seq2Seq能够更有效地融合中文短文本的整体语义信息,挖掘其关键信息,确保生成摘要的流畅性和连贯性,可以应用于中文短文本摘要生成任务。 ion.In the conventional sequence-to-sequence model,the decoder applies the hidden state of each word output by the encoder as the overall semantic information through the attention mechanism,nevertheless the hidden state of each word which encoder outputs only in consideration of the front and back words of current word,which results in the generated summary missing the core information of the source text.To solve this problem,a semantic-aware based Chinese short text summarization generation model called SA-Seq2Seq is proposed,which uses the sequence-to-sequence model with attention mechanism.The model SA-Seq2Seq applies the pre-training model called BERT to introduce source text in the encoder so that each word contains the overall semantic information and uses gold summary as the target semantic information in the decoder to calculate the semantic inconsistency loss,thus ensuring the semantic integrity of the generated summary.Experiments are carried out on the dataset using the Chinese short text summary dataset LCSTS.The experimental results show that the model SA-Seq2Seq on the evaluation metric ROUGE is significantly improved compared to the benchmark model,and its ROUGE-1,ROUGE-2 and ROUGE-L scores increase by 3.4%,7.1%and 6.1%respectively in the dataset that is processed based on character and increase by 2.7%,5.4%and 11.7%respectively in the dataset that is processed based on word.So the SA-Seq2Seq model can effectively integrate Chinese short text and ensure the fluency and consistency of the generated summary,which can be applied to the Chinese short text summary generation task.

作者倪海清刘丹史梦雨 NI Hai-qing;LIU Dan;SHI Meng-yu(Research Institute of Electronic Science and Technology,University of Electronic Science and Technology of China,Chengdu 611731,China)

机构地区电子科技大学电子科学技术研究院

出处《计算机科学》 CSCD 北大核心 2020年第6期74-78,共5页 Computer Science

关键词中文短文本摘要序列到序列模型注意力机制预训练模型语义感知 Chinese short text summarization Sequence to sequence model Attention mechanism Pre-training model Semantic aware

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1庞超,尹传环.基于分类的中文文本摘要方法[J].计算机科学,2018,45(1):144-147. 被引量：9

共引文献8

1侯圣峦,张书涵,费超群.文本摘要常用数据集和方法研究综述[J].中文信息学报,2019,33(5):1-16. 被引量：19
2朱张莉,饶元,吴渊,祁江楠,张钰.注意力机制在深度学习中的研究进展[J].中文信息学报,2019,33(6):1-11. 被引量：129
3丁建立,李洋,王家亮.基于双编码器的短文本自动摘要方法[J].计算机应用,2019,39(12):3476-3481. 被引量：4
4吴世鑫,黄德根,张云霞.基于多特征融合模型的自动摘要[J].计算机工程与设计,2020,41(3):650-655. 被引量：3
5齐甜方,蒋洪迅.基于Seq2Seq文本摘要和情感挖掘的股票波动趋势预测[J].管理评论,2021,33(5):257-269. 被引量：10
6荣欢,马廷淮.利用收益预测与策略梯度两阶段众包评论集成[J].计算机科学与探索,2021,15(8):1476-1489.
7洪沛,戴胜林,仇国庆,刘恒智,马亮.大模型深度数据挖掘——文本摘要生成与商机智能识别研究[J].数字通信世界,2024(9):43-44.
8邓远远,沈炜.基于注意力反馈机制的深度图像标注模型[J].浙江理工大学学报（自然科学版）,2019,41(2):208-216. 被引量：4

同被引文献24

1司畅,张铁峰.关于自然语言生成技术的研究[J].信息技术,2010,34(9):108-110. 被引量：3
2蒋锐滢,崔磊,何晶,周明,潘志庚.基于主题模型和统计机器翻译方法的中文格律诗自动生成[J].计算机学报,2015,38(12):2426-2436. 被引量：16
3贾熹滨,李让,胡长建,陈军成.智能对话系统研究综述[J].北京工业大学学报,2017,43(9):1344-1356. 被引量：23
4高明霞,李经纬.基于word2vec词模型的中文短文本分类方法[J].山东大学学报（工学版）,2019,49(2):34-41. 被引量：28
5申强强,熊泽宇,熊岳山.一种新的基于段向量的文本自动摘要方法[J].计算机工程与科学,2019,41(6):1064-1070. 被引量：4
6韩奕.矿业工程科技英语文本解读及翻译——评《实用金属矿业工程英语》[J].矿业研究与开发,2019,39(6):161-161. 被引量：1
7李腊,贾晓庆.轮胎业英文文本特征与汉译策略[J].中国科技翻译,2019,32(3):4-6. 被引量：2
8陈榕,任崇广,王智远,曲志坚,王海鹏.基于注意力机制的CRNN文本分类算法[J].计算机工程与设计,2019,40(11):3151-3157. 被引量：21
9李树深.数据与计算是科技创新的巨大驱动力[J].数据与计算发展前沿,2019,1(1):1-1. 被引量：15
10廖方宇,洪学海,汪洋,褚大伟.数据与计算平台是驱动当代科学研究发展的重要基础设施[J].数据与计算发展前沿,2019,1(1):2-10. 被引量：24

引证文献4

1张晨阳,杜义华.短文本自动生成技术研究进展[J].数据与计算发展前沿,2021,3(3):111-125. 被引量：1
2侯伟立.翻译机器人英文文本自动查错系统设计[J].自动化与仪器仪表,2022(4):232-236. 被引量：2
3王骞,雷景生,唐小岚.融合多层注意力表示的中文新闻文本摘要生成[J].计算机应用与软件,2023,40(10):191-198.
4冯正平,王勇.融合分词和语义感知的中文文本摘要模型[J].计算机科学与应用,2021,11(12):2913-2923.

二级引证文献3

1门鼎,陈亮.基于改进Seq2Seq-Attention模型的文本摘要生成方法[J].电子设计工程,2022,30(23):6-10. 被引量：2
2千颖利.基于长短期记忆网络的英语标题自动生成[J].自动化技术与应用,2024,43(4):71-73.
3丰德恩,张雪英,唐卫,王益鹏,王慕华,渠寒花,李敏.基于知识图谱的冬奥赛事气象服务文本生成方法研究[J].科学技术与工程,2024,24(16):6600-6609.

1李逾严,张印辉,何自芬.基于串联空洞卷积神经网络的网球场景语义分割[J].计算机辅助设计与图形学学报,2020,32(4):606-615. 被引量：4
2贾颖霞,郎丛妍,冯松鹤.基于类别相关的领域自适应交通图像语义分割方法[J].计算机研究与发展,2020,57(4):876-887. 被引量：8
3李铁钢.数控加工后置处理器的实际加工时间的计算[J].沈阳工程学院学报（自然科学版）,2020,16(1):88-91. 被引量：1
4王玮.基于C-R神经网络的生成式自动摘要方法[J].计算机与数字工程,2020,48(1):112-118. 被引量：3
5张新生,高腾.多头注意力记忆网络的对象级情感分类[J].模式识别与人工智能,2019,32(11):997-1005. 被引量：10
6李宇明.计算机正改变着我们的语言生活[J].韩山师范学院学报,2020,41(1):1-4. 被引量：2
7贾晓婷,王名扬,曹宇.基于加权主题分布表达的微博文本摘要生成研究[J].东北师大学报（自然科学版）,2020,52(1):69-74. 被引量：1
8李俊芳.批评话语分析视角下“一带一路”国际高峰论坛开幕词的英译[J].晋中学院学报,2020,37(2):105-108. 被引量：1
9乔博文,李军辉.融合语义角色的神经机器翻译[J].计算机科学,2020,47(2):163-168. 被引量：10
10王寅同,王燕清,肖文洁.基于信息扩散与聚集的脱机手写字符重心定位方法[J].山西大学学报（自然科学版）,2019,42(4):786-792.

计算机科学

2020年第6期

浏览历史

内容加载中请稍等...

基于语义感知的中文短文本摘要生成模型被引量：4

参考文献1

共引文献8

同被引文献24

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于语义感知的中文短文本摘要生成模型 被引量：4

参考文献1

共引文献8

同被引文献24

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于语义感知的中文短文本摘要生成模型被引量：4