一种面向新闻文本的生成式中文摘要生成模型被引量：1

A novel generative Chinese summarization model geared towards news text generation

下载PDF

导出

摘要生成技术旨在解决海量中文文本所带来的信息过载和冗余问题,以提高信息传播效率和方便读者获取信息。在序列到序列深度模型基础上,提出了一种引入对比学习的中文摘要生成模型SimCLCTS (Simple Model for Contrastive Learning of Chinese Text Summarization)。SimCLCTS通过在模型中增加以对比损失函数为特征的无监督评估模块,弥补了序列到序列模型中学习目标和评价指标不一致导致的暴露偏差问题。对比实验表明,该模型减少了暴露偏差量,在面向新闻类的中文文本摘要生成中取得了良好效果。 The technology of generating Chinese text summaries aims to address the issues of information overload and redundancy that are brought about by massive amounts of Chinese text,with the objective of enhancing the efficiency of information dissemination and facilitating readers'access to information.This article proposes a Chinese text summarization model,named SimCLCTS(Simple Model for Contrastive Learning of Chinese Text Summarization),which is based on the sequence-to-sequence deep learning model(Seq2Seq).SimCLCTS mitigates the problem of exposure bias caused by inconsistencies between the learning objectives and evaluation metrics of the sequence-to-sequence model by incorporating an unsupervised evaluation module that features a contrastive loss function.Comparative experiments demonstrate that the model significantly reduces exposure bias and achieves excellent results in generating Chinese text summaries for news articles.

作者韩珊珊王升辉万丽莉 HAN Shanshan;WANG Shenhui;WAN Lili(Beijing Jiaotong University,Beijing 100091,China)

机构地区北京交通大学计算机与信息处理学院

出处《中国传媒大学学报（自然科学版）》 2023年第3期24-30,共7页 Journal of Communication University of China：Science and Technology

关键词生成式摘要中文文本序列到序列模型对比学习 abstractive summarization Chinese text sequence-to-sequence model contrastive learnin

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献9

1Minghui LIAO,Boyu SONG,Shangbang LONG,Minghang HE,Cong YAO,Xiang BAI.SynthText3D:synthesizing scene text images from 3D virtual worlds[J].Science China(Information Sciences),2020,63(2):65-78. 被引量：2
2王雪娇,张超敏.基于CNN和LSTM的自然场景文本检测应用[J].仪表技术,2020(9):17-23. 被引量：1
3华春梦,臧艳辉,马伙财.一种基于CRNN的车牌识别算法研究与应用[J].现代信息科技,2021,5(20):78-81. 被引量：5
4林金朝,文盼,庞宇.基于特征金字塔网络的自然场景图像文本检测[J].重庆邮电大学学报（自然科学版）,2022,34(1):155-163. 被引量：3
5齐秀芳,吴陈.不规则场景文本的识别方法[J].软件导刊,2022,21(6):200-204. 被引量：3
6魏永合,宫俊宇.基于CNN-LSTM-Attention的滚动轴承故障诊断[J].沈阳理工大学学报,2022,41(4):73-77. 被引量：9
7张少宇.基于人工智能机器学习的文字识别方法研究[J].电脑编程技巧与维护,2022(9):154-156. 被引量：5
8王文亮,李延祥,张一帆,韩鹏,刘识灏.MPANet-YOLOv5:多路径聚合网络复杂海域目标检测[J].湖南大学学报（自然科学版）,2022,49(10):69-76. 被引量：12
9曾鹏,李曦,赵璐,杜彦辉.基于MobileNet和文本识别匹配的证件图片分类算法[J].中国人民公安大学学报（自然科学版）,2023,29(3):52-58. 被引量：1

引证文献1

1吕艳辉,刘明鑫.面向文本识别的CRNN模型的改进[J].沈阳理工大学学报,2024,43(4):27-31.

1李飞鸽,王芳,黄树成.基于Albert与TextCNN的中文文本分类研究[J].软件导刊,2023,22(4):27-31. 被引量：2
2Fantastic Creatures of the Mountains and Seas[J].China Book International,2023(1):66-77.
3李凡,贾东立,姚昱旻,涂俊.结合残差与自注意力机制的图卷积小样本图像分类网络[J].计算机科学,2023,50(S01):366-370. 被引量：2
4马子晨,张顺香,刘云朵,王星光,张友强.CCM-MF:基于多维度特征融合的中文文本分类模型[J].广西科学,2023,30(1):35-42. 被引量：1
5董革.融媒体时代广播电视技术的发展应用[J].卫星电视与宽带多媒体,2023(12):19-21.
6程忠,黄明辉.基于MobileViT轻量化网络的遥感图像分类方法研究[J].南方农机,2023,54(16):81-83. 被引量：1
7薛凯月.新媒体在煤矿企业宣传思想工作中的应用探析[J].虹,2022(5):192-194.
8李川,王雅琼,严瑛,陈敬良.基于正面信息源影响力最大化的舆情共演模型[J].上海工程技术大学学报,2023,37(1):88-95.
9Samar Elbedwehy,T.Medhat,Taher Hamza,Mohammed F.Alrahmawy.Enhanced Image Captioning Using Features Concatenation and Efficient Pre-Trained Word Embedding[J].Computer Systems Science & Engineering,2023,46(9):3637-3652.
10中国中医药现代远程教育杂志微信公众号开通![J].中国中医药现代远程教育,2023,21(14):93-93.

中国传媒大学学报（自然科学版）

2023年第3期

浏览历史

内容加载中请稍等...

一种面向新闻文本的生成式中文摘要生成模型被引量：1

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种面向新闻文本的生成式中文摘要生成模型 被引量：1

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种面向新闻文本的生成式中文摘要生成模型被引量：1