基于强化正则的小样本自动摘要方法

Automatic Summarization of Small Samples Based on Enhanced Regularization

下载PDF

导出

摘要文本自动摘要旨在从文本信息中提取主要语句以压缩信息。现有生成式自动摘要方法无法充分利用预训练模型对原文语义进行学习,导致生成内容易丢失重要信息,当面对样本数量较少的数据集时容易发生过拟合。为了解决此类问题并获得更好的微调性能,文中使用预训练模型mT5(multilingual T5)作为基线,通过结合R-drop(Regularized dropout)对模型微调进行强化正则来提高模型学习能力,同时利用Sparse softmax减少预测生成的模糊性来确保输出准确度。模型在中文数据集LCSTS和CSL上通过计算BLEU(Bilingual Evaluation Understudy)进行优化方法超参数测试,并采用Rouge作为评测指标分别对数据集进行了不同数量级的评测。实验结果表明,经过优化的预训练模型能够更好地学习原文语义表征,在小样本情况下模型能够保持较好的拟合效果,并且能够生成实用性较高的结果。 Automatic text summarization aims to extract the main statements from text information for the purpose of compressing information.Existing generative automatic summarization methods do not take full advantage of the pre-trained model to learn the semantics of the original text,resulting in the loss of important information in the generated content,when the data set with a small number of samples is often prone to overfitting.In order to solve such problems and obtain better fine-tuning performance,the pre-trained model mT5(multilingual T5)is used as a baseline to improve the learning ability of the model by combining R-drop(Regularized dropout)with reinforced regularity for model fine-tuning,and Sparse softmax is used to reduce the ambiguity of prediction generation to ensure the accuracy of the output.The model calculates BLEU(Bilingual Evaluation Understudy)for hyperparameter test on Chinese data sets LCSTS and CSL,and uses Rouge as evaluation index to evaluate data sets of different orders of magnitude.The experimental results show that the optimized pre-trained model can better learn the semantic representation of the original text,and the model can maintain a good fit in the small samples and generate more practical results.

作者李清万卫兵 LI Qing;WAN Weibing(School of Electronic and Electrical Engineering,Shanghai University of Engineering Science,Shanghai 201620,China)

机构地区上海工程技术大学电子电气工程学院

出处《电子科技》 2024年第7期16-24,共9页 Electronic Science and Technology

基金科技创新2030“新一代人工智能”重大项目(2020AAA0109300)。

关键词文本自动摘要文本生成预训练模型小样本数据强化正则稀疏化输出语义表征学习 mT5 automatic text summarization text generation pre-trained model small sample data reinforced regularity sparse output semantic representation learning mT5

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1孙宝山,谭浩.基于ALBERT-UniLM模型的文本自动摘要技术研究[J].计算机工程与应用,2022,58(15):184-190. 被引量：5
2李大舟,于沛,高巍,马辉.基于编解码器结构的中文文本摘要[J].计算机工程与设计,2021,42(3):696-702. 被引量：10
3张紫芸,王文发,马乐荣,丁苍峰.预训练文本摘要研究综述[J].延安大学学报（自然科学版）,2022,41(1):98-104. 被引量：3
4朱永清,赵鹏,赵菲菲,慕晓冬,白坤,尤轩昂.基于深度学习的生成式文本摘要技术综述[J].计算机工程,2021,47(11):11-21. 被引量：18
5姜梦函,李邵梅,郑洪浩,张建朋.基于改进位置编码的谣言检测模型[J].计算机科学,2022,49(8):330-335. 被引量：2
6卢佳伟,陈玮,尹钟.融合TextRank算法的中文短文本相似度计算[J].电子科技,2020,33(10):51-56. 被引量：5
7张仕森,孙宪坤,尹玲,李世玺.基于神经网络的文本标题生成原型系统设计[J].电子科技,2021,34(5):35-41. 被引量：3
8高巍,马辉,李大舟,于沛.基于双编码器的中文文本摘要技术的研究与实现[J].计算机工程与设计,2021,42(9):2687-2695. 被引量：6

二级参考文献23

1胡侠,林晔,王灿,林立.自动文本摘要技术综述[J].情报杂志,2010,29(8):144-147. 被引量：24
2曾浩,尚维来.Python界面程序开发应用技术[J].科教文汇,2010(30):87-89. 被引量：11
3彭敏,高斌龙,黄济民,刘纪平.基于高质量信息提取的微博自动摘要[J].计算机工程,2015,41(7):36-42. 被引量：7
4刘知远,张乐,涂存超,孙茂松.中文社交媒体谣言统计语义分析[J].中国科学：信息科学,2015,45(12):1536-1546. 被引量：45
5廖志芳,周国恩,李俊锋,刘飞,蔡飞.中文短文本语法语义相似度算法[J].湖南大学学报（自然科学版）,2016,43(2):135-140. 被引量：14
6方欣欣,龚如宾,李大为.基于余弦距离的多目标粒子群优化算法[J].电子科技,2016,29(3):48-52. 被引量：4
7王贵新,郑孝宗,张浩然,张小川.基于Word2vec的短信向量化算法[J].电子科技,2016,29(4):49-52. 被引量：4
8周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1736
9刘家益,邹益民.近70年文本自动摘要研究综述[J].情报科学,2017,35(7):154-161. 被引量：18
10谷重阳,徐浩煜,周晗,张俊杰.基于词汇语义信息的文本相似度计算[J].计算机应用研究,2018,35(2):391-395. 被引量：30

共引文献41

1阮宁宁,王宏生.基于指针网络的抽象式文本摘要方法研究[J].长江信息通信,2021,34(10):50-52. 被引量：1
2肖雪,李成城.手写汉字评价方法研究进展[J].计算机工程与应用,2022,58(2):27-42. 被引量：4
3王帅,纪雪梅.基于在线健康社区用户画像的情感表达特征研究[J].情报理论与实践,2022,45(6):179-187. 被引量：12
4张紫芸,王文发,马乐荣,丁苍峰.文本摘要模型的研究进展[J].计算机与现代化,2022(6):56-66. 被引量：1
5杨润霞,邵洁,罗岩,白万荣.基于编解码器的电力施工场景可控图像字幕生成[J].电网技术,2022,46(7):2572-2580. 被引量：2
6张乐,杜一凡,吕学强,董志安.STNLTP:一种基于集成策略的中文专利摘要生成模型[J].数据分析与知识发现,2022,6(7):107-117. 被引量：1
7田泽佳,门豪,卓奕炜,刘宇.基于前向注意力机制的长句子语音合成方法[J].电子设计工程,2022,30(18):86-90. 被引量：3
8李子譞,顾晓娟.浅谈基于语义的图像生成技术在影视气氛图生成中的应用[J].现代电影技术,2022(9):19-25. 被引量：3
9刘宇枝,陈博,赵鑫,李翠荣.基于TextRank的医院信息智能处理方法研究[J].粘接,2022(9):178-182. 被引量：2
10岳琳,杨风暴,王肖霞.基于HRAGS模型的混合式摘要生成方法[J].电子测量技术,2022,45(15):75-83.

1温嘉宝,杨敏.面向中文法律裁判文书的抽取式摘要算法[J].集成技术,2024,13(1):62-71.
2刘志敏,张琨,朱浩华.基于Transformer模型的文本自动摘要生成[J].计算机与数字工程,2024,52(2):482-486.
3金善女.准确性原则下的政治文献朝韩译本对比研究——以《党的二十大报告》为例[J].民族翻译,2024(1):35-40.
4刘兵,李穗,刘明明,刘浩.基于全局与序列混合变分Transformer的多样化图像描述生成方法[J].电子学报,2024,52(4):1305-1314.
5宋晶晶,张会民.食管癌术后吻合口瘘感染的临床特征、病原菌分布特点与其耐药性分析[J].罕少疾病杂志,2024,31(6):56-58.
6新书[J].China's Tibet,2024,35(2):71-71.
7袁华.《双语语言加工研究》述评[J].当代外语研究,2024(2):184-190.
8Kazim Jawad,Muhammad Ahmad,Majdah Alvi,Muhammad Bux Alvi.RUSAS: Roman Urdu Sentiment Analysis System[J].Computers, Materials & Continua,2024,79(4):1463-1480.
9余裕森,崔立雪,张利波,王云帆.机械力化学浸出法从氧化锌矿中高效浸出锌[J].Transactions of Nonferrous Metals Society of China,2024,34(6):1976-1993.

电子科技

2024年第7期

浏览历史

内容加载中请稍等...

基于强化正则的小样本自动摘要方法

参考文献8

二级参考文献23

共引文献41

相关作者

相关机构

相关主题

浏览历史