基于改进多头注意力机制的专利文本摘要生成研究

Generating Patent Text Abstracts Based on Improved Multi-head Attention Mechanism

导出

摘要【目的】解决专利文本摘要生成中专利文本输入结构单一导致的摘要生成单一偏向性问题,以及摘要生成整体上的重复生成、不够简洁流畅、原始信息丢失等问题,提升专利文本摘要生成的质量。【方法】设计基于改进多头注意力机制的专利文本摘要生成模型IMHAM(Improved Multi-Head Attention Mechanism)。首先,针对结构单一问题,在专利的文本逻辑结构基础上设计两种基于余弦相似度的算法,选出最重要的专利文档;其次,设计一种具有多头注意力机制的序列至序列结构模型,更好地学习专利文本的特征表达;同时,在编码器层与解码器层增加自注意力层,修改注意力函数,解决重复生成的问题;最后,加入改进的指针网络结构解决原始信息丢失的问题。【结果】在公开的专利文本数据集上,所提模型相较于MedWriter基线模型,评价指标Rouge-1、Rouge-2、Rouge-L分别高出3.3%、2.4%、5.5%。【局限】所提模型更适用于专利这种有多种结构的文档,对于单一的文档结构无法发挥最重要文档算法的选择效果。【结论】对于类似具有多文档结构的文本,所提模型在摘要生成领域的质量提升具有良好的泛化能力,同时生成的摘要具有较好的流畅性。 [Objective]This paper addresses the problem of single-bias in patent text summarization caused by the single input structure of the patent text in patent texts.It also addresses the issues of repeated generation,the need for conciseness and fluency,and the loss of original information in generating abstracts.[Methods]We designed a patent text abstract generation model based on an improved multi-head attention mechanism(IMHAM).Firstly,we designed two cosine similarity-based algorithms based on the logical structure of the patent text to address the single structure issue and select the most important patent document.Then,we established a sequence-to-sequence model with a multi-head attention mechanism to learn the feature representation of patent text.Meanwhile,we added self-attention layers at the encoder and decoder levels.Next,we modified the attention function to address the problem of repetitive generation.Finally,we added an improved pointer network structure to solve the problem of original information loss.[Results]On the publicly available patent text dataset,the Rouge-1,Rouge-2,and Rouge-L scores of the proposed model were 3.3%,2.4%,and 5.5%higher than the MedWriter baseline model.[Limitations]The proposed model is more applicable for documents with multiple structures and cannot fully utilize the algorithm for selecting the most important ones from single-structured documents.[Conclusions]The proposed model has good generalization ability in improving the quality of summary generation for text with multi-document structures.

作者施国良周抒王云峰施春江刘亮 Shi Guoliang;Zhou Shu;Wang Yunfeng;Shi Chunjiang;Liu Liang(Business School,Hohai University,Nanjing 211100,China;Bank of Jiangsu,Nanjing 210006,China)

机构地区河海大学商学院江苏银行

出处《数据分析与知识发现》 CSCD 北大核心 2023年第6期61-72,共12页 Data Analysis and Knowledge Discovery

基金中央高校基本科研业务费专项资金项目(项目编号:B200207036)的研究成果之一。

关键词专利文本摘要生成多头注意力指针网络 Patent Text Abstract Generation Multi-head Attention Pointer Network

分类号 TP391 [自动化与计算机技术—计算机应用技术] G350 [文化科学—情报学]

引文网络
相关文献

参考文献1

1朱永清,赵鹏,赵菲菲,慕晓冬,白坤,尤轩昂.基于深度学习的生成式文本摘要技术综述[J].计算机工程,2021,47(11):11-21. 被引量：18

二级参考文献2

1胡侠,林晔,王灿,林立.自动文本摘要技术综述[J].情报杂志,2010,29(8):144-147. 被引量：24
2刘家益,邹益民.近70年文本自动摘要研究综述[J].情报科学,2017,35(7):154-161. 被引量：18

共引文献17

1阮宁宁,王宏生.基于指针网络的抽象式文本摘要方法研究[J].长江信息通信,2021,34(10):50-52. 被引量：1
2肖雪,李成城.手写汉字评价方法研究进展[J].计算机工程与应用,2022,58(2):27-42. 被引量：4
3张紫芸,王文发,马乐荣,丁苍峰.文本摘要模型的研究进展[J].计算机与现代化,2022(6):56-66. 被引量：1
4张乐,杜一凡,吕学强,董志安.STNLTP:一种基于集成策略的中文专利摘要生成模型[J].数据分析与知识发现,2022,6(7):107-117. 被引量：1
5李子譞,顾晓娟.浅谈基于语义的图像生成技术在影视气氛图生成中的应用[J].现代电影技术,2022(9):19-25. 被引量：3
6刘金硕,刘宁.面向招标文件的半结构化文本自动生成[J].计算机工程,2023,49(3):67-72. 被引量：1
7李健智,王红玲,王中卿.基于场景与对话结构的摘要生成研究[J].计算机工程,2023,49(4):303-311. 被引量：1
8金独亮,范永胜,张琪.文本摘要评测方法的语义损失度[J].计算机与现代化,2023(3):84-89.
9全安坤,李红莲.面向长文本的抽取式摘要生成方法[J].电脑知识与技术,2023,19(20):8-12.
10高玮军,刘健,毛文静.基于T-HDGN模型的对话摘要生成方法[J].计算机工程,2023,49(10):80-88. 被引量：1

1张文鹏,黎湘,刘永祥.雷达目标微动表征、估计与识别研究[J].中国科学：信息科学,2023,53(8):1469-1489. 被引量：2
2高文萍.汲古创新韵无穷——从紫砂壶《拙柱》之中体味中国传统艺术之美[J].陶瓷科学与艺术,2023,57(6):159-159.
3牟卿志,周荃,宋西宁,孙春萍.基于特征迁移网络的大范围地面场景红外图像快速生成研究[J].智能计算机与应用,2023,13(9):184-188.
4陈鋆纯,季铁,彭坚,王斌.基于风格特征的花瑶挑花图案智能设计路径[J].丝绸,2023,60(9):112-119. 被引量：4
5陈媛,陈红.融合底层信息的电气工程领域神经机器翻译[J].河南科技大学学报（自然科学版）,2023,44(6):42-48. 被引量：1
6许盛亮,郑松.基于CNN-MHA-BiLSTM的云控制系统DDoS攻击检测[J].指挥与控制学报,2023,9(3):355-360. 被引量：3
7余晓霞,汤宝平,王伟影,吴宣勇,李彪.复杂工况条件下多头注意力双向长短时记忆网络的风电机组缺失数据修复方法研究[J].机械工程学报,2023,59(14):1-9. 被引量：2
8文斌,李知聪,朱晗,曹仁轩.MHSACAE-CNN在噪声下的电机轴承故障诊断[J].振动工程学报,2023,36(4):1169-1178.
9孙旭,沈彬,严馨,张金鹏,徐广义.基于Transformer和TextRank的微博观点摘要方法[J].广西师范大学学报（自然科学版）,2023,41(4):96-108.
10童凯,张洪,赵瑞强,周建庭,屈英豪.磁记忆弱漏磁效应的平行钢丝束断丝多维度检测[J].材料科学与工程学报,2023,41(4):628-637.

数据分析与知识发现

2023年第6期

浏览历史

内容加载中请稍等...

基于改进多头注意力机制的专利文本摘要生成研究

参考文献1

二级参考文献2

共引文献17

相关作者

相关机构

相关主题

浏览历史