融合多重注意力机制的卷积神经网络文本分类设计与实现被引量：12

Design and Implementation of Text Classification Based on Convolutional Neural Network with Multiple Attention Mechanisms

下载PDF

导出

摘要针对单一的卷积神经网络文本分类模型忽视词语在上下文的语义变化,未对影响文本分类效果的关键特征赋予更高权值的问题,提出了一种融合多重注意力机制的卷积神经网络文本分类模型.该模型将注意力机制分别嵌入卷积神经网络的卷积层前后,对影响文本分类效果的高维特征和低维特征进行权值的重新分配,优化特征提取过程,实现特征向量的精确分类.在池化层采用平均池化和最大池化相结合的方法,从而减少特征图的尺寸,避免过拟合现象的发生,最后使用softmax函数进行分类.本文在三个不同的中英文数据集上进行实验,同时设计注意力机制重要性对比实验,分析自注意力机制与CNN结合对文本分类效果提升的重要性,结果表明该分类模型有效地提高了分类的准确性. Aiming at the problem that the single convolutional neural network text classification model ignores the semantic changes of words in context and does not assign higher weights to the important features that affect the accuracy of the model,a novel text classification model based on convolutional neural network with multiple attention Mechanism is proposed.In this model,the attention mechanism is embedded into the convolutional layer of the convolutional neural network respectively,and the weight of high-dimensional features and low-dimensional features that affect the text classification effect is redistributed,the feature extraction process is optimized,and the precise classification of feature vectors is realized.In the pooling layer,the method of combining average pooling and maximum pooling was adopted,so as to reduce the size of feature map and avoid the occurrence of overfitting.Finally,softmax function was used for classification.In this paper,experiments were carried out on three different Chinese and English data sets.Meanwhile,comparative experiments on the importance of attention mechanism were designed to analyze the importance of the combination of self-attention mechanism and CNN to the improvement of text classification effect.The results show that this classification model can effectively improve the accuracy of classification.

作者闫跃霍其润李天昊毛煜 YAN Yue;HUO Qi-run;LI Tian-hao;MAO Yu(College of Information Engineering,Capital Normal University,Beijing 100048,China;School of Computer Science and Technology,Beijing Institute of Technology,Beijing 100081,China)

机构地区首都师范大学信息工程学院北京理工大学计算机学院

出处《小型微型计算机系统》 CSCD 北大核心 2021年第2期362-367,共6页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(62077002)资助北京市教委科研计划项目(KM201810028016)资助首都师范大学交叉科学研究院资助.

关键词自注意力机制卷积神经网络特征提取文本分类 self-attention mechanism convolutional neural network feature extraction text classification

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1邵清,马慧萍.融合self-attention机制的卷积神经网络文本分类模型[J].小型微型计算机系统,2019,40(6):1137-1141. 被引量：20
2王盛,樊兴华,陈现麟.利用上下位关系的中文短文本分类[J].计算机应用,2010,30(3):603-606. 被引量：38
3石磊,张鑫倩,陶永才,卫琳.结合自注意力机制和Tree-LSTM的情感分析模型[J].小型微型计算机系统,2019,40(7):1486-1490. 被引量：20
4蓝雯飞,徐蔚,王涛.基于卷积神经网络的中文新闻文本分类[J].中南民族大学学报（自然科学版）,2018,37(1):138-143. 被引量：11
5朱烨,陈世平.融合卷积神经网络和注意力的评论文本情感分析[J].小型微型计算机系统,2020,41(3):551-557. 被引量：13
6宁亚辉,樊兴华,吴渝.基于领域词语本体的短文本分类[J].计算机科学,2009,36(3):142-145. 被引量：41
7陈磊,李俊.基于词向量的文本特征选择方法研究[J].小型微型计算机系统,2018,39(5):991-994. 被引量：27

二级参考文献34

1王细薇,樊兴华,赵军.一种基于特征扩展的中文短文本分类方法[J].计算机应用,2009,29(3):843-845. 被引量：36
2樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. 被引量：70
3刘磊,曹存根,王海涛,陈威.一种基于“是一个”模式的下位概念获取方法[J].计算机科学,2006,33(9):146-151. 被引量：18
4李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量：105
5SebastianiI F. Machine Learning in Automated Text Categorization Consiglio Nazionale delle Rieerche[J]. Italy. ACM Computing Surveys,2002,34(1) : 1-47
6Zelikovitz S,Transductive M F. Learning for Short-Text Classification Problem using Latent Semantic Indexing International [J]. Journal of Pattern Recognition and Artificial Intelligence, 2005,19(2) : 143-163
7Pu Qiang, Yang Guo Wei. Short-Text Classification Based on ICA and LSA[J]//Proceedings of International Symposium on Neural Networks, 2006 (ISNN 2) : 265-270
8马后锋樊兴华.一种改进的增量贝叶斯分类算法[J].仪器仪表学报,2007,28(8Ⅲ):312-316.
9Chen Enhong,Wu Gaofeng. An Ontology Learning Method Enhanced by Frame Semantics [J]//Proceedings of the Seventh IEEE International Symposium on Multimedia. 2005:374-382
10郑德权,赵铁军,李生,等.基于内容的词义本体知识自动获取[A]∥全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C].2005.

共引文献147

1张苑,祝小兰,杨东晓.基于深度学习的疫情情感分析[J].智能计算机与应用,2022,12(3):40-45. 被引量：1
2伍洋,钟鸣,姜艳,李石君.面向审计领域的短文本分类技术研究[J].微电子学与计算机,2015,32(1):5-10. 被引量：7
3蔡月红,朱倩,孙萍,程显毅.基于属性选择的半监督短文本分类算法[J].计算机应用,2010,30(4):1015-1018. 被引量：8
4林小俊,张猛,暴筱,李军,吴玺宏.基于概念网络的短文本分类方法[J].计算机工程,2010,36(21):4-6. 被引量：9
5丁军平,蔡皖东.面向元信息分类的支持向量机改进技术[J].西安交通大学学报,2011,45(8):37-42. 被引量：1
6范云杰,刘怀亮.基于维基百科的中文短文本分类研究[J].现代图书情报技术,2012(3):47-52. 被引量：34
7王利,唐宗山,黄宗干.血栓性血小板减少性紫癜1例[J].重庆医科大学学报,2000,25(2):214-214.
8张素智,刘婧姣.基于语义的KNN短文本分类算法研究[J].郑州轻工业学院学报（自然科学版）,2012,27(6):1-4. 被引量：4
9张倩,刘怀亮.一种基于半监督学习的短文本分类方法[J].现代图书情报技术,2013(2):30-35. 被引量：6
10赵辉,刘怀亮.一种基于维基百科的中文短文本分类算法[J].图书情报工作,2013,57(11):120-124. 被引量：16

同被引文献83

1蒋浩泉,张儒清,郭嘉丰,范意兴,程学旗.图卷积网络与自注意机制在文本分类任务上的对比分析[J].中文信息学报,2021,35(12):84-93. 被引量：4
2邓擘,樊孝忠,杨立公.用语义模式提取实体关系的方法[J].计算机工程,2007,33(10):212-214. 被引量：23
3刘克彬,李芳,刘磊,韩颖.基于核函数中文关系自动抽取系统的实现[J].计算机研究与发展,2007,44(8):1406-1411. 被引量：58
4徐健,张智雄,吴振新.实体关系抽取的技术方法综述[J].现代图书情报技术,2008(8):18-23. 被引量：54
5温春,石昭祥,辛元.基于扩展关联规则的中文非分类关系抽取[J].计算机工程,2009,35(24):63-65. 被引量：14
6曾子明,万品玉.融合演化特征的公共安全事件微博情感分析[J].情报科学,2018,36(12):3-8. 被引量：18
7甘丽新,万常选,刘德喜,钟青,江腾蛟.基于句法语义特征的中文实体关系抽取[J].计算机研究与发展,2016,53(2):284-302. 被引量：74
8贾真,冶忠林,尹红风,何大可.基于Tri-training与噪声过滤的弱监督关系抽取[J].中文信息学报,2016,30(4):142-149. 被引量：2
9邹杰,孙宝林,於俊.基于笔画特征的在线笔迹匹配算法[J].自动化学报,2016,42(11):1744-1757. 被引量：5
10吴胜,刘茂福,胡慧君,张志清,顾进广.中文文本中实体数值型关系无监督抽取方法[J].武汉大学学报（理学版）,2016,62(6):552-560. 被引量：6

引证文献12

1杜雪涛.大数据认知计算在内容安全管控中的应用[J].大数据,2021,7(6):53-66.
2周末,宋玉蓉,宋波,苏晓萍.融合自注意力机制的D-BGRU文本分类模型[J].微电子学与计算机,2021,38(12):8-16. 被引量：4
3赵鹏武,李志义,林小琦.基于注意力机制和卷积神经网络的中文人物关系抽取与识别[J].数据分析与知识发现,2022,6(8):41-51. 被引量：6
4谢玉惠,肖桂荣.融合注意力机制的多通道CNNs-BiLSTM情感极性分析方法[J].小型微型计算机系统,2023,44(6):1140-1145.
5孟金旭,单鸿涛,黄润才,闫丰亭,李志伟,郑光远,刘一鸣,石昌通.基于XLNet的双通道特征融合文本分类模型[J].山东大学学报（理学版）,2023,58(5):36-45.
6王乐乐,栾方军,师金钢,袁帅.基于DTW的注意力机制BLSTM在线手写签名认证[J].小型微型计算机系统,2023,44(7):1529-1534. 被引量：1
7储天启,陈秀明,王先传,徐伟.融合LSTM-Attention和CNN模型的文本分类方法[J].安庆师范大学学报（自然科学版）,2023,29(3):89-94. 被引量：1
8刘成星,张超群,代林林,张龙昊.TFLS-BiGRU-ATT:一种简单有效的中文短文本关系抽取模型[J].中文信息学报,2023,37(6):115-127.
9周俊杰,许鸿奎,卢江坤,张子枫,李振业,郭文涛.引入位置信息和Attention机制的诈骗电话文本分类[J].小型微型计算机系统,2023,44(11):2502-2509. 被引量：2
10从莉萍,沈剑文,王海生.基于协同过滤的医院图书馆数据库文本分类优化技术[J].微型电脑应用,2024,40(2):146-148.

二级引证文献14

1覃光明.应用ResGCNN的文本情感分析[J].福建电脑,2022,38(2):20-24.
2李超凡,马凯.基于多通道注意力机制的文本分类模型[J].微电子学与计算机,2022,39(4):33-40. 被引量：3
3李婧宇,汪荣贵,杨娟,薛丽霞,董博文.基于特征关系依赖网络的小样本学习方法[J].微电子学与计算机,2022,39(9):11-19. 被引量：1
4郑兰琴,范云超,牛佳玉.基于在线协作学习交互文本的跨领域知识图谱构建技术[J].电化教育研究,2022,43(12):70-77. 被引量：1
5周剑,谢知音.基于注意力机制的改进残差网络的柑橘分类研究[J].现代农业装备,2023,44(1):47-55. 被引量：2
6邱芹军,马凯,谢忠,陶留锋,黄波.基于注意力机制的孪生网络地质调查空间实体与文本信息匹配[J].高校地质学报,2023,29(3):337-344. 被引量：1
7李广建,袁钺.基于深度学习的科技文献知识单元抽取研究综述[J].数据分析与知识发现,2023,7(7):1-17. 被引量：8
8刘成星,张超群,代林林,张龙昊.TFLS-BiGRU-ATT:一种简单有效的中文短文本关系抽取模型[J].中文信息学报,2023,37(6):115-127.
9谭继勇,罗俊,谢江涛,秦玉玺,汪友明.基于鲸鱼优化和批量规范化卷积神经网络的振动信号去噪[J].机械与电子,2024,42(4):3-8.
10曹茂俊,胡喆.基于卷积神经网络的医疗护理实体关系抽取[J].电子设计工程,2024,32(8):18-22.

1何力,郑灶贤,项凤涛,吴建宅,谭林.基于深度学习的文本分类技术研究进展[J].计算机工程,2021,47(2):1-11. 被引量：40
2张建勋,韩明慧,代煜.面向低分辨率单目内窥镜图像的三维多孔结构重建[J].光学精密工程,2020,28(9):2085-2095. 被引量：11
3夏渊,刘东峰,张津馗,李科.基于BERT的自动化偏倚风险评价方法的研究[J].中国循证医学杂志,2021,21(2):204-209. 被引量：1
4章佳文.汉语“X在路上”结构的认知隐喻分析[J].伊犁师范学院学报（社会科学版）,2020,38(3):55-59. 被引量：1
5徐静.流行语“宝藏XX”语义泛化及流行研究[J].开封文化艺术职业学院学报,2021,41(1):82-83.
6陈红燕.当代语境中“极致”的性质、语义及其演化动因[J].海外华文教育,2020(4):112-124.

小型微型计算机系统

2021年第2期

浏览历史

内容加载中请稍等...

融合多重注意力机制的卷积神经网络文本分类设计与实现被引量：12

参考文献7

二级参考文献34

共引文献147

同被引文献83

引证文献12

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

融合多重注意力机制的卷积神经网络文本分类设计与实现 被引量：12

参考文献7

二级参考文献34

共引文献147

同被引文献83

引证文献12

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

融合多重注意力机制的卷积神经网络文本分类设计与实现被引量：12