一种结合压缩激发块和CNN的文本分类模型被引量：4

Text Classification Model with Squeeze-and-excitation Block and CNN

下载PDF

导出

摘要针对单一卷积神经网络进行文本分类,容易出现忽视局部与整体之间关联性的问题,本文构建了一种基于压缩激发块的卷积神经网络文本分类模型,提高文本分类的精确度.主要工作分为三部分:1)使用字符级词向量作为卷积神经网络的输入;2)引入压缩-激发块学习使用全局信息,有选择地强调有用的特征,来增加提取特征的多样性,弥补单一卷积神经网络多样性的不足;3)使用多头注意力机制进行权重更新计算,突出类别向量的重要程度.实验结果显示,本文提出的文本分类模型,在THUCNews数据集和搜狐数据集上,比单一的字符级卷积神经网络模型精确度分别提高了2.29%、4.75%. Aiming at the problem of ignoring the relevance between the part and the whole when text classification is carried out by single convolutional neural network,this paper constructs a text classification model of convolutional neural network based on extruded excitation blocks to improve the accuracy of text classification.The main work is divided into three parts:1)To use char-level word vector as the input of convolutional neural network;2)Introduce Squeeze-and-Excitation block to learn to use global information,the useful features are selectively emphasized to increase the diversity of feature extraction and make up for the lack of diversity of single convolutional neural network;3)To use Multi-Head Attention mechanism weight updating calculation,highlight the importance of class vector.The experimental results shows that the text classification model proposed in this paper improves the precision of the THUCNews data set and sohu data set by 2.29%and 4.75%,respectively,compared with the single character-level convolutional neural network model.

作者陶永才刘亚培马建红李琳娜石磊卫琳 TAO Yong-cai;LIU Ya-pei;MA Jian-hong;LI Lin-na;SHI Lei;WEI Lin(School of Information Engineering,Zhengzhou University,Zhengzhou 450001,China;School of Software,Zhengzhou University,Zhengzhou 450002,China;Institute of Scientific and Technical Information of China,Beijing 100038,China)

机构地区郑州大学信息工程学院郑州大学软件学院中国科学技术信息研究所

出处《小型微型计算机系统》 CSCD 北大核心 2020年第9期1925-1929,共5页 Journal of Chinese Computer Systems

基金科技部重点研发计划项目(2018YFB1701400)资助郑州大学青年骨干教师培养计划项目(2017ZDGGJS048)资助。

关键词字符级压缩—激发块多头注意力机制文本分类 character level squeeze-and-excitation block multi-head attention text classification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1刘月,翟东海,任庆宁.基于注意力CNLSTM模型的新闻文本分类[J].计算机工程,2019,45(7):303-308. 被引量：20
2赵亚南,刘渊,宋设.融合多头自注意力机制的金融新闻极性分析[J].计算机工程,2020,46(8):85-92. 被引量：7
3周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1720
4郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015,42(5):28-33. 被引量：201

二级参考文献76

1翟林,刘亚军.支持向量机的中文文本分类研究[J].计算机与数字工程,2005,33(3):21-23. 被引量：14
2李荣艳,金鑫,王春辉,郑宁,别荣芳.一种新的中文文本分类算法[J].北京师范大学学报（自然科学版）,2006,42(5):501-505. 被引量：6
3史忠值.神经网络[M].北京:高等教育出版社,2009.
4李彦宏.2012百度年会主题报告:相信技术的力量[R].北京:百度,2013.
5Rumelhart D,Hinton G,Williams R.Learning representationsby back-propagating errors[J].Nature,1986,323(6088):533-536.
6Hinton G,Salakhutdinov R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
7Ding Shi-fei,Zhang Yan-an,Chen Jin-rong,et al.Research onUsing Genetic Algorithms to Optimize Elman Neural Networks[J].Neural Computing and Applications,2013,23(2):293-297.
8Ding Shi-fei,Jia Wei-kuan,Su Chun-yang,et al.Research ofNeural Network Algorithm Based on Factor Analysis and Cluster Analysis[J].Neural Computing and Applications,2011,20(2):297-302.
9Lee T S,Mumford D.Hierarchical Bayesian inference in the vi-sual cortex[J].Optical Society of America,2003,20(7):1434-1448.
10Serre T,Wolf L,Bileschi S,et al.Robust object recognition with cortex-like mechanisms[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2007,29(3):411-426.

共引文献1931

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104. 被引量：1

同被引文献26

1李宁,田英爱,侯霞,梁琦.办公文档与固定版式文档格式关系探讨[J].电子学报,2008,36(B12):128-132. 被引量：12
2段良涛,郭曙超.中文文本校对技术研究[J].电脑知识与技术,2014,0(7):4602-4604. 被引量：4
3李小遐.Office自动化技术在办公中的应用[J].无线互联科技,2015,12(2):94-96. 被引量：1
4李涛,王次臣,李华康.知识图谱的发展与构建[J].南京理工大学学报,2017,41(1):22-34. 被引量：141
5张槐权.基于VBA技术对Word文档的公文格式审核[J].电脑知识与技术,2017,13(9):209-210. 被引量：4
6秦永彬,孙玉洁,魏笑.基于文本聚类与兴趣衰减的微博用户兴趣挖掘方法[J].计算机应用研究,2019,36(5):1469-1473. 被引量：15
7李顺勇,张苗苗,曹付元.基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法[J].计算机研究与发展,2019,56(6):1325-1337. 被引量：10
8胡婧,刘伟,马凯.基于机器学习的高血压病历文本分类[J].科学技术与工程,2019,19(33):296-301. 被引量：9
9张旭,孙玉伟,成颖.不同特征对文本聚类效果的比较研究——以新闻文本为例[J].情报理论与实践,2020,43(1):169-176. 被引量：8
10龚永罡,吴萌,廉小亲,裴晨晨.基于Seq2Seq与Bi-LSTM的中文文本自动校对模型[J].电子技术应用,2020,46(3):42-46. 被引量：16

引证文献4

1黄卫春,陶自强,熊李艳.密集池化连接和短语注意力下的文本分类算法[J].科学技术与工程,2021,21(17):7193-7199. 被引量：1
2龙坡,陈浩,何晶,何堃.基于深度学习的心律模拟算法及其应用[J].计算机应用研究,2022,39(4):1162-1167. 被引量：2
3龚芝,马凌,刘敏,何先波.融合知识图谱的文本聚类方法研究[J].南京理工大学学报,2022,46(2):170-176. 被引量：2
4杨辉,张静静,熊涛,蔡红维,刘皓挺,才金山,杜晓平,高美萍.基于深度学习的文本自动纠错系统设计与实现[J].计算机测量与控制,2023,31(2):210-216.

二级引证文献5

1徐原,王少娜.基于深度学习的呼吸机体征异常报警研究[J].自动化与仪器仪表,2022(10):286-291. 被引量：2
2张玮,郑雅莲,刘志武,刘攀,李梦杰.物理机制引导的水库调度深度学习模型研究[J].水力发电学报,2023,42(3):13-25. 被引量：2
3袁雄军,赵薇,时静洁,王悦,陈常豪.基于定量结构-活性关系预测苯及其衍生物的立即威胁生命或健康的浓度[J].环境与职业医学,2023,40(9):1033-1038.
4王雨萱,万卫兵,程锋.工业生产设备故障领域问答系统的意图识别[J].科学技术与工程,2024,24(18):7746-7759.
5刘昊.图谱聚类的等价模型研究[J].应用数学进展,2023,12(3):1273-1280.

1王玲.基于Word2Vec词嵌入和双向长短时记忆网络的文本分类实现[J].电子技术与软件工程,2020(15):70-71. 被引量：3
2王吉伟.互联网历史进程二十年,数字化造就时代趋势[J].大数据时代,2020(9):66-76.
3方炯焜,陈平华,廖文雄.结合GloVe和GRU的文本分类模型[J].计算机工程与应用,2020,56(20):98-103. 被引量：26
4陆立华,杜承烈.复杂式网络用户隐私数据多层分类存储仿真[J].计算机仿真,2020,37(3):405-408. 被引量：5
5李泽兰,曹一家,彭寒梅,孟凡东.基于流形理论与L1+L2约束的智能电网故障定位[J].电力系统保护与控制,2020,48(18):48-58. 被引量：4
6訾壮壮,何涛,赵停.基于稀疏表示的不平衡数据集过采样算法[J].计算机应用与软件,2020,37(10):290-294. 被引量：3

小型微型计算机系统

2020年第9期

浏览历史

内容加载中请稍等...

一种结合压缩激发块和CNN的文本分类模型被引量：4

参考文献4

二级参考文献76

共引文献1931

同被引文献26

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种结合压缩激发块和CNN的文本分类模型 被引量：4

参考文献4

二级参考文献76

共引文献1931

同被引文献26

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种结合压缩激发块和CNN的文本分类模型被引量：4