基于循环结构的卷积神经网络文本分类方法被引量：14

Text classification method based on the cycle structured convolutional neural network

下载PDF

导出

摘要现有卷积神经网络在文本分类性能上受到词向量窗口长度的影响,在研究卷积神经网络分类方法的基础上,提出一种基于循环结构的神经网络文本分类方法,该方法对文本进行单次正向及反向扫描,能够在学习单词表示时尽可能地捕获上下文信息,整体算法时间复杂度为O(n),是线性复杂度;该方法构建文本语义模型可以捕获长距离的依赖关系,使得词向量窗口长度对文本分类性能没有影响,对上下文更有效地建模。实验结果表明,该方法构建文本语义模型的准确率达到96.86%,召回率达到96.15%,F1值达到96.5%,性能优于传统文本分类算法和卷积神经网络方法。 The existing convolutional neural network is influenced by the length of the word vector window in the text classification performance.On the basis of studying the convolutional neural network classification method,a text classification method based on the cycle structured convolutional neural network is proposed in this paper.The method only needs a single forward and reverse scan of the text to get as much as possible context representation.In this paper,the time complexity of the whole algorithm is O(n),which is linear complexity.In addition,the method can capture the long distance dependency by constructing the text semantic model.The word vector window length has no effect on the text classification performance,which can get more efficient modeling of the context.The experimental results show that the accuracy rate of the text model is 96.86%,the recall rate is 96.15%,the F1 value is 96.5%,and the performance is superior to the traditional text classification algorithm and the convolution neural network method.

作者陈波 CHEN Bo(School of Mathematics and Computer Science,Shaanxi University of Technology,Hanzhong 723001,P.R.China)

机构地区陕西理工大学数学与计算机科学学院

出处《重庆邮电大学学报（自然科学版）》 CSCD 北大核心 2018年第5期705-710,共6页 Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition)

基金国家自然科学基金(61471133)~~

关键词卷积神经网络循环结构文本语义模型文本分类 convolutional neural network cycle structure text semantic model text classification

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1赖娟,金澎,洪艳伟.文本分类中的主动多域学习[J].西南师范大学学报（自然科学版）,2014,39(7):108-114. 被引量：3
2阳馨,蒋伟,刘晓玲.基于多种特征池化的中文文本分类算法[J].四川大学学报（自然科学版）,2017,54(2):287-292. 被引量：11
3王进,金理雄,孙开伟.基于演化超网络的中文文本分类方法[J].江苏大学学报（自然科学版）,2013,34(2):196-201. 被引量：13
4黄育,张鸿.基于潜语义主题加强的跨媒体检索算法[J].计算机应用,2017,37(4):1061-1064. 被引量：11
5肖业鸣,张晴晴,宋黎明,潘接林,颜永红.深度神经网络技术在汉语语音识别声学建模中的优化策略[J].重庆邮电大学学报（自然科学版）,2014,26(3):373-379. 被引量：5
6巴志超,杨子江,朱世伟,王蕾.基于关键词语义网络的领域主题演化分析方法研究[J].情报理论与实践,2016,39(3):67-72. 被引量：31
7李华,屈丹,张文林,王炳锡,梁玉龙.结合全局词向量特征的循环神经网络语言模型[J].信号处理,2016,32(6):715-723. 被引量：10
8潘炯光,韦余永.一种基于领域语义相关性挖掘的迁移学习方法[J].西南师范大学学报（自然科学版）,2016,41(5):184-189. 被引量：1
9陈翠平.基于深度信念网络的文本分类算法[J].计算机系统应用,2015,24(2):121-126. 被引量：42

二级参考文献103

1叶菲,罗景青,俞志富.一种改进的并行处理SVM学习算法[J].微电子学与计算机,2009,26(2):40-43. 被引量：6
2黄果,周竹荣,周亭.基于语义网的信息检索研究[J].西南大学学报（自然科学版）,2007,29(1):77-80. 被引量：12
3陈世立,高野军.基于神经网络与贝叶斯的混合文本分类研究[J].情报杂志,2007,26(5):34-36. 被引量：3
4Kulesza T, Stumpf S, Wong W K, et al. Why-oriented end-user debugging of naive bayes text classification [J]. ACM Transactions on Interactive Intelligent Sys- tems, 2011, 1 ( 1 ) ,doi : 10.1145/2030365. 2030367.
5Hao Xiulan, Tao Xiaopeng, Zhang Chenghong, et al. An effective method to improve KNN text classifier [ C ] //Proceedings of the 8th ACIS International Conference on Software Engineering, Artficial Intelligence, Networ- king and Parallel/Distributed Computing. Quebec: IEEE Computer Society ,2007 : 379 -384.
6Wang T Y, Chiang H M. One-against-one fuzzy support vector machine classifier: an approach to text categoriza- tion [ J ]. Expert Systems with Applications, 2009, 36 (6) : 10030 - 10034.
7Mann G, McDonald R, Mohri M. Efficient large-scale distributed training of conditional maximum entropy models[ C] //Proceedings of Advances in Neural Infor- mation Processing Systems 22. Vancouver: Curran Asso- ciates, Inc. 2009 : 1231 - 1239.
8Thurber K J, Wald L D. Associative and parallel pro- cessors [J]. Computing Survey, 1975, 7(4): 215- 255.
9Lira H W, Lee S H, Yang K A, et al. In vitro molecu- lar pattern classification via DNA-based weighted-sum operation [J]. BioSystems, 2010, 100(1) :1 -7.
10Zhang B T. Hypernetworks: a molecular evolutionary architecture for cognitive learning and memory [ J ]. IEEE Computational Intelligence Magazine, 2008, 3 (3) : 49 -63.

共引文献116

1席崇俊,刘文斌,丁楷.词共现频次变化视角下的动态主题识别研究[J].知识管理论坛,2022(2):197-208. 被引量：1
2黄子涵.差异·根源·思路——图书情报档案三界“一体化”语境下的态度、重点差异分析[J].办公自动化,2020(15):54-57. 被引量：1
3石国庆,刘守仁,杨永林,倪健宏,皮文辉,王志杰.毛质优秀的美利奴“U”系羊新类群[J].中国草食动物,2000,2(1):24-25.
4王进,丁凌,孙开伟,李钟浩.演化超网络在多类型癌症分子分型中的应用[J].电子与信息学报,2013,35(10):2425-2431. 被引量：5
5秦胜君,卢志平.稀疏自动编码器在文本分类中的应用研究[J].科学技术与工程,2013,21(31):9422-9426. 被引量：17
6王进,黄萍丽,孙开伟,蔡通.基于演化学习超网络的微阵列数据分类[J].江苏大学学报（自然科学版）,2014,35(1):56-62. 被引量：5
7方一新.改进BP神经网络的EMG手指运动识别[J].激光杂志,2014,35(9):92-95. 被引量：6
8卢玲,杨武,刘恒洋.差错网络的文本分类反馈校正方法[J].重庆邮电大学学报（自然科学版）,2014,26(6):790-795. 被引量：1
9高强,阳武,李倩.基于稀疏差异深度信念网络的绝缘子故障识别算法[J].电测与仪表,2016,53(1):19-25. 被引量：11
10高俊平,张晖,赵旭剑,杨春明,李波.基于特征词的Web领域知识分类研究[J].软件导刊,2016,15(2):9-11.

同被引文献94

1陶志勇,李小兵,刘影,刘晓芳.基于双向长短时记忆网络的改进注意力短文本分类方法[J].数据分析与知识发现,2019,3(12):21-29. 被引量：23
2熊漩,严佩敏.融合多头自注意力机制的中文分类方法[J].电子测量技术,2020(10):125-130. 被引量：7
3李石华,王金亮,毕艳,陈姚,朱妙园,杨帅,朱佳.遥感图像分类方法研究综述[J].国土资源遥感,2005,17(2):1-6. 被引量：96
4罗军,潘瑜春,王纪华,陆洲,曹荣龙,阎广建.基于高分辨率遥感影像的设施农业资源信息采集技术研究[J].地理与地理信息科学,2007,23(3):51-54. 被引量：11
5郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明.基于层叠条件随机场的旅游领域命名实体识别[J].中文信息学报,2009,23(5):47-52. 被引量：36
6陈齐根.基于切尔诺夫界的泊松试验和的尾部概率估计及其应用[J].重庆科技学院学报（自然科学版）,2013,15(4):156-159. 被引量：1
7曾如珠.遥感图像分类识别的探讨[J].泉州师范学院学报,2000,18(4):36-39. 被引量：6
8朱晋,怀丽波,崔荣一,尹慧.基于小波分析的特征提取文本分类方法研究[J].中文信息学报,2018,32(11):49-54. 被引量：8
9尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,41(1):48-59. 被引量：373
10张建明,詹智财,成科扬,詹永照.深度学习的研究与发展[J].江苏大学学报（自然科学版）,2015,36(2):191-200. 被引量：61

引证文献14

1刘云,黄荣乘.最大判别特征选择算法在文本分类的优化研究[J].四川大学学报（自然科学版）,2019,56(1):65-70. 被引量：6
2罗强,黄睿岚,朱轶.基于深度学习的粮库虫害实时监测预警系统[J].江苏大学学报（自然科学版）,2019,40(2):203-208. 被引量：11
3黄裕.DSM-Forest算法对计算机多类数据学习分类性能的影响[J].信息技术,2019,43(5):148-150. 被引量：1
4张若彬,刘嘉勇,何祥.基于BLSTM-CRF模型的安全漏洞领域命名实体识别[J].四川大学学报（自然科学版）,2019,56(3):469-475. 被引量：16
5刘礼文,俞弦.循环神经网络（RNN）及应用研究[J].科技视界,2019,0(32):54-55. 被引量：14
6杨鹤标,胡惊涛,刘芳.基于神经网络语言模型的动态层序Softmax训练算法[J].江苏大学学报（自然科学版）,2020,41(1):67-72. 被引量：4
7谢正文,柏钧献,熊熙,琚生根.基于增强问题重要性表示的答案选择算法研究[J].四川大学学报（自然科学版）,2020,57(1):66-72. 被引量：3
8徐雪娇,蒋超,刘义.运用TextCNN的零售平台商品分类[J].信息与电脑,2020,32(1):47-49.
9赵容梅,熊熙,琚生根,李中志,谢川.基于混合神经网络的中文隐式情感分析[J].四川大学学报（自然科学版）,2020,57(2):264-270. 被引量：18
10杨秀璋,夏换,于小民,杨琪,汪瑜斌.基于多视图融合的论文自动分类方法研究[J].现代电子技术,2020,43(8):120-124. 被引量：3

二级引证文献117

1张苑,祝小兰,杨东晓.基于深度学习的疫情情感分析[J].智能计算机与应用,2022,12(3):40-45. 被引量：1
2姜淑杨,鲍磊磊,缪明榕.计算机网络安全漏洞及其管理研究[J].电子元器件与信息技术,2019,0(7):14-17. 被引量：4
3吕建新,郑伟,马林,李明,谷翠梅.基于词向量语义扩展的网络文本特征选择方法研究[J].情报科学,2019,37(12):47-51. 被引量：7
4黄炜,黄建桥,李岳峰.基于BiLSTM-CRF的涉恐信息实体识别模型研究[J].情报杂志,2019,38(12):149-156. 被引量：20
5许丽丹,刘嘉勇,何祥.一种解决命名实体识别数据集类别标记失衡的方法[J].四川大学学报（自然科学版）,2020,57(1):82-88. 被引量：4
6赵容梅,熊熙,琚生根,李中志,谢川.基于混合神经网络的中文隐式情感分析[J].四川大学学报（自然科学版）,2020,57(2):264-270. 被引量：18
7崔昕阳,龙华,熊新,邵玉斌,杜庆治.基于并行双向门控循环单元与自注意力机制的中文文本情感分类[J].北京化工大学学报（自然科学版）,2020,47(2):115-123. 被引量：4
8孙晓全,周光,何志锋,马刘正,苏睿,江敏,胡建东.粮库粮情智能监测系统的设计与实现[J].河南农业大学学报,2020,54(2):237-242. 被引量：5
9黄光华,殷锋,冯九林.一种交叉验证和距离加权方法改进的KNN算法研究[J].西南民族大学学报（自然科学版）,2020,46(2):172-177. 被引量：7
10李志昂,马宗庆,王艳,张波,罗红,周激流.基于D-UNET的胎儿产前超声检测[J].四川大学学报（自然科学版）,2020,57(4):733-740. 被引量：4

1韩栋,王春华,肖敏.结合半监督学习和LDA模型的文本分类方法[J].计算机工程与设计,2018,39(10):3265-3271. 被引量：7
2赵宇航,卢意飞,刘强.使用Y函数方法提取MoS2 FET双向扫描电学参数[J].半导体技术,2018,43(2):125-130.
3付国,申开俊.燃气管道的施工质量管理与控制探究[J].价值工程,2018,37(31):83-84. 被引量：1
4王秀敏,张志红,李君,王怡,洪波.极化码译码算法研究现状及发展前景[J].中国计量大学学报,2018,29(1):44-49.
5熊华林,杨红伟,程广斌.5,5′-二硝胺基-2,2′-联-1,3,4-噁二唑含能离子盐的合成及性能（英文）[J].含能材料,2018,26(11):910-918.
6徐攀,夏光琼,吴正茂,李琼,林晓东,唐曦,樊利,邓涛.光抽运下1300nm自旋垂直腔面发射激光器输出激光的圆偏振转换及偏振双稳特性[J].中国激光,2018,45(4):29-37. 被引量：6
7唐晓芬,陈莉.极限学习机类不平衡数据学习算法研究[J].计算机应用研究,2018,35(10):2990-2993. 被引量：2
8相福生,徐革锋,谷伟,黄天晴,刘晨斌,王炳谦.三倍体雌性虹鳟性腺发育阶段细胞色素相关基因的表达[J].中国水产科学,2018,25(5):949-957. 被引量：1

重庆邮电大学学报（自然科学版）

2018年第5期

浏览历史

内容加载中请稍等...

基于循环结构的卷积神经网络文本分类方法被引量：14

参考文献9

二级参考文献103

共引文献116

同被引文献94

引证文献14

二级引证文献117

相关作者

相关机构

相关主题

浏览历史

基于循环结构的卷积神经网络文本分类方法 被引量：14

参考文献9

二级参考文献103

共引文献116

同被引文献94

引证文献14

二级引证文献117

相关作者

相关机构

相关主题

浏览历史

基于循环结构的卷积神经网络文本分类方法被引量：14