一种基于LSTM和CNN混合模型的文本分类方法被引量：39

Text Classification Method Based on Hybrid Model of LSTM and CNN

下载PDF

导出

摘要针对卷积神经网络(Convolutional Neural Network,CNN)在获取文本中上下文依赖关系方面的不足及深层神经网络在提取文本特征时出现的特征丢失问题,提出一种将长短时记忆网络(Long Short-Term Memory,LSTM)与卷积神经网络结合的文本分类模型MLCNN(Merge-LSTM-CNN).首先,利用词嵌入将输入文本进行向量表示,通过三层CNN提取文本的局部特征,进而整合出全文语义;同时,使用LSTM存储文本中历史信息的特征,以获取文本的上下文关联语义;其次,将输入向量分别与各层CNN的输出相融合,实现原始特征的重用.实验结果表明,相对于CNN、LSTM以及其改进模型,MLCNN模型的分类准确率达到96.45%,取得更好的分类效果. In viewof the defect of Convolutional Neural Network(CNN)in obtaining the context dependency relation of the text and the feature loss problem by using deep Neural Network extracts the text features,this paper proposes a text classification model called MLCNN(Merge-LSTM-CNN)that combines Long Short-Term Memory(LSTM)and Convolutional Neural Network(CNN).Firstly,the input text is represented as vector through word embedding,and the local features of the text are extracted by using three layers of CNN,then integrate the semantics of full text.At the same time,LSTMis used to store the characteristics of the historical information in text to obtain the context-related semantics of the text.Secondly,the input vector is merged with the output of each layer of CNN to reuse the original features.Experimental results show that compared with CNN,LSTMand their improved model,the classification accuracy of MLCNN model reaches 96.45%,which achieves better classification effect.

作者王海涛宋文王辉 WANG Hai-tao;SONG Wen;WANG Hui(College of Computer Science and Technology,Henan Polytechnic University,Jiaozuo 454000,China)

机构地区河南理工大学计算机科学与技术学院

出处《小型微型计算机系统》 CSCD 北大核心 2020年第6期1163-1168,共6页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61503124,61572379)资助.

关键词文本分类长短时记忆网络卷积神经网络词嵌入融合 text classification long short-term memory convolution neural network word embedding merge

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1梁军,柴玉梅,原慧斌,高明磊,昝红英.基于极性转移和LSTM递归网络的情感分析[J].中文信息学报,2015,29(5):152-159. 被引量：91
2邱宁佳,丛琳,周思丞,王鹏,李岩芳.结合改进主动学习的SVD-CNN弹幕文本分类算法[J].计算机应用,2019,39(3):644-650. 被引量：11
3林奕欧,雷航,李晓瑜,吴佳.自然语言处理中的深度学习:方法及应用[J].电子科技大学学报,2017,46(6):913-919. 被引量：56
4陈磊,李俊.基于词向量的文本特征选择方法研究[J].小型微型计算机系统,2018,39(5):991-994. 被引量：27

二级参考文献29

1Bengio Y, Ducharme R, Vincent P, et al. A neural probabilistic language model. The Journal of Ma- chine Learning Research, 2003, 3; 1137-1155.
2Mikolov T, Karaficit M, Burget L, et al. Recurrent neural network based language model[C]//Proceed- ings of the llth Annual Conference of the International Speech Communication Association, Makuhari, Chiba, Japan, September 26-30, 2010. 2010. 1045-1048.
3Socher R, Pennington J, Huang E H, et al. Semi-su- pervised recursive autoencoders for predicting senti- ment distributions[C]//Proeeedings of the Conference on Empirical Methods in Natural Language Process- ing. Association for Computational Linguistics, 2011:151-161.
4Hochreiter S, Bengio Y, Frasconi P, et al. Gradient flow in recurrent nets: the difficulty of learning long- term dependencies M. Wiley-IEEE Press, 2001: 237-243.
5Hochreiter S, Schmidhuber J. Long short-term memo- ry. Neural computation, 1997, 9(8): 1735-1780.
6Socher R, Lin C C, Manning C, et al. Parsing natural scenes and natural language with recursive neural net- works[C//Proceedings of the 28th international con- ference on machine learning (ICML-11). 2011 : 129- 136.
7Socher R, Perelygin A, Wu J Y, et al. Recursive deep models for semantic compositionality over a sentiment treebankC//Proceedings of the conference on empiri- cal methods in natural language processing (EMNLP). 2013 : 1631-1642.
8Irsoy O, Cardie C. Deep Recursive Neural Networks for Compositionality in Language[-C//Proeeedings of the Advances in Neural Information Processing Sys- tems. 2014:2096 -2104.
9Li P, Liu Y, Sun M. Recursive Autoencoders for ITG-Based Translation[C]//Proceedings of the EMN- LP. 2013: 567-577.
10Le P, Zuidema W. Inside-Outside Semantics: A Framework for Neural Models of Semantic Composi tlon[C]//Proceeding of the Deep Learning and Rep- resentation Learning Workshop: NIPS 2014.

共引文献179

1彭骁男,周兰江,张建安,周枫.融合多特征的老挝语人名地名命名实体识别[J].中国水运（下半月）,2020,20(3):74-77. 被引量：1
2姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：16
3章宣,赵宝奇,孙军梅,葛青青,肖蕾,尉飞.面向微博文本的自杀风险识别模型[J].计算机系统应用,2020,29(11):121-127. 被引量：3
4刘振宇,李钦富,杨硕,邓应强,刘芬,赖新明,白雪珂.一种基于主动学习和多种监督学习的情感分析模型[J].中国电子科学研究院学报,2020,15(2):171-176. 被引量：2
5董志勇,邱瀚,陈泓运.智慧高速系统中大语言模型的集成与应用研究[J].中国交通信息化,2024(S01):67-71.
6孟威,尉永清,刘文锋.基于CRT机制混合神经网络的特定目标情感分析[J].计算机应用研究,2020,37(2):360-364. 被引量：1
7王丽芬,王珏,洪燕,娄亚兵,简晖,吕爱平,查青林.融合脉诊信息的女性移动中医健康管理平台的研制[J].世界科学技术-中医药现代化,2018,20(10):1803-1807. 被引量：8
8刘小明,张英,郑秋生.基于卷积神经网络模型的互联网短文本情感分类[J].计算机与现代化,2017(4):73-77. 被引量：9
9李超,柴玉梅,高明磊,昝红英.句法分析和深度神经网络在中文问答系统答案抽取中的研究[J].小型微型计算机系统,2017,38(6):1341-1346. 被引量：4
10林鹏程,林培杰,程树英.基于自编码的中国手语识别研究[J].微型机与应用,2017,36(13):59-61. 被引量：2

同被引文献359

1周意乔,徐昱琳.基于双向LSTM的复杂环境下实时人体姿势识别[J].仪器仪表学报,2020,41(3):192-201. 被引量：4
2唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：43
3陶志勇,李小兵,刘影,刘晓芳.基于双向长短时记忆网络的改进注意力短文本分类方法[J].数据分析与知识发现,2019,3(12):21-29. 被引量：23
4孙龙清,吴雨寒,孙希蓓,张松.基于IBAS和LSTM网络的池塘水溶解氧含量预测[J].农业机械学报,2021,52(S01):252-260. 被引量：14
5傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：53
6张秋颖,傅洛伊,王新兵.基于BERT-BiLSTM-CRF的学者主页信息抽取[J].计算机应用研究,2020,37(S01):47-49. 被引量：14
7王杨,许闪闪,李昌,艾世成,张卫东,甄磊,孟丹.基于支持向量机的中文极短文本分类模型[J].计算机应用研究,2020,37(2):347-350. 被引量：30
8余本功,许庆堂,张培行.基于MAC-LSTM的问题分类研究[J].计算机应用研究,2020,37(1):40-43. 被引量：15
9闫佰忠,孙剑,王昕洲,韩娜,刘博.基于多变量LSTM神经网络的地下水水位预测[J].吉林大学学报（地球科学版）,2020,50(1):208-216. 被引量：37
10余丹.关于查全率和查准率的新认识[J].西南民族大学学报（人文社会科学版）,2009,30(2):283-285. 被引量：15

引证文献39

1袁丽莉,侯磊,张正平.LDA最大概率填充与BiLSTM模型的文本分类研究[J].智能计算机与应用,2021,11(12):32-36. 被引量：1
2林国祥,詹先银,薛醒思,林涵,吕宏昱,林培辉,方铭波.基于fastText的股票咨询案例中文短文本分类技术[J].宝鸡文理学院学报（自然科学版）,2020,40(3):48-52. 被引量：3
3田世润,齐金平,王保福,王康.基于贝叶斯网络的复式交分道岔故障诊断[J].北京交通大学学报,2020,44(6):118-125. 被引量：10
4刘鹏程,孙林夫,张常有,王波.基于交互注意力机制网络模型的故障文本分类[J].计算机集成制造系统,2021,27(1):72-89. 被引量：9
5况书梅,王莉莉.基于向量空模型的数字图书信息分类系统设计[J].现代电子技术,2021,44(10):110-114. 被引量：3
6金乐.基于双向长短期记忆网络的高压输电线路短路故障识别方法[J].内蒙古电力技术,2021,39(2):66-72. 被引量：3
7倪水平,李慧芳.基于一维卷积神经网络与长短期记忆网络结合的电池荷电状态预测方法[J].计算机应用,2021,41(5):1514-1521. 被引量：14
8张建新,李永保,谢立中,张震,王小召.基于EMD和LSTM的火箭炮电气系统状态预测[J].兵工自动化,2021,40(8):1-5.
9胡衍坤,王宁,刘枢,姜秋俚,张楠.时间序列模型和LSTM模型在水质预测中的应用研究[J].小型微型计算机系统,2021,42(8):1569-1573. 被引量：14
10李铁飞,生龙,吴迪.BERT-TECNN模型的文本分类方法研究[J].计算机工程与应用,2021,57(18):186-193. 被引量：20

二级引证文献157

1黄茜,贺超城,李欣儒,吴江.后疫情时代下短租民宿用户购买行为研究——基于BERT衡量的网络口碑[J].知识管理论坛,2023(3):238-257.
2郭小萍,钟道金,李元.基于AMSDAE-BLSTM的工业过程质量预测[J].电子测量技术,2023,46(4):19-24.
3陶全桧,安俊秀,陈宏松.基于跨模态融合ERNIE的多模态情感分析研究[J].成都信息工程大学学报,2022,37(5):501-507. 被引量：1
4王钟浩,崔珂玮,张鑫,杨振中,刘帅.基于fastText的地震信息文本分类方法[J].现代信息科技,2021,5(3):5-8. 被引量：1
5刘梦月,黄淑萍.震后城市路网关键路段识别[J].北京交通大学学报,2021,45(3):30-37. 被引量：3
6杨培盛,付宇,李鸿飞,初开麒,王梦谦,李政达.基于CNN-LSTM的支撑电容容值软测量[J].电子技术应用,2021,47(9):16-19.
7杨莉莉.河南省互联网发展与图书产业空间不一致性研究[J].科技传播,2021,13(17):177-181.
8杨雯迪,任春华,孙洁香.支持汽车故障数据增值的词汇增强实体识别[J].现代计算机,2021,27(26):8-14. 被引量：2
9吴德平,时翔,王晓东.基于BERT模型的安全生产事故多标签文本分类[J].武汉工程大学学报,2021,43(5):586-590. 被引量：6
10王红梅,郭放,郭真俊,张丽杰.一种新闻文本标注方法[J].长春工业大学学报,2021,42(5):462-468. 被引量：1

1张文龙,张志翔.移动应用程序的特定故障分类并用于集中质量保证[J].现代计算机,2020,26(11):17-20.
2束丹.论高中历史教学中历史思维能力的培养[J].求学,2020(15):42-43. 被引量：1
3骆勇.高中历史教学中史料图片的运用[J].试题与研究（教学论坛）,2020(13):3-3.
4董园园.基于改进相对判别准则的文本分类方法[J].网络新媒体技术,2020,9(2):29-36. 被引量：1
5王娣,侠惠芳,李金辉.基于主成分和神经网络的风力发电机主轴承故障预警[J].节能,2020,39(5):33-36. 被引量：1
6肖利琼.城市建设中的历史文化遗产保护策略[J].文物鉴定与鉴赏,2020(8):157-159. 被引量：2
7刘创,梁军.基于注意力机制的车辆运动轨迹预测[J].浙江大学学报（工学版）,2020,54(6):1156-1163. 被引量：16
8叶佳鑫,熊回香,童兆莉,孟秋晴.在线医疗社区中面向医生的协同标注研究[J].数据分析与知识发现,2020,4(6):118-128. 被引量：4
9李爱莲,赵多祯,郭志斌,张帅,解韶峰.改进深度信念网络的转炉耗氧量预测[J].中国测试,2020,46(6):1-6. 被引量：3
10焦启航,乐小虬.对比关系句子生成方法研究[J].数据分析与知识发现,2020,4(6):43-50.

小型微型计算机系统

2020年第6期

浏览历史

内容加载中请稍等...

一种基于LSTM和CNN混合模型的文本分类方法被引量：39

参考文献4

二级参考文献29

共引文献179

同被引文献359

引证文献39

二级引证文献157

相关作者

相关机构

相关主题

浏览历史

一种基于LSTM和CNN混合模型的文本分类方法 被引量：39

参考文献4

二级参考文献29

共引文献179

同被引文献359

引证文献39

二级引证文献157

相关作者

相关机构

相关主题

浏览历史

一种基于LSTM和CNN混合模型的文本分类方法被引量：39