基于CNN-BIGRU的中文文本情感分类模型被引量：6

Chinese Comment Sentiment Classification Model Based on CNN-BIGRU

下载PDF

导出

摘要在当今商业领域,对网络评论的情感分类一直是一个比较热门的研究方向,而为了克服传统机器学习方法所构建分类器会产生较大计算开销,精度表现较差的缺点,提出一种基于深度学习模型中卷积神经网络(CNN)与循环神经网络(RNN)模型的情感分类方法。在以往的研究中,卷积神经网络往往被用来提取文本的局部特征信息,但却容易忽视文本的长距离特征,而RNN则往往被用来提取句子的长距离依赖信息,但容易陷入梯度爆炸问题。因此,结合卷积神经网络对于局部特征信息的良好提取能力与循环神经网络对于长距离依赖信息的记忆能力,构建了一个CNN-BIGRU混合模型,用以提取文本的局部特征以及文本的长距离特征。其中循环神经网络模型使用了双向GRU模型,以避免RNN模型的梯度爆炸与梯度消失问题。在谭松波的酒店评论数据集上的实验结果表明,利用该模型,实验分类的准确率比单独使用卷积神经网络模型最高提升了26.3%,比单独使用循环神经网络模型最高提升了7.9%,从而提高了对中文文本情感分类的精度,并减少了计算开销。 In today’s business field,the sentiment classification of online comments has always been a hot research direction.In order to overcome the shortcomings of the classifier constructed by the traditional machine learning method,such as large computational overhead and poor accuracy,a sentiment classification method based on the convolutional neural network(CNN)and recurrent neural network(RNN)in the deep learning model is proposed.In previous studies,CNN is often used to extract the local feature information of the text,but it is easy to ignore the long-distance feature of the text,while RNN is often used to extract the long-distance dependent information of the sentence,but it is easy to fall into the gradient explosion.Therefore,combining the great local feature information extraction of CNN and the memory of RNN to long-distance dependent information,we construct a CNN-BIGRU hybrid model to extract local feature and long-distance feature of text.A two-way GRU model is used in RNN model to avoid the gradient explosion and gradient disappearance of the RNN model.The experiment on Tan Songbo’hotel reviews data set shows that the classification accuracy of the proposed model is the highest by 26.3% compared with the CNN alone,and the highest by 7.9% compared with RNN alone,so as to improve the accuracy of the affection of Chinese text classification and reduce the computational overhead.

作者宋祖康阎瑞霞 SONG Zu-kang;YAN Rui-xia(School of Management,Shanghai University of Engineering Science,Shanghai 201620,China)

机构地区上海工程技术大学管理学院

出处《计算机技术与发展》 2020年第2期166-170,共5页 Computer Technology and Development

基金国家自然科学基金(71301100) 上海市教委科研创新(14YZ140)

关键词卷积神经网络循环神经网络文本分析情感分类 convolutional neural network recurrent neural network text analysis sentiment classification

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1林燕霞,谢湘生.基于社会认同理论的微博群体用户画像[J].情报理论与实践,2018,41(3):142-148. 被引量：66
2姜飞,刘奕群,栾焕博,孙甲申,朱璇,张敏,马少平.Microblog Sentiment Analysis with Emoticon Space Model[J].Journal of Computer Science & Technology,2015,30(5):1120-1129. 被引量：21
3Yanyan ZHAO,Bing QIN,Ting LIU.Encoding syntactic representations with a neural network for sentiment collocation extraction[J].Science China(Information Sciences),2017,60(11):3-14. 被引量：7
4张小川,余林峰,桑瑞婷,张宜浩.融合CNN和LDA的短文本分类研究[J].软件工程,2018,21(6):17-21. 被引量：11
5罗帆,王厚峰.结合RNN和CNN层次化网络的中文文本情感分类[J].北京大学学报（自然科学版）,2018,54(3):459-465. 被引量：21
6冯兴杰,张志伟,史金钏.基于卷积神经网络和注意力模型的文本情感分析[J].计算机应用研究,2018,35(5):1434-1436. 被引量：61
7任勉,甘刚.基于双向LSTM模型的文本情感分类[J].计算机工程与设计,2018,39(7):2064-2068. 被引量：32
8王汝娇,姬东鸿.基于卷积神经网络与多特征融合的Twitter情感分类方法[J].计算机工程,2018,44(2):210-219. 被引量：27
9刘红光,马双刚,刘桂锋.基于降噪自动编码器的中文新闻文本分类方法研究[J].现代图书情报技术,2016(6):12-19. 被引量：8
10李杰,李欢.基于深度学习的短文本评论产品特征提取及情感分类研究[J].情报理论与实践,2018,41(2):143-148. 被引量：52

二级参考文献83

1靳小波.文本分类综述[J].自动化博览,2006,23(z1):24-29. 被引量：16
2陈富国.多维标度法的理论与方法[J].心理科学通讯,1990,13(4):38-42. 被引量：23
3苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：383
4卢苇,彭雅.几种常用文本分类算法性能比较与分析[J].湖南大学学报（自然科学版）,2007,34(6):67-69. 被引量：31
5Jansen B J, Zhang M, Sobel K, Chowdury A. Twitter power: Tweets as electronic word of mouth. Journal of the American Society for Information Science and Technology, 2009, 60(11): 2169-2188.
6Bollen J, Mao H, Zeng X. Twitter mood predicts the stock market. Journal of Computational Science, 2011, 2(1): 1-8.
7Zhao J, Dong L, Wu J, Xu K. MoodLens: An emoticon- based sentiment analysis system for Chinese tweets. In Proc. the 18th KDD, Aug. 2012, pp.1528-1531.
8Jiang L, Yu M, Zhou M, Liu X, Zhao T. Target-dependent Twitter sentiment classification. In Proc. the 49th ACL, Jun. 2011, pp.151-160.
9Liu K L, Li W J, Guo M. Emoticon smoothed language models for Twitter sentiment analysis. In Proe. the 26th AAAI. Jul. 2012.
10Bermingham A, Smeaton A F. Classifying sentiment in mi- croblogs: Is brevity an advantage? In Proc. the 19th ACM International Conference on Information and Knowledge Management, Oct. 2010, pp.1833-1836.

共引文献290

1周胜,龚鸣敏,田福庆.基于传播行为的微博用户联合谱聚类方法研究[J].中国网络传播研究,2018(2).
2庞良健,李晗,王庆林,徐新胜.融合多层次语义的网络评价方面抽取方法研究[J].科技通报,2021,37(10):59-65.
3康刚,吴四九,方睿.基于胶囊特征聚合的评价词和评价对象抽取[J].成都信息工程大学学报,2020(5):524-530. 被引量：1
4万倩,朱里越,欧阳峰.基于人工智能的广电舆情分析系统[J].广播与电视技术,2019,0(12):46-52. 被引量：5
5郭晓慧.基于LDA主题模型的文本语料情感分类改进方法[J].延边大学学报（自然科学版）,2018,44(3):266-273. 被引量：3
6陈文强,周安民,刘亮.基于多尺度融合CNN的恶意软件行为描述语句抽取模型[J].网络安全技术与应用,2019(1):28-30.
7秦宇君,史存会,刘悦,俞晓明,程学旗.多源文本下结合实体的事件发现方法ESP[J].山西大学学报（自然科学版）,2019,42(1):41-50. 被引量：2
8张莉曼,张向先,卢恒,张玲.知识直播平台付费用户群体画像研究[J].图书情报工作,2019,63(5):84-91. 被引量：20
9张乐,闫强,吕学强.面向短文本的情感折射模型[J].情报学报,2017,36(2):180-189. 被引量：9
10何炎祥,孙松涛,牛菲菲,李飞.用于微博情感分析的一种情感语义增强的深度学习模型[J].计算机学报,2017,40(4):773-790. 被引量：127

同被引文献43

1线岩团,相艳,余正涛,文永华,王红斌,张亚飞.用于文本分类的均值原型网络[J].中文信息学报,2020(6):73-80. 被引量：2
2郭小刚.冰雪中处处涌动的民间暖流社会组织成为抢险救灾不可替代的重要力量(新闻综述)[J].社团管理研究,2008(2):9-10. 被引量：1
3张征杰,王自强.文本分类及算法综述[J].电脑知识与技术,2012,8(2):825-828. 被引量：19
4张雷,孔艳岩.基于需求分析的震后应急救援队伍分组模型[J].自然灾害学报,2013,22(3):32-39. 被引量：8
5陈云.中国古代社会救助事业中的民间力量[J].三峡大学学报（人文社会科学版）,2014,36(6):93-96. 被引量：4
6梁军,柴玉梅,原慧斌,高明磊,昝红英.基于极性转移和LSTM递归网络的情感分析[J].中文信息学报,2015,29(5):152-159. 被引量：90
7唐明,朱磊,邹显春.基于Word2Vec的一种文档向量表示[J].计算机科学,2016,43(6):214-217. 被引量：142
8赵妍妍,秦兵,石秋慧,刘挺.大规模情感词典的构建及其在情感分类中的应用[J].中文信息学报,2017,31(2):187-193. 被引量：50
9微信安全团队.八月朋友圈十大谣言盘点[J].中国信息安全,2017(9):18-19. 被引量：1
10刘政,卫志华,张韧弦.基于卷积神经网络的谣言检测[J].计算机应用,2017,37(11):3053-3056. 被引量：38

引证文献6

1於张闲,冒宇清,胡孔法.基于深度学习的虚假健康信息识别[J].软件导刊,2020,19(3):16-20. 被引量：8
2杨青,朱丽,张亚文,吴涛.图卷积神经网络在中文对话情感分析中的应用[J].软件导刊,2021,20(3):7-12. 被引量：3
3贾澎涛,孙炜.基于深度学习的文本分类综述[J].计算机与现代化,2021(7):29-37. 被引量：18
4刁天宸,张俊坤,陈尧,李炜明.基于循环神经网络的中文文本情感分类应用[J].无线互联科技,2021,18(19):96-97.
5陈钢,佘祥荣,陈健鹏.基于XLNet-BiGRU-Attention的行业分类方法[J].计算机技术与发展,2022,32(7):39-45.
6李莹,杨士,唐静,蔡继永.基于TF-IDF与LSA模型的社会救援组织主题分析[J].电脑知识与技术,2023,19(8):19-21.

二级引证文献29

1熊晗.基于图卷积神经网络的高校评教文本垃圾识别模型[J].电视技术,2021,45(12):140-143.
2李露琪,刘燕,侯丽.基于对抗神经网络的突发公共卫生事件虚假新闻检测[J].中华医学图书情报杂志,2021,30(7):1-9. 被引量：1
3沈自强,李晔,丁青艳,王金颖,白全民.基于BERT模型的科技政策文本分类研究[J].数字图书馆论坛,2022(1):10-16. 被引量：14
4邓胜利,孙瑾杰.图书馆参与虚假健康信息治理的价值、阻滞因素和实现路径[J].图书情报工作,2022,66(9):14-22. 被引量：10
5陈钢.融合RoBERTa和特征提取的政务热线工单分类[J].计算机与现代化,2022(6):21-26. 被引量：6
6邓胜利,顾一飞.网络虚假健康信息研究综述:认知、行为与治理[J].图书馆杂志,2022,41(5):14-22. 被引量：15
7任鹏,李文杰,舒宇杰,孙航,赵旖旎.结合BERT词嵌入和双向循环卷积神经网络的新闻文本分类研究[J].信息记录材料,2022,23(6):20-23. 被引量：2
8顾孟钧,冯文舟,陈中兵.不同长度下中文垃圾邮件分类模型的研究[J].工业信息安全,2022(7):28-35. 被引量：1
9魏文萍.基于卷积神经网络的英语点餐机器人智能交互研究[J].自动化与仪器仪表,2022(7):252-256. 被引量：1
10宋冠谕,程登,张森,刘威,丁晓雯.基于BERT的语音文本二分类方法[J].计算机应用文摘,2022,38(18):96-98.

1陈志霞.联系生活实际提高文本解读能力[J].教育革新,2019,0(9):53-53.
2王丽亚,刘昌辉,蔡敦波,赵彤洲,王梦.基于字符级联合网络特征融合的中文文本情感分析[J].微电子学与计算机,2020,37(1):80-86. 被引量：10
3吴萍萍.基于信息熵加权的Word2vec中文文本分类研究[J].长春师范大学学报,2020,39(2):28-33. 被引量：1
4武姗姗.基于TextRCNN和TextCNN的文本情感分类[J].信息记录材料,2019,20(12):135-136. 被引量：4
5曹卫东,李嘉琪,王怀超.采用注意力门控卷积网络模型的目标情感分析[J].西安电子科技大学学报,2019,46(6):30-36. 被引量：11
6袁和金,张旭,牛为华,崔克彬.融合注意力机制的多通道卷积与双向GRU模型的文本情感分析研究[J].中文信息学报,2019,33(10):109-118. 被引量：30
7顾军华,彭伟桃,李娜娜,董永峰.基于卷积注意力机制的情感分类方法[J].计算机工程与设计,2020,41(1):95-99. 被引量：7
8王立荣.Word2vec-CNN-Bilstm短文本情感分类[J].福建电脑,2020,36(1):11-16. 被引量：1
9刘月峰,蔡爽,杨涵晰,张晨荣.融合CNN与BiLSTM的网络入侵检测方法[J].计算机工程,2019,45(12):127-133. 被引量：17
10李豫华,刘权.基于网络评论筛选的历史文化街区形象更新评价——以桂林东西巷为例[J].中外建筑,2019,0(12):57-61. 被引量：1

计算机技术与发展

2020年第2期

浏览历史

内容加载中请稍等...

基于CNN-BIGRU的中文文本情感分类模型被引量：6

参考文献11

二级参考文献83

共引文献290

同被引文献43

引证文献6

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于CNN-BIGRU的中文文本情感分类模型 被引量：6

参考文献11

二级参考文献83

共引文献290

同被引文献43

引证文献6

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于CNN-BIGRU的中文文本情感分类模型被引量：6