基于CNN和BiLSTM网络特征融合的文本情感分析被引量：113

Text sentiment analysis based on feature fusion of convolution neural network and bidirectional long short-term memory network

下载PDF

导出

摘要卷积神经网络(CNN)和循环神经网络(RNN)在自然语言处理上得到广泛应用,但由于自然语言在结构上存在着前后依赖关系,仅依靠卷积神经网络实现文本分类将忽略词的上下文含义,且传统的循环神经网络存在梯度消失或梯度爆炸问题,限制了文本分类的准确率。为此,提出一种卷积神经网络和双向长短时记忆(Bi LSTM)特征融合的模型,利用卷积神经网络提取文本向量的局部特征,利用Bi LSTM提取与文本上下文相关的全局特征,将两种互补模型提取的特征进行融合,解决了单卷积神经网络模型忽略词在上下文语义和语法信息的问题,也有效避免了传统循环神经网络梯度消失或梯度弥散问题。在两种数据集上进行对比实验,实验结果表明,所提特征融合模型有效提升了文本分类的准确率。 Convolutional Neural Network(CNN)and Recurrent Neural Network(RNN)are widely used in natural language processing,but the natural language has a certain dependence on the structure,only relying on CNN for text classification will ignore the contextual meaning of words,and there is a problem of gradient disappearance or gradient dispersion in the traditional RNN,which limits the accuracy of text classification.A feature fusion model for CNN and Bidirectional Long Short-Term Memory(BiLSTM)was presented.Local features of text were extracted by CNN and global features related to text were extracted by BiLSTM network.The features extracted by the two complementary models were merged to solve the problem of ignoring the contextual semantic and grammatical information of words in a single CNN model,and the fusion model also effectively avoided the problem of gradient disappearance or gradient dispersion in traditional RNN.The experimental results on two kinds of datasets show that the proposed fusion feature model can effectively improve the accuracy of text classification.

作者李洋董红斌 LI Yang;DONG Hongbin(College of Computer Science and Technology,Harbin Engineering University,Harbin Heilongjiang 150001,China)

机构地区哈尔滨工程大学计算机科学与技术学院

出处《计算机应用》 CSCD 北大核心 2018年第11期3075-3080,共6页 journal of Computer Applications

基金国家自然科学基金资助项目(61472095)~~

关键词词向量卷积神经网络双向长短时记忆特征融合文本情感分析 word vector Convolution Neural Network(CNN) Bidirectional Long Short-Term Memory(BiLSTM) feature fusion text sentiment analysis

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：623
2冀胜利,李波.基于SVM的中文文本分类算法[J].重庆工学院学报（自然科学版）,2008,22(7):84-87. 被引量：5
3王树恒,吐尔根.依布拉音,卡哈尔江.阿比的热西提,艾山.吾买尔,古丽尼格尔.阿不都外力.基于BLSTM的维吾尔语文本情感分析[J].计算机工程与设计,2017,38(10):2879-2886. 被引量：16
4崔建明,刘建明,廖周宇.基于SVM算法的文本分类技术研究[J].计算机仿真,2013,30(2):299-302. 被引量：83

二级参考文献50

1高洁,吉根林.文本分类技术研究[J].计算机应用研究,2004,21(7):28-30. 被引量：36
2牛强,王志晓,陈岱,夏士雄.基于SVM的中文网页分类方法的研究[J].计算机工程与设计,2007,28(8):1893-1895. 被引量：22
3Vapnik V N 张学工（译）.统计学习理论的本质[M].北京:清华大学出版社,2000..
4[2]Joachims T.Text categorization with support vector machines[C]//in Proc of European Conference on Machine Learning(ECML).[S.l.]:[s.n.],1998.
5[3]Deerwester S,Dumais S T A.Indexing by latent semantic analysis[J].Journal of the Society for Information Science,1990,41(6):391-407.
6[4]Salton G.Develolanents in automatic text retrieval[J].Science,1991,253(23):974-980.
7[5]Salton G,Buckley C.Term weighting approaches in antomatic text retrieval[J].Infonnation Processing & Management,1988,24(5):513-523.
8[6]Church K W,Gale W A.Inverse document frequency(IDF):A measure of deviations from Poisson[C]//in Proceedings of the 3rd Workshop on Very Large Corpora.Boston:[s.n.],1995:121-130.
9[9]Pang-Ning Tan.数据挖掘导[M].范明,范宏健,译.北京:人民邮电出版社,2006.
10BENGIO Y, DELALLEAU O. On the expressive power of deep archi- tectures[ C ]//Proc of the 14th International Conference on Discovery Science. Berlin : Springer-Verlag, 2011 : 18 - 36.

共引文献722

1吴秀平,赵咏梅,凌静思.幼儿游戏深度学习行为的支持体系建构[J].教育科学论坛,2024(2):63-66.
2高嵩.深度学习在机场能见度预测中的应用[J].计算机产品与流通,2020,0(4):260-260. 被引量：2
3张永玲.以深度学习为核心的小学数学有效教学策略研究[J].理科爱好者（教育教学版）,2019,0(5):248-249. 被引量：2
4周帆,陈晓蝶,钟婷,吴劲.面向金融科技的深度学习技术综述[J].计算机科学,2022,49(S02):20-36. 被引量：3
5李灿强,夏志方,丁邡.基于人工智能技术的“数字政府”研究[J].中国经贸导刊,2019(5Z):138-139. 被引量：6
6彭婉,田良臣.信息技术支持下促进深度学习的教学研究——基于语文课程的研究[J].汉字文化,2022(15):159-161. 被引量：1
7韩祥民,刘晓波,徐邦贤,邱知,唐辉.基于CEEMD与GWO-SVM算法的配电网高阻接地故障选线方法[J].智能计算机与应用,2021,11(12):143-148. 被引量：2
8杨灿.高职《深度学习》课程教学的实施[J].办公自动化,2021,26(16):37-38. 被引量：1
9苑方.基于深度学习的典型神经网络对比分析[J].中国科技纵横,2018,0(19):9-10.
10赵丹琪.人工智能生成物的著作权认定问题研究[J].楚天法治,2018(30):124-127.

同被引文献799

1罗祖兵,郭超华.新中国成立70年课堂教学评价标准的回顾与展望[J].中国教育学刊,2020,0(1):55-61. 被引量：38
2冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：54
3刘连胜,张晗星,刘晓磊,王璐璐,梁军.面向飞机辅助动力装置在翼剩余寿命预测的性能参数扩增方法[J].仪器仪表学报,2020(7):107-116. 被引量：12
4杜恒欣,朱习军.基于BiLSTMATTCNN中文专利文本分类[J].计算机系统应用,2020(11):260-265. 被引量：3
5侯雪亮,李新,陈远平.基于多神经网络混合的短文本分类模型[J].计算机系统应用,2020(10):9-19. 被引量：5
6龚丽娟,王昊,张紫玄,朱立平.Word2Vec对海关报关商品文本特征降维效果分析[J].数据分析与知识发现,2020,4(2):89-100. 被引量：7
7陶志勇,李小兵,刘影,刘晓芳.基于双向长短时记忆网络的改进注意力短文本分类方法[J].数据分析与知识发现,2019,3(12):21-29. 被引量：23
8冯超,黎海辉,赵洪雅,薛云,唐婧尧.基于层次注意力机制和门机制的属性级别情感分析[J].中文信息学报,2021,35(10):128-136. 被引量：6
9昝红英,刘涛,牛常勇,赵悦淑,张坤丽,穗志方.面向儿科疾病的命名实体及实体关系标注语料库构建及应用[J].中文信息学报,2020,34(5):19-26. 被引量：17
10袁婷婷,杨文忠,仲丽君,张志豪,向进勇.基于性格的微博情感分析模型PLSTM[J].计算机应用研究,2020,37(2):342-346. 被引量：7

引证文献113

1梁飞.基于多分组注意力机制的恶意URL智能检测方法[J].信息网络安全,2020(S01):18-22. 被引量：2
2杜恒欣,朱习军.基于BiLSTMATTCNN中文专利文本分类[J].计算机系统应用,2020(11):260-265. 被引量：3
3周海华,曹春萍.基于BLSTM-CRF的领域知识点实体识别技术[J].软件,2019,40(2):1-5.
4潘璀然,王青华,汤步洲,姜磊,黄勋,王理.基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别[J].第二军医大学学报,2019,40(5):497-506. 被引量：13
5张德正,翁理国,夏旻,曹辉.基于深度卷积长短时神经网络的视频帧预测[J].计算机应用,2019,39(6):1657-1662. 被引量：7
6陈畅,李晓磊,崔维玉.基于LSTM网络预测的水轮机机组运行状态检测[J].山东大学学报（工学版）,2019,49(3):39-46. 被引量：14
7王大伟,周志玮,曹红根.基于PCA-SVM算法的酒店评论文本情感分析研究[J].现代计算机,2019,25(21):13-17. 被引量：3
8孙承爱,丁宇,田刚.基于GLU-CNN和Attention-BiLSTM的神经网络情感倾向性分析[J].软件,2019,40(7):62-66. 被引量：6
9孟曌,田生伟,禹龙,王瑞锦.联合分层注意力网络和独立循环神经网络的地域欺凌识别[J].计算机应用,2019,39(8):2450-2455.
10黄炜,黄建桥,李岳峰.基于BiLSTM-CRF的涉恐信息实体识别模型研究[J].情报杂志,2019,38(12):149-156. 被引量：24

二级引证文献548

1李林,张津鹏,付恩三,刘光伟.煤矿风险隐患评估系统[J].中国安全科学学报,2023,33(S02):1-6.
2丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：5
3井明强,房爱莲.双通道深度主题特征提取的文章推荐模型[J].计算机系统应用,2022,31(10):323-328. 被引量：1
4孙龙清,吴雨寒,孙希蓓,张松.基于IBAS和LSTM网络的池塘水溶解氧含量预测[J].农业机械学报,2021,52(S01):252-260. 被引量：14
5冯建英,吴丹丹,王博,王智,穆维松.中文在线评论文本分析对生鲜农产品电商影响研究综述[J].农业机械学报,2021,52(S01):504-512. 被引量：7
6张宗毅.农机“卡脖子”技术识别:综述与展望[J].农业农村部管理干部学院学报,2022(2):34-40.
7赵法森,刘飞翔,李泽荃,李靖.基于BiLSTM+Attention模型的煤矿事故隐患自动分类研究[J].煤炭科学技术,2022,50(S02):210-217. 被引量：1
8雷雨田.基于边缘提取的会议视频图像快速解码算法研究[J].科技通报,2021,37(10):54-58. 被引量：1
9袁丽莉,侯磊,张正平.LDA最大概率填充与BiLSTM模型的文本分类研究[J].智能计算机与应用,2021,11(12):32-36. 被引量：1
10孙红,黎铨祺,赵娜.基于双层树状支持向量机的观点挖掘与倾向分析[J].智能计算机与应用,2021,11(3):44-47. 被引量：3

1夏玉芹,单雪微.基于Python的简单文本情感分析[J].阴山学刊（自然科学版）,2018,32(4):58-62. 被引量：15
2孙振华,李新德.基于卷积神经网络的多标签飞机识别算法[J].计算机应用与软件,2018,35(9):270-274. 被引量：3
3王煜涵,张春云,赵宝林,袭肖明,耿蕾蕾,崔超然.卷积神经网络下的Twitter文本情感分析[J].数据采集与处理,2018,33(5):921-927. 被引量：21
4黄诚,刘嘉勇,刘亮,何祥,汤殿华.基于上下文语义的恶意域名语料提取模型研究[J].计算机工程与应用,2018,54(9):101-108. 被引量：4
5郑开雨,竹翠.基于上下文语义的朴素贝叶斯文本分类算法[J].计算机与现代化,2018(6):1-6. 被引量：4
6何平,刘紫燕.基于改进多层感知机的手写数字识别[J].通信技术,2018,51(9):2075-2080. 被引量：11
7刘雨心,王莉,张昊.基于分层注意力机制的神经网络垃圾评论检测模型[J].计算机应用,2018,38(11):3063-3068. 被引量：3
8周勇.浅谈初中英语课内外听力训练设计[J].电子乐园,2018(2):101-101.
9何鸿业,郑瑾,张祖平.结合词性特征与卷积神经网络的文本情感分析[J].计算机工程,2018,44(11):209-214. 被引量：14
10庞正扬,赵媛.基于大众点评网的智能推荐系统研究[J].电子技术与软件工程,2018(20):157-158.

计算机应用

2018年第11期

浏览历史

内容加载中请稍等...

基于CNN和BiLSTM网络特征融合的文本情感分析被引量：113

参考文献4

二级参考文献50

共引文献722

同被引文献799

引证文献113

二级引证文献548

相关作者

相关机构

相关主题

浏览历史

基于CNN和BiLSTM网络特征融合的文本情感分析 被引量：113

参考文献4

二级参考文献50

共引文献722

同被引文献799

引证文献113

二级引证文献548

相关作者

相关机构

相关主题

浏览历史

基于CNN和BiLSTM网络特征融合的文本情感分析被引量：113