基于深度学习算法的藏文微博情感计算研究被引量：6

Research on Tibetan Micro-blog Affective Computation Based on Deep Learning Algorithm

下载PDF

导出

摘要针对藏文文本情感计算研究,将CNN-LSTM深度学习模型引入到藏文微博情感计算,弥补了少数语言自然语言处理研究的缺乏,对藏文研究具有一定的推动作用。针对藏文语料的不公开,通过藏文同反义情感词典对标注好的藏文微博语料中情感词汇的同反义词进行替换,进一步扩充了藏文微博语料,以适合深度学习对大数据语料的要求。藏文微博分词后,利用Word2vec工具训练出藏文微博词向量模型,提高特征向量对文本深层次语义信息的表达;然后,将训练好的词向量和对应的情感倾向标签直接引到由卷积层、池化层、LSTM层、全连接层等构成的CNN-LSTM模型,在每一层的输出做归一化处理;最后经过Softmax分类器对藏文微博进行情感倾向分类,并与LSTM以及传统的情感词典做了实验对比。结果表明,该算法获得了较好的分类效果。 Aiming at the study of Tibetan text emotion calculation,the CNN-LSTM deep learning model is introduced into Tibetan micro-blog emotion calculation,which makes up for the lack of research on minority language natural language processing,and has certain impetus to Tibetan studies.For the non-disclosure of Tibetan corpus,the Tibetan and the anti-sense sentiment dictionary are used to replace the antonyms of the emotional vocabulary in the Tibetan micro-blog corpus,further expanding the Tibetan micro-blog corpus to meet the requirements of deep learning to big data.After the Tibetan micro-blog’word segmentation,the Word2vec tool is used to train the Tibetan micro-blog’word vector model to improve the expression of the deep vector semantic information of the feature vector.Then,the trained word vector and the corresponding emotional tendency label are directly introduced into the CNN-LSTM model consisting of convolutional layer,pooling layer,flatten layer,LSTM layer,and the output at each layer will be batch normalization.Finally,the Softmax Classifier is used to affect the Tibetan micro-blog.Compared with LSTM and traditional sentiment lexicon,it shows that the proposed algorithm achieves better classification effect.

作者孙本旺田芳 SUN Ben-wang;TIAN Fang(Department of Computer Technology and Applications,Qinghai University,Xining 810016,China;Information Technology Center,Qinghai University,Xining 810016,China)

机构地区青海大学计算机技术与应用系青海大学信息化技术中心

出处《计算机技术与发展》 2019年第10期55-58,99,共5页 Computer Technology and Development

基金国家自然科学基金(61461045) 青海省科技计划项目(2016-ZJ-743)

关键词深度学习藏文微博词向量情感计算 deep learning Tibetan micro-blog word vector emotional calculation

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1闫晓东,黄涛.基于情感词典的藏语文本句子情感分类[J].中文信息学报,2018,32(2):75-80. 被引量：20
2梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：110
3杨志.基于词典与机器学习的藏文微博情感分析研究[J].软件,2017,38(11):46-48. 被引量：4
4普次仁,侯佳林,刘月,翟东海.深度学习算法在藏文情感分析中的应用研究[J].计算机科学与探索,2017,11(7):1122-1130. 被引量：7
5张俊,李应兴.基于情感词典的藏文微博情感分析研究[J].硅谷,2014,7(20):220-220. 被引量：8

二级参考文献33

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：122
3唐慧丰,谭松波,程学旗.基于监督学习的中文情感分类技术比较研究[J].中文信息学报,2007,21(6):88-94. 被引量：136
4徐军,丁宇新,王晓龙.使用机器学习方法进行新闻的情感自动分类[J].中文信息学报,2007,21(6):95-100. 被引量：107
5B.Pang,L.Lee.Seeing stars:Exploiting class relationships for sentiment categorization with respect to rating scales[C]Proceedings of the ACL,2005:115-124.
6Y.Bengio,R.Ducharme,P.Vincent,et al.A neural probabilistic language model[J].Journal of Machine Learning Research,2003,3:1137-1155.
7Collobert R,Weston J.A unified architecture for natural language processing:Deep neural networks with multitask learning[C]//Proceedings of the 25th international conference on Machine learning.ACM,2008:160-167.
8Mnih A,Hinton G E.A Scalable Hierarchical Distributed Language Model[C]//Proceedings of NIPS.2008::1081-1088.
9Mikolov T,Karafiát M,Burget L,et al.Recurrent neural network based language model[C]//Proceedingsof INTERSPEECH.2010:1045-1048.
10Mikolov T,Kombrink S,Burget L,et al.Extensions of recurrent neural network language model[C]//Proceedings of Acoustics,Speech and Signal Processing(ICASSP),2011 IEEE International Conference on.IEEE,2011:5528-5531.

共引文献138

1王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
2热孜瓦姑丽·吾斯曼,艾孜尔古丽·玉素甫.论现代的维吾尔语情感分析方法进展[J].电脑知识与技术,2020,0(4):178-179.
3王文,王树锋,李洪华.基于文本语义和表情倾向的微博情感分析方法[J].南京理工大学学报,2014,38(6):733-738. 被引量：23
4苏小英,孟环建.基于神经网络的微博情感分析[J].计算机技术与发展,2015,25(12):161-164. 被引量：14
5梁军,柴玉梅,原慧斌,高明磊,昝红英.基于极性转移和LSTM递归网络的情感分析[J].中文信息学报,2015,29(5):152-159. 被引量：91
6蔡国永,夏彬彬.基于卷积神经网络的图文融合媒体情感预测[J].计算机应用,2016,36(2):428-431. 被引量：25
7刘龙飞,杨亮,张绍武,林鸿飞.基于卷积神经网络的微博情感倾向性分析[J].中文信息学报,2015,29(6):159-165. 被引量：96
8王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,42(4):495-511. 被引量：71
9李冬白,田生伟,禹龙,艾斯卡尔.艾木都拉,吐尔根.依布拉音.深度学习的维吾尔语语句隐式情感分类[J].计算机工程与设计,2016,37(9):2577-2580. 被引量：5
10王兆凯,李亚星,冯旭鹏,刘利军,黄青松,刘晓梅.基于深度信念网络的个性化信息推荐[J].计算机工程,2016,42(10):201-206. 被引量：5

同被引文献33

1丹增罗布,祁坤钰.藏语心理动词论元结构研究[J].西北民族大学学报（自然科学版）,2013,34(4):57-62. 被引量：2
2林传鼎,无.社会主义心理学中的情绪问题——在中国社会心理学研究会成立大会上的报告(摘要)[J].社会心理科学,2006,21(1):37-37. 被引量：15
3徐琳宏,林鸿飞,赵晶.情感语料库的构建和分析[J].中文信息学报,2008,22(1):116-122. 被引量：112
4李海刚,于洪志.藏文文本情感分类系统设计[J].甘肃科技纵横,2011,40(1):106-107. 被引量：6
5曹建芳,陈俊杰,李海芳.基于Adaboost-BP神经网络的图像情感分类方法研究[J].山西大学学报（自然科学版）,2013,36(3):331-337. 被引量：11
6孙建旺,吕学强,张雷瀚.基于词典与机器学习的中文微博情感分析研究[J].计算机应用与软件,2014,31(7):177-181. 被引量：50
7张俊,李应兴.基于情感词典的藏文微博情感分析研究[J].硅谷,2014,7(20):220-220. 被引量：8
8梁亚伟.基于情感词典的中文微博情感分析模型研究[J].现代计算机,2015,21(12):11-15. 被引量：5
9杜锐,朱艳辉,田海龙,刘璟,马进.基于平滑SO-PMI算法的微博情感词典构建方法研究[J].湖南工业大学学报,2015,29(5):77-81. 被引量：10
10袁斌,江涛,于洪志.基于语义空间的藏文微博情感分析方法[J].计算机应用研究,2016,33(3):682-685. 被引量：10

引证文献6

1申莹,刘春阳,赵永翼.基于SVM算法的微博评论数据情感分析[J].数字通信世界,2020(1):111-111. 被引量：3
2黄晨晨,索朗拉姆,拉姆卓嘎,群诺.基于SVM的藏文微博文本情感分析研究与实现[J].高原科学研究,2020,4(1):92-96. 被引量：7
3拉桑吉,安见才让.多模态藏语情感分类的研究[J].计算机时代,2022(10):98-102. 被引量：1
4吴涔,叶宁,王甦,季翔宇.基于PN和CNN-LSTM-ATT的航班延误预测[J].计算机技术与发展,2023,33(4):213-220. 被引量：1
5朱宇雷,德吉卡卓,群诺,尼玛扎西.基于图神经网络结合预训练模型的藏文短文本情感分析研究[J].中文信息学报,2023,37(2):71-79. 被引量：3
6才让东知,杨杰,尼玛扎西.藏文情感词典构建的现状分析[J].计算机技术与发展,2024,34(3):9-14.

二级引证文献14

1梁一鸣,申莹,赵永翼.基于LSTM的电影评论情感分析研究[J].数字通信世界,2021(2):27-28. 被引量：4
2拉巴顿珠,吴翔,珠杰.基于大数据分析的拉萨市纳木措景区形象感知分析[J].高原科学研究,2021,5(3):92-100. 被引量：1
3孙维阳,刘继.基于LPT主动学习策略的网络突发热点事件舆情分析[J].信息技术与信息化,2022(2):13-16.
4梁一鸣,赵永翼.基于SVM的虚假新闻检测研究[J].信息与电脑,2022,34(2):223-225.
5单睿康,江涛,张婷婷,李多吉草,索南达杰.基于改进SO-PMI的藏文情感词典自动构建方法[J].高原科学研究,2022,6(1):104-112. 被引量：2
6李新焕,黄伟力.基于SVM算法的微博用户识别和分类研究[J].现代信息科技,2022,6(16):107-109. 被引量：1
7朱宇雷,德吉卡卓,群诺,尼玛扎西.基于图神经网络结合预训练模型的藏文短文本情感分析研究[J].中文信息学报,2023,37(2):71-79. 被引量：3
8陈浩,柴鹏鑫,卓嘎.常用藏语词汇语音评价关键技术研究和仿真实现[J].信息与电脑,2023,35(2):177-180.
9白玛洛赛,群诺,达措.一种融合CINO+TextCNN+BiLSTM+Attention的藏文情感分类方法[J].高原科学研究,2023,7(2):93-98.
10王云锋,黄涛,王子玖,魏同胜,程爽.空中交通态势感知研究综述[J].航空计算技术,2024,54(1):130-134.

1胡召亚,张顺香.基于关键句提取的中文微博情感计算[J].阜阳师范学院学报（自然科学版）,2019,36(3):92-96. 被引量：1
2余梓彤,李晓白,赵国英.情感识别与教育[J].人工智能,2019(3):29-36. 被引量：2
3孔艺权.基于人工智能的海洋教育虚拟实验系统构建与应用[J].长春师范大学学报,2019,38(8):26-29. 被引量：1
4李凌鑫.七年级学生符号意识的培养[J].基础教育研究,2019,0(16):46-46.
5殷晓玲,夏启寿,陈晓江,何娟,陈峰.基于智能手机感知的人体运动状态深度识别[J].北京邮电大学学报,2019,42(3):43-50. 被引量：6
6谭皓,邓树文,钱涛,姬东鸿.基于表情符注意力机制的微博情感分析模型[J].计算机应用研究,2019,36(9):2647-2650. 被引量：12
7薛自华.多级离心泵轴向力及平衡鼓尺寸计算研究[J].水泵技术,2019,0(4):23-25. 被引量：3
8李超,杨艳.基于改进网中网神经网络的交通标志识别[J].信息技术,2019,43(9):137-140. 被引量：3
9左芳玲,郭迎筱.CNN算法改进及在舆情分析中的应用[J].现代信息科技,2019,3(13):23-24.
10潘晓英,赵普,赵倩.基于BLSTM和注意力机制的电商评论情感分类模型[J].计算机与数字工程,2019,47(9):2227-2232. 被引量：3

计算机技术与发展

2019年第10期

浏览历史

内容加载中请稍等...

基于深度学习算法的藏文微博情感计算研究被引量：6

参考文献5

二级参考文献33

共引文献138

同被引文献33

引证文献6

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于深度学习算法的藏文微博情感计算研究 被引量：6

参考文献5

二级参考文献33

共引文献138

同被引文献33

引证文献6

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于深度学习算法的藏文微博情感计算研究被引量：6