基于变分自编码的半监督微博文本情感分析被引量：2

SENTIMENT ANALYSIS OF SEMI-SUPERVISED WEIBO TEXT BASED ON VARIATIONAL SELF-ENCODING

下载PDF

导出

摘要针对微博文本情感分析中大量有标记数据难获取,以及文本特征学习不完全的问题,提出将长短时记忆网络(Long Short-Term Memory,LSTM)及其衍生模型双向长短时记忆网络(Bi-LSTM)引入变分自编码生成模型,构建基于变分自编码的半监督文本分类模型。其中LSTM作为变分编码器中的编码器和解码器,Bi-LSTM作为分类器。分类器既为编码器提供标签信息共同生成隐变量,也与隐变量通过解码器共同重构数据,利用无标记数据的有用信息提高分类器的性能。与其他方法在同一公开数据集上对比的实验结果表明,该模型的分类效果更好。 Aiming at the problems of large amounts of labeled data in the sentiment analysis of Weibo text and incomplete learning of the text features,the Long-short-term memory network(LSTM)and its derivative model Bi-long-short-term memory network(Bi-LSTM)were introduced into the variational auto-encoding generation.In the model,a semi-supervised text classification model based on variational self-encoding is constructed.Among them,LSTM was used as the encoder and decoder in the variational encoder,and Bi-LSTM was used as the classifier;the classifier not only provided the label information for the encoder to jointly generate the hidden variable,but also reconstructed the data together with the hidden variable through the decoder.Using the useful information of unlabeled data to improve the performance of the classifier.Compared with other methods on the same open dataset,the experimental results show that the classification effect of this model is better.

作者韩萍刘爽贾云飞孙佳慧 Han Ping;Liu Shuang;Jia Yunfei;Sun Jiahui(School of Electronic Information and Automation,China Civil Aviation University,Tianjin 300300,China;School of Computer Science and Technology,China Civil Aviation University,Tianjin 300300,China;Basic Laboratory Center,China Civil Aviation University,Tianjin 300300,China)

机构地区中国民航大学电子信息与自动化学院中国民航大学计算机科学与技术学院中国民航大学基础实验中心

出处《计算机应用与软件》北大核心 2021年第12期280-285,共6页 Computer Applications and Software

基金民航安全能力建设项目(20600418) 中国民航大学中央高校基本科研业务费专业项目(3122019114)。

关键词微博文本情感分析变分自编码 Weibo text Sentiment analysis Variational self-encoding

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献11

1李卫疆,伊靖.基于扩展特征矩阵和双层卷积神经网络的微博文本情感分类[J].计算机应用与软件,2019,36(12):150-155. 被引量：7
2张仰森,郑佳,黄改娟,蒋玉茹.基于双重注意力模型的微博情感分析方法[J].清华大学学报（自然科学版）,2018,58(2):122-130. 被引量：49
3罗毅,李利,谭松波,程学旗.基于中文微博语料的情感倾向性分析[J].山东大学学报（理学版）,2014,49(11):1-7. 被引量：11
4刘龙飞,杨亮,张绍武,林鸿飞.基于卷积神经网络的微博情感倾向性分析[J].中文信息学报,2015,29(6):159-165. 被引量：97
5王文凯,王黎明,柴玉梅.基于卷积神经网络和Tree-LSTM的微博情感分析[J].计算机应用研究,2019,36(5):1371-1375. 被引量：16
6黄贤英,刘广峰,刘小洋,阳安志.基于word2vec和双向LSTM的情感分类深度模型[J].计算机应用研究,2019,36(12):3583-3587. 被引量：44
7韩旭丽,曾碧卿,曾锋,张敏,商齐.基于词嵌入辅助机制的情感分析[J].计算机科学,2019,46(10):258-264. 被引量：5
8朱玺,董喜双,关毅,刘志广.基于半监督学习的微博情感倾向性分析[J].山东大学学报（理学版）,2014,49(11):37-42. 被引量：6
9成天英,王茜,袁丁.基于几何邻居的半监督节点分类[J].计算机应用研究,2020,37(9):2595-2599. 被引量：2
10韩晴晴,张艳梅,牛娃.基于半监督协同训练算法的微博水军识别[J].计算机科学,2019,46(11):202-208. 被引量：4

二级参考文献71

1王根,赵军.基于多重标记CRF句子情感分析的研究[C]//全国第九届计算机语言学学术会议论文集.大连:[出版者不详],2007.
2DAVIDOV D, TSUR O, RAPPOPORT A. Enhanced sentiment learning using Twitter hashtags and smileys[C]//Proceedings of the 23rd International Conference on Computational Linguistics.Beijing: Tsinghua University Press, 2010:241-249.
3BARBOSA L, FENG J. Robust sentiment detection on Twitter from biased and noisy data[C]//Proceedings of the 23rd International Conference on Computational Linguistics.Beijing:Tsinghua University Press, 2010:36-44.
4HASSAN A, QAZVINIAN V, RADEV D. What's with the attitude? Identifying sentences with attitude in online discussions[C]//Proceedings of 2010 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA, USA: Association for Computational Linguistics, 2010:1245-1255.
5MEENA A, PRABHAKAR T, AMATI G, et al. Sentence level sentiment analysis in the presence of conjuncts using linguistic analysis[C]//Advances in Information Retrieval. Heidelberg: Springer Berlin, 2007:573-580.
6TURNEY P D. Thumbs up or thumbs down? semantic orientation applied to unsupervised classification of reviews[C]//Proceedings of 40th Annual Meeting of the Association for Computational Linguistics. Somerset: ACL, 2002:417-424.
7SOCHER R, PENNINGTON J, HUANG E H, et al. Semi-supervised recursive auto-encoders for predicting sentiment distributions[C]//Proceedings of 2011 Conference on Empirical Methods in Natural Language Processing. [S.l.]:[s.n.], 2011: 151-161.
8TAN Chenhao, LEE Lilian, TANG Jie, et al. User-level sentiment analysis incorporating social networks[C]//Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2011:1397-1405.
9LI Shoushan, WANG Zhongqing, ZHOU Guodong, et al. Semi-supervised learning for imbalanced sentiment classification[C]//Proceedings of the 22nd International Joint Conference on Artificial Intelligence. [s.l.]: AAAI Press, 2011:1826-1831.
10Iadh Ounis, Craig Macdonald, Ian Soboroff. Overview of the TREC 2010 BlogTrack[C]//Proceedings of the 19th Text REtrieval Conference Proceedings (TREC 2010). NIST, 2010.

共引文献228

1陈欣,杨小兵,姚雨虹.基于BLSTM算法和字词融合的文本情感分类方法[J].中国计量大学学报,2020(2):225-232. 被引量：3
2刘建友.基于神经网络的搜索引擎模型构建研究[J].网络安全技术与应用,2020,0(2):39-40.
3汪文隽,王亦天,操玮,任思儒.基于多模态投资者情绪数据的USD/CNY汇率波动率预测研究[J].计算机应用研究,2020,37(S02):152-155. 被引量：2
4罗枭.基于深度学习的自然语言处理研究综述[J].智能计算机与应用,2020(4):133-137. 被引量：14
5卢辉鸿,马平,王肖.基于BERT-CLS-ATT模型的虚拟主播评论情感分类算法[J].中国人民公安大学学报（自然科学版）,2024,30(1):74-80.
6李杰,朱美红.地奥心血康在内科的应用[J].医药导报,2000,19(1):76-77.
7欧阳焱,刘光大,杨昌智.空调水泵节能运行设计探讨[J].工程设计与研究（长沙）,2000(1):25-28. 被引量：1
8张礼星,唐湘华,唐胜,章克昌.里氏木霉纤维素酶在大曲酒丢糟中的应用[J].酿酒科技,2000(3):52-53. 被引量：12
9闫龙川,白东霞,刘万涛,刘殷,李莉敏.人工智能技术在云计算数据中心能量管理中的应用与展望[J].中国电机工程学报,2019,39(1):31-42. 被引量：37
10秦胜君.基于稀疏自动编码器的微博情感分类应用研究[J].广西科技大学学报,2015,26(3):36-40. 被引量：3

同被引文献10

1黄仁,张卫.基于word2vec的互联网商品评论情感倾向研究[J].计算机科学,2016,43(S1):387-389. 被引量：51
2欧莉莉,邵峰晶,孙仁诚,隋毅.基于半监督方法的脑梗死图像识别[J].计算机应用,2021,41(4):1221-1226. 被引量：3
3潘芳,张会兵,董俊超.基于激活-池化增强BERT模型的在线课程评论情感分析[J].计算机应用与软件,2021,38(5):183-189. 被引量：9
4胡明玉,夏雪,杨晨雪,曹景军,柴秀娟.基于深度学习的半监督图像标注系统设计与实现[J].中国农业大学学报,2021,26(5):153-162. 被引量：1
5蔡玉舒,曹扬,江维,詹瑾瑜,李响,杨瑞.基于BERT的端到端旅游评论意见挖掘方法[J].计算机技术与发展,2021,31(9):118-123. 被引量：2
6吴洁,张师天,谢海滨,杨光.基于多影像中心磁共振成像数据的半监督膝盖异常分类[J].计算机应用,2022,42(1):316-324. 被引量：1
7徐康庭,宋威.结合语言知识和深度学习的中文文本情感分析方法[J].大数据,2022,8(3):115-127. 被引量：5
8李博,李洪莲,关青,刘杨.基于CNN-BiLSTM-HAN混合神经网络的高校图书馆社交网络平台细粒度情感分析[J].农业图书情报学报,2022,34(4):63-73. 被引量：4
9林佳瑞,程志刚,韩宇,尹云鹏.基于BERT预训练模型的灾害推文分类方法[J].图学学报,2022,43(3):530-536. 被引量：6
10Bandar Alghamdi,Fahad Alharby.An Intelligent Model for Online Recruitment Fraud Detection[J].Journal of Information Security,2019,10(3):155-176. 被引量：2

引证文献2

1闫晓然,向徐.一种基于ERNIE-CNN模型的条件式情感分类方法[J].电信技术研究,2022(2):34-42.
2王瑞琪,纪淑娟,曹宁,郭亚杰.基于一致性训练的半监督虚假招聘广告检测模型[J].计算机应用,2023,43(9):2932-2939. 被引量：2

二级引证文献2

1陈龙伟,周小成,李传昕,林华章,王永荣,崔永红.基于UNet-ResNet14^(*)半监督学习的无人机影像森林树种分类[J].农业工程学报,2024,40(1):217-226. 被引量：1
2张帅华,张淑芬,周明川,徐超,陈学斌.基于半监督联邦学习的恶意流量检测模型[J].计算机应用,2024,44(11):3487-3494.

1黄琼男,朱卫纲,李永刚.基于GAN的SAR数据扩充研究综述[J].兵器装备工程学报,2021,42(11):31-38. 被引量：8
2汪美琴,袁伟伟,张继业.生成对抗网络GAN的研究综述[J].计算机工程与设计,2021,42(12):3389-3395. 被引量：23
3翁列恩,胡税根.公共服务质量:分析框架与路径优化[J].中国社会科学,2021(11):31-53. 被引量：45
4杨凯,于鑫洋,蓬勃,韩雪,陈铭.基于GARCH模型的高频金融数据的量价分析[J].吉林师范大学学报（自然科学版）,2021,42(4):26-30. 被引量：2
5谢小凤,周宗放.基于回购担保的供应链上关联信用风险传染及外溢效应[J].管理评论,2021,33(9):304-314. 被引量：4

计算机应用与软件

2021年第12期

浏览历史

内容加载中请稍等...

基于变分自编码的半监督微博文本情感分析被引量：2

参考文献11

二级参考文献71

共引文献228

同被引文献10

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于变分自编码的半监督微博文本情感分析 被引量：2

参考文献11

二级参考文献71

共引文献228

同被引文献10

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于变分自编码的半监督微博文本情感分析被引量：2