基于双语词典的微博多类情感分析方法被引量：32

A Bilingual Lexicon-Based Multi-class Semantic Orientation Analysis for Microblogs

下载PDF

导出

摘要现有微博文本情感分析方法多面向单一语种语料,如:中文语料.但是,中英文搭配使用的表达习惯已逐渐成为个体意见表达的重要形式.本文提出一种基于双语词典的多类情感分析方法,通过构建双语多类情感词典对微博文本进行多分类语义倾向性分析,以便更准确有效捕捉群体意见,及时发现社会舆论倾向.通过与多数投票算法、支持向量机算法、基于余弦距离的K近邻分类算法相比,本文提出的基于双语词典的多类情感分析模型具有良好的分类效果,其在分类准确率、F1值等方面都有明显提高. Most of the existing Weibo sentiment analysis focuses on monolingual corpus like Chinese. However,a mixed use of Chinese and English becomes a popular form of expression. To better capture the social attention on public events,this paper proposes a bilingual lexicon based multi-class semantic orientation analysis for bilingual microblogs. We compare our proposed methodologies with majority vote,support vector machine（ SVM） and K-nearest neighbor（ KNN）by using cosine similarity which are competitive baseline methods. The experimental results showthat our proposed methods outperform the three approaches we mentioned in terms of the accuracy and F1 score.

作者栗雨晴礼欣韩煦宋丹丹廖乐健

机构地区北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心

出处《电子学报》 EI CAS CSCD 北大核心 2016年第9期2068-2073,共6页 Acta Electronica Sinica

基金国家重点基础研究发展规划(973计划)项目(No.2013CB329605) 国家自然科学基金(No.61300178)

关键词双语语义倾向性分析半监督高斯混合模型相对熵情感词典 bilingual semantic orientation analysis semi-supervised gaussian mixture model（Semi-GMM） Kull back-Leibler divergence sentiment lexicon

分类号 TP391 [自动化与计算机技术—计算机应用技术] H085.5 [语言文字—语言学]

引文网络
相关文献

参考文献11

1Melville P,Gryc W,Lawrence R D.Sentiment analysis of blogs by combining lexical knowledge with text classification[A] .Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C] .New York:ACM SIGKDD Explorations Newsletter,2009.1275-1284.
2Wan X.Bilingual co-training for sentiment classification of Chinese product reviews[J] .Computational Linguistics,2011,37(3):587-616.
3Meng X,Wei F,Liu X,et al.Cross-lingual mixture model for sentiment classification[A] .Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics:Long Papers-Volume 1[C] .Stroudsburg:Association for Computational Linguistics,2012.572-581.
4Pang B,Lee L.Opinion mining and sentiment analysis[J] .Foundations and Trends in Information Retrieval,2008,2(1-2):1-135.
5Li Y,Li X,Li F,et al.A lexicon-based multi-class semantic orientation analysis for microblogs[A] .Web Technologies and Applications[C] .Cham:Springer International Publishing,2014.81-92.
6Dong Z,Dong Q.HowNet and the Computation of Meaning[M] .Singapore:World Scientific,2006.
7Miller G A.WordNet:a lexical database for English[J] .Communications of the ACM,1995,38(11):39-41.
8Hu M,Liu B.Opinion extraction and summarization on the web[A] .Proceedings of the 21st National Conference on Artificial Intelligence(AAAI 2006)[C] .California:AAAI Press,2006.1621-1624.
9Zhu Y L,Min J,Zhou Y,et al.Semantic orientation computing based on HowNet[J] .Journal of Chinese Information Processing,2006,20(1):14-20.
10Chen J,Xue N,Palmer M S.Using a smoothing maximum entropy model for Chinese nominal entity tagging[A] .Natural Language Processing-IJCNLP 2004[C] .Heidelberg:Springer-Verlag Berlin Heidelberg,2004.493-499.

同被引文献301

1王杨,许闪闪,李昌,艾世成,张卫东,甄磊,孟丹.基于支持向量机的中文极短文本分类模型[J].计算机应用研究,2020,37(2):347-350. 被引量：30
2Yong Bie,Yan Yang.A Multitask Multiview Neural Network for End-to-End Aspect-Based Sentiment Analysis[J].Big Data Mining and Analytics,2021,4(3):195-207. 被引量：5
3郑冬冬,赵朋朋,崔志明.Deep Web爬虫研究与设计[J].清华大学学报（自然科学版）,2005,45(S1):1896-1902. 被引量：28
4方美玉,郑小林,陈德人,华艺,施艳.商品评论聚焦爬虫算法设计与实现[J].吉林大学学报（工学版）,2012,42(S1):377-381. 被引量：10
5张珊,于留宝,胡长军.基于表情图片与情感词的中文微博情感分析[J].计算机科学,2012,39(S3):146-148. 被引量：55
6阳锋,冯时,王琳,李任斐,王大玲,于戈.MICA:一个面向微博数据流的观点挖掘原型系统[J].计算机研究与发展,2011,48(S3):405-409. 被引量：6
7闫明松,周志华.代价敏感分类算法的实验比较[J].模式识别与人工智能,2005,18(5):628-635. 被引量：14
8曲成义.网络突发事件的应急对策与治理环境的建设[J].信息化建设,2005(10):14-15. 被引量：7
9孟涛,王继民,闫宏飞.网页变化与增量搜集技术[J].软件学报,2006,17(5):1051-1067. 被引量：22
10徐晓日.网络舆情事件的应急处理研究[J].华北电力大学学报（社会科学版）,2007(1):89-93. 被引量：141

引证文献32

1敦欣卉,张云秋,杨铠西.基于微博的细粒度情感分析[J].数据分析与知识发现,2017,1(7):61-72. 被引量：27
2ZHANG Yangsen,ZHANG Yaorong,JIANG Yuru,HUANG Gaijuan.Multi-feature-Based Subjective-Sentence Classification Method for Chinese Micro-blogs[J].Chinese Journal of Electronics,2017,26(6):1111-1117. 被引量：2
3张仰森,郑佳,黄改娟,蒋玉茹.基于双重注意力模型的微博情感分析方法[J].清华大学学报（自然科学版）,2018,58(2):122-130. 被引量：49
4陈志雄,王时绘,高榕.基于情感倾向性分析的微博意见领袖识别模型[J].计算机科学,2018,45(5):168-175. 被引量：9
5郝苗苗,徐秀娟,于红,赵小薇,许真珍.基于中文微博的情绪分类与预测算法[J].计算机应用,2018,38(A02):89-96. 被引量：16
6洪巍,李敏.文本情感分析方法研究综述[J].计算机工程与科学,2019,41(4):750-757. 被引量：87
7蔡晨,罗可.融合BTM和图论的微博检索模型[J].计算机工程与科学,2019,41(8):1512-1518. 被引量：2
8徐善山.基于领域词典和机器学习的影评情感分析[J].电脑知识与技术,2019,15(8Z):222-223. 被引量：1
9段立,徐鸿宇,王懿,赵莉,刘冲,郭娇.基于word2vec和XGBoost相结合的国网95598客服投诉工单分类[J].电力大数据,2019,22(12):50-57. 被引量：5
10翟社平,杨媛媛,邱程,李婧,毋志云.基于注意力机制Bi-LSTM算法的双语文本情感分析[J].计算机应用与软件,2019,36(12):251-255. 被引量：19

二级引证文献414

1陈欣,杨小兵,姚雨虹.基于BLSTM算法和字词融合的文本情感分类方法[J].中国计量大学学报,2020(2):225-232. 被引量：3
2杨捷,范美位,罗成臣,张思路.面向电力工单文本的服务失误识别[J].云南大学学报（自然科学版）,2020,42(S02):32-37. 被引量：1
3尹朝.基于内容生成与特征提取的图像情感识别模型研究[J].系统仿真技术,2023,19(2):141-147.
4彭凡会.美食类短视频弹幕中用户情感体验分析——基于B站美食短视频账号“绵羊料理”的文本分析[J].新媒体研究,2023,9(6):28-32. 被引量：2
5池亚平,岳梓岩,赵伦.密码算法识别技术研究进展与展望[J].北京电子科技学院学报,2022,30(4):1-14.
6杨倩,刁雅静,李家明,葛世伦.基于弹幕的参与式网站用户交互体验研究[J].知识管理论坛,2022(4):417-430. 被引量：1
7江进德,张玉可.皖北乡村旅游的情感特征及其影响因素分析[J].商丘师范学院学报,2023,39(6):64-69.
8张剑,张立杰.新时代媒体舆论引导下网络语言信息传播耗损及构建研究[J].情报科学,2022,40(8):71-75.
9包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：5
10程艳,朱海,项国雄,唐天伟,钟林辉,王国玮.融合CNN和EWC算法的不平衡文本情绪分类方法[J].中文信息学报,2020(4):92-100. 被引量：5

1巧用拼接,搞定微博多图上传[J].网友世界,2011(15):47-47.
2魏萌,杨文涛.基于关键词的微博热点话题实时检测方法[J].计算机与现代化,2013(10):184-187.
3彭敦运.博客上的专题品评[J].中国信息技术教育,2013(7):31-31.
4有备无患导出好友资料[J].电脑爱好者（普及版）,2011(A01):221-221.
5应用橱窗[J].计算机应用文摘,2012(10):70-70.
6流言.老徐博客,还能“博”多久?[J].电脑爱好者,2006,0(13):112-112.
7刘伟朋,陈雁翔,孙晓.基于表情符号的中文微博多维情感分类的研究[J].合肥工业大学学报（自然科学版）,2014,37(7):803-807. 被引量：11
8陈瑜.跳动的键盘:网络语言[J].青少年犯罪问题,2005(1):72-74. 被引量：4
9叶川,马静.多媒体微博评论信息的主题发现算法研究[J].现代图书情报技术,2015(11):51-59. 被引量：9
10张超,汪龙庆.微博多领域情感分析系统研究与实现[J].软件工程,2017,20(1):49-54.

电子学报

2016年第9期

浏览历史

内容加载中请稍等...

基于双语词典的微博多类情感分析方法被引量：32

参考文献11

同被引文献301

引证文献32

二级引证文献414

相关作者

相关机构

相关主题

浏览历史

基于双语词典的微博多类情感分析方法 被引量：32

参考文献11

同被引文献301

引证文献32

二级引证文献414

相关作者

相关机构

相关主题

浏览历史

基于双语词典的微博多类情感分析方法被引量：32