基于支持向量机的微博情感分析方法研究被引量：1

Research on Weibo Sentiment Analysis Method Based on Support Vector Machine

下载PDF

导出

摘要微博是当前国内最流行的社交平台之一,微博文本的情感分析有助于进一步分析实现其媒体价值,然而,微博数据庞大且冗余性高,使得文本特征具有较高的稀疏性和局限性,在小样本数据分析上情感判断结果并不理想。因此,提出一种基于支持向量机分类模型的微博数据情感分析方法,首先通过weibo Spider爬取微博数据,进行人工标注构建微博文本数据集,然后联合优化TF-IDF算法和传统词袋,提出一种基于关键词的词袋模型,获取文本特征矩阵以解决微博文本高稀疏、高冗余的问题,最后构建高斯核的支持向量机分类器实现对微博数据的情感分析。实验结果显示,对比朴素贝叶斯、决策树等方法,提出的方法可获得较高的准确率,且在小样本数据上有明显优势。 Weibo is currently one of the most popular social platforms in China.The sentiment analysis of Weibo text is helpful for its media value.Therefore,a weibo data sentiment analysis method based on support vector machine is proposed.First,the weibo data is crawled through Weibo Spider,and the weibo text data set is constructed by manual annotation.Then,combined with TF-IDF algorithm and traditional bag of words model,a new bag of words model based on keywords is proposed to obtain the text feature matrix to solve the problem of high sparsity and high redundancy of weibo text,and finally the Gaussian kernel support vector machine method is used to perform sentiment analysis on the crawled weibo data.Compared with the methods such as naive Bayes and decision trees,the experimental results show that the method in this paper obtain a higher accuracy rate,and has obvious advantages on small sample data.

作者李首政王琪王力 Li Shouzheng;Wang Qi;Wang Li(School of Information Engineering,Nanyang Institute of Technology,Nanyang 473000;School of Civil Engineering,Nanyang Institute of Technology,Nanyang 473000)

机构地区南阳理工学院信息工程学院南阳理工学院土木工程学院

出处《现代计算机》 2022年第19期63-66,80,共5页 Modern Computer

关键词微博文本情感分析支持向量机机器学习 Weibo text sentiment analysis support vector machine machine learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1朱琳琳,徐健.网络评论情感分析关键技术及应用研究[J].情报理论与实践,2017,40(1):121-126. 被引量：25
2杨立月,王移芝.微博情感分析的情感词典构造及分析方法研究[J].计算机技术与发展,2019,29(2):13-18. 被引量：18
3杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(A02):1-6. 被引量：401
4周杰,林琛,李弼程.基于机器学习的网络新闻评论情感分类研究[J].计算机应用,2010,30(4):1011-1014. 被引量：27

二级参考文献50

1李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：93
2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
3PANG B,LEE L.Opinion mining and sentiment analysis[M].Boston:Now Publishers Inc,2008:8-10.
4HATZIVASSILOGLOU V,MCKEOWN K R.Predicting the semantic orientation of adjectives[C]// Proceedings of the 35th Annual Meeting of the Association for Computational Linguistics and 8th Conference of the European Chapter of the Association for Computational Linguistics.Madrid:ACL,1997:174-181.
5TURNEY P D.Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews[C]//Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics.Philadelphia:ACL,2002:417-424.
6KAMPS J,MARX M,MOKKEN R J,et al.Using WordNet to measure semantic orientation of adjectives[C]//Proceedings of the 4th International Conference on Language Reseurces and Evalvation.Lisbon:LREC,2004:1115-1118.
7GODBOLE N,SRINIVASAIAH M,SKIENA S.Large-seale sentiment analysis for news and blogs[C]// Proceedings of the International Conference on Weblogs and Seeial Media.Colorado:[s.n.],2007:219-222.
8YI J,NASUKAWA T,BUNESCU R C,et al.Sentiment analyzer:Extracting sentiments about a given topic using natural language processing techniques[C]// Proceedings of the 3rd IEEE International Conference on Data Mining.Florida:IEEE,2003:427-434.
9PANG B,LEE L,VAITHYANATHAN S.Thumbs up? Sentiment classification using machine learning techniques[C]// Proceedings of the Conference on Empirical Methods in Natural Language Processing.Philadelphia:[s.n.],2002:79-86.
10MULLEN T,COLLIER N.Sentiment analysis using support vector machines with diverse information sources[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing.Barcelona:NLP,2004:412-418.

共引文献467

1吴煌,杨智成,李梦华.基于长短期记忆神经网络的矿井涌水量预测[J].中国水运（下半月）,2023,23(3):25-27. 被引量：2
2姚晨明,姚磊.基于智能感知与数据决策的疏浚与通航预警系统研发[J].中国水运（下半月）,2022,22(9):35-36. 被引量：1
3孙铭,魏守科,王莹洁,赵金东,袁梅雪.基于小波分解的LSTM水质预测模型[J].计算机系统应用,2020,29(12):55-63. 被引量：11
4许昱旻,郭春.基于移动平均和神经网络的公路隧道运营通风折减率修正研究[J].现代隧道技术,2022,59(S01):121-127. 被引量：2
5秦帅波.中医知识智能诊断系统的研究[J].计算机产品与流通,2020,9(1):142-142.
6柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
7李治甫,康帅,尹俊红,王楷诚.基于深度学习的框架结构损伤识别研究[J].河南大学学报（自然科学版）,2024,54(1):100-109.
8李昌明.经验模态分解融合深度学习的时间序列预测模型[J].辽宁工程技术大学学报（自然科学版）,2022,41(2):175-183. 被引量：1
9郭小萍,钟道金,李元.基于AMSDAE-BLSTM的工业过程质量预测[J].电子测量技术,2023,46(4):19-24.
10王琪,赵文仓.基于预过滤注意力的Transformer物体检测[J].电子测量技术,2022,45(24):145-152. 被引量：1

同被引文献8

1杨立公,朱俭,汤世平.文本情感分析综述[J].计算机应用,2013,33(6):1574-1578. 被引量：123
2徐飞,徐绪堪,吴广印.基于大数据的用户阅读行为分析[J].数字图书馆论坛,2014(12):56-62. 被引量：5
3俞颖,林振通,林燕玲,邵志荣.基于词频统计的旅游出行资讯推荐[J].哈尔滨师范大学自然科学学报,2020,36(2):55-59. 被引量：1
4陈玉婵,刘威.基于情感分析的学生评教文本观点抽取与聚类[J].计算机应用,2020,40(S01):113-117. 被引量：15
5杨鑫,赵凯,马原东,杨典,杨秀璋,罗子江.基于情感分析和Word2Vec的图书推荐方法[J].图书情报导刊,2021,6(3):46-52. 被引量：4
6陈晓玲,李剑锋,付强.基于数据挖掘的文献平台用户行为分析[J].吉林大学学报（信息科学版）,2021,39(3):357-361. 被引量：4
7刘俸宇,关杰文.基于改进混合神经网络的情感分析系统[J].信息与电脑,2021,33(12):45-48. 被引量：1
8张锦,张建忠,汪飞,郭芊.海量公交数据的人群画像算法[J].国防科技大学学报,2023,45(2):55-64. 被引量：2

引证文献1

1郭丽颖,杨平.基于深度学习的评教文本提取与情感分析[J].信息技术与信息化,2024(6):135-138.

1范沛霄.基于灰色预测GM模型的公司财务预警研究[J].财讯,2020(4):97-99.
2冯忠居,朱彦名,高雪池,龙厚胜,王富春,赵瑞欣,文军强,王桂君,王政斌.基于熵权-灰关联法的岩质开挖边坡安全评价模型[J].交通运输工程学报,2020,20(2):55-65. 被引量：26
3莫玉琼.关于融媒体时代传统媒体与新媒体的协同发展的思考[J].视界观,2022(11):112-114.
4孙丽华.重塑社会治理体系中的媒介价值——南京日报建设听语热线平台的体会[J].城市党报研究,2022(10):50-53.
5谢莹庆,熊义龙,曹炳尧.基于Structured Streaming的实时文本画像系统设计与实现[J].工业控制计算机,2022,35(11):114-116.
6段春青,陈晓楠,许新勇,靳燕国.基于SPEI和信息扩散加权一阶局域法的旱涝特征分析[J].人民黄河,2022,44(9):149-154. 被引量：1
7郭妍,谢光敏,向蓓蓓,古荣龙,王磊.基于SIFT算法的人群密集检测应用研究[J].现代计算机,2022,28(19):45-50. 被引量：1
8张楠楠,邓三鸿,王昊,姚思瀚.公共卫生事件舆情的地区差异及其情感测度——以新冠肺炎疫情为例[J].情报科学,2022,40(9):123-129. 被引量：4
9王长庚,韩瑜.面向大型建筑物形变监测的图像角点检测方法[J].科学技术与工程,2022,22(30):13388-13397.

现代计算机

2022年第19期

浏览历史

内容加载中请稍等...

基于支持向量机的微博情感分析方法研究被引量：1

参考文献4

二级参考文献50

共引文献467

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于支持向量机的微博情感分析方法研究 被引量：1

参考文献4

二级参考文献50

共引文献467

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于支持向量机的微博情感分析方法研究被引量：1