-
题名一种基于朴素贝叶斯的微博情感分类
被引量:44
- 1
-
-
作者
林江豪
阳爱民
周咏梅
陈锦
蔡泽键
-
机构
广东外语外贸大学国际工商管理学院
广东外语外贸大学思科信息学院
广东外语外贸大学英语语言文化学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2012年第9期160-165,共6页
-
基金
国家社科基金资助项目(12BYY045)
教育部人文社会科学研究青年资助项目(10YJCZH247)
+2 种基金
广东省科技计划资助项目(2010B031000014)
广东外语外贸大学研究生科研创新资助项目
广东外语外贸大学大学生创新实验资助项目
-
文摘
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。
-
关键词
微博
文本情感分类
二次情感特征提取
朴素贝叶斯
-
Keywords
microblog
text sentiment classification
twice sentiment feature extraction
naive Bayesian
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-