-
题名基于层次化的微博情绪分类——以新浪微博为例
被引量:1
- 1
-
-
作者
王向华
宋欣
-
机构
天津职业大学电子信息工程学院
-
出处
《计算机工程与设计》
北大核心
2018年第11期3431-3437,共7页
-
基金
天津市基础研究计划基金项目(14JCTPJC00553)
天津市高等学校科技发展基金计划基金项目(20130711)
-
文摘
针对当前大多微博情绪分析算法难以准确描绘不同情绪差异的问题,对中文微博的情绪成分和层次化情绪分类进行研究。预处理消除非情绪信息,引入ICTCLAS分词工具包对文章进行分割,提取形容词、名词和动词等,形成特征,使用卡方测试、词频和点互信息(PMI)对特征进行选择,运用支持向量回归(SVR)和规则集进行分类。数据集采用新浪原始中文微博,不同分组之间的实验结果验证了该方法的有效性,其在多个层次上的F测度等值优于其它同类方法,随机挑选50篇微博进行评判,近一半的结果得到所有评判员的支持。
-
关键词
微博
情绪分类
点互信息
情绪成分分析
支持向量回归
-
Keywords
micro-blog
emotion classification
point of mutual information
emotional components analysis
support vector regression
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-