-
题名面向非平衡文本情感分类的TSF特征选择方法
被引量:6
- 1
-
-
作者
王杰
李德玉
王素格
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2016年第10期206-210,224,共6页
-
基金
国家自然科学基金项目(61175067
61272095
+5 种基金
61573231
61432011
U1435212)
国家"863"高技术研究发展计划基金项目(2015AA015407)
山西省回国留学人员科研项目(2013-014)
山西省科技基础条件平台计划项目(2015091001-0102)资助
-
文摘
非平衡数据中样本数量的不平衡分布往往伴随着特征分布的不平衡,在多数类文本中经常出现的特征,在少数类中却很少出现。针对非平衡数据特征分布的特点,提出了一种新的双边fisher特征选择算法TSF。该方法通过显式地组合正相关和负相关特征,缓解了特征层面的非平衡性,较好地表示了文本的信息。TSF方法在图书评论和COAE2014微博非平衡数据上进行实验,结果验证了该方法是可行的。
-
关键词
非平衡
文本情感分类
正负相关特征
双边特征选择
-
Keywords
Imbalanced, Text sentiment classification, Positive and negative feature, Two-side feature selection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-