期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于修正G^2特征筛选的中文微博情感组合分类 被引量:3
1
作者 杜亚楠 刘业政 《情报学报》 CSSCI 北大核心 2016年第4期349-357,共9页
新词的涌现、热词的漂移、海量碎片化及中文常用词特性带来的高维稀疏性成为中文微博情感分类的主要困难。本文提出了一种新颖的方法用以解决上述问题:构造表情符号词典用来自动获取微博的情感标签,解决海量微博数据标注的问题;引入修正... 新词的涌现、热词的漂移、海量碎片化及中文常用词特性带来的高维稀疏性成为中文微博情感分类的主要困难。本文提出了一种新颖的方法用以解决上述问题:构造表情符号词典用来自动获取微博的情感标签,解决海量微博数据标注的问题;引入修正的G^2检验进行特征筛选,进行降维,控制稀疏性;采用多阶段判断的抽样策略保证基分类器的多样性,最后采用加权多数投票的方式对基分类器结果进行融合,解决特征和情感漂移及碎片化问题。实验表明本文方法可以快速有效的获取训练标签,保留下强区分能力的特征,并实现较高的精度,在中文微博情感分类上是一个有竞争力的方法。 展开更多
关键词 表情符号词典 修正G2检验 多阶段判断抽样 加权多数投票合分类器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部