期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于区分能力的多类不平衡文本分类特征选择方法 被引量:7
1
作者 张延祥 潘海侠 《中文信息学报》 CSCD 北大核心 2015年第4期111-119,共9页
文本分类中的不平衡数据问题在现实应用中比较普遍。传统的特征选择方法在不平衡问题上倾向于多数类而忽略稀有类。针对这种倾向性该文提出了一种主导性分析量化方法,并基于对该方法的优化提出了一种基于类别区分能力的特征选择方法,即D... 文本分类中的不平衡数据问题在现实应用中比较普遍。传统的特征选择方法在不平衡问题上倾向于多数类而忽略稀有类。针对这种倾向性该文提出了一种主导性分析量化方法,并基于对该方法的优化提出了一种基于类别区分能力的特征选择方法,即DA(Discriminative Ability)方法,该方法使用文档概率的最小绝对值差作为评分标准,一定程度上保证了特征选择在稀有类与多数类上的公平性。实验表明,DA优于CHI、IG、DFICF,尤其在F1宏平均指标上,DA在不平衡问题上能够取得更好的降维效果。 展开更多
关键词 文本分类 不平衡问题 特征选择 主导性分析 区分能力
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部