期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
不平衡数据集下特征词两面性的新型降维算法 被引量:1
1
作者 付鑫 王洪国 +1 位作者 邵增珍 杜秋霞 《计算机应用研究》 CSCD 北大核心 2018年第7期1947-1949,1969,共4页
传统DFS特征选择算法在降维处理时既未考虑样本分布不均的情况,又未涉及负特征词对类别的影响。综合考虑DFS的缺陷并进行优化处理,将DFS与卡方检测算法CHI结合,提出一种改进型特征选择算法DFS-sCHI。引入负特证词作为类别划分的影响因... 传统DFS特征选择算法在降维处理时既未考虑样本分布不均的情况,又未涉及负特征词对类别的影响。综合考虑DFS的缺陷并进行优化处理,将DFS与卡方检测算法CHI结合,提出一种改进型特征选择算法DFS-sCHI。引入负特证词作为类别划分的影响因子之一,解决不平衡数据集下所提特征词类别分布不均的问题。经实验分析,不平衡数据集下,DFS-sCHI相比较于DFS在分类精度上有明显提高。 展开更多
关键词 不平衡数据集 文本分类 特征选择 DFS-sCHI
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部