期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于最大边缘相关的特征选择方法 被引量:9
1
作者 刘赫 张相洪 +2 位作者 刘大有 李燕军 尹立军 《计算机研究与发展》 EI CSCD 北大核心 2012年第2期354-360,共7页
文本分类的特点是高维的特征空间和高度的特征冗余.针对这两个特点,采用χ2统计量处理高维的特征空间,利用信息新颖度的思想处理高度的特征冗余,根据最大边缘相关的定义,将二者有机结合,提出一种基于最大边缘相关的特征选择方法.该方法... 文本分类的特点是高维的特征空间和高度的特征冗余.针对这两个特点,采用χ2统计量处理高维的特征空间,利用信息新颖度的思想处理高度的特征冗余,根据最大边缘相关的定义,将二者有机结合,提出一种基于最大边缘相关的特征选择方法.该方法可以在特征选择过程中减少大量的冗余特征.最后,在Reuters-21578Top10和OHSCAL两个文本数据集上进行实验.实验结果表明,基于最大边缘相关的特征选择方法比χ2统计量和信息增益两种特征选择方法更高效,并且能够提高nave Bayes,Rocchio和kNN 3种不同分类器的性能. 展开更多
关键词 文本分类 特征选择 最大边缘相关 CHI 信息新颖度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部