期刊文献+

基于互信息和粗糙集理论的特征选择 被引量:9

Feature Selection Based on Mutual Information and Rough Set Theory
下载PDF
导出
摘要 针对互信息方法在精度方面的不足,通过引入粗糙集,给出一种基于关系积理论的属性约简算法,以此为基础提出一个适用于海量文本数据集的特征选择方法。该方法采用互信息进行特征初选,利用提出的属性约简算法消除冗余,获得较具代表性的特征子集。实验结果表明,该特征选择方法能获得冗余度小且较具代表性的特征子集。 Feature selection is research hotspot in text automatic categorization. Mutual Information(MI) is analyzed. And according to deficiency of MI, Rough Set(RS) is introduced and an attribute reduction algorithm based on relation union theory is proposed. A feature selection method based on MI and the proposed attribute reduction algorithm is presented, and it is suitable for massive text data sets. The method uses MI to select features, and employs the proposed attribute reduction algorithm to eliminate redundancy, so it can acquire the feature subsets which are more representative. Experimental results show that the method is promising.
出处 《计算机工程》 CAS CSCD 北大核心 2011年第15期181-183,共3页 Computer Engineering
基金 河南省基础与前沿技术研究计划基金资助项目(102300410266) 郑州轻工业学院博士科研基金资助项目
关键词 特征选择 互信息 粗糙集 关系积理论 属性约简 feature selection Mutual Information(MI) Rough Set(RS) relation union theory attribute reduction
  • 相关文献

参考文献7

二级参考文献13

共引文献25

同被引文献74

引证文献9

二级引证文献26

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部