期刊文献+

基于相对文档频的平衡信息增益降维方法 被引量:3

Feature Reduction Based on Relative Document Frequency Balance Information Gain
下载PDF
导出
摘要 针对文本分类中信息增益降维方法的不足,提出了一种基于相对文档频的平衡信息增益(RDFBIG)降维方法.实验结果表明,RDFBIG能有效消除不同类别之间语料规模对分类精度的影响,取得了较好的分类效果. To overcome the shortage of information gain in text categorization, this paper proposes a method of feature reduction based on the relative document frequency balance information gain (RDFBIG). Experimental results show that RDFBIG can effectively eliminate the impact of corpus scale in different classes, and achieve better results in text categorization.
出处 《江西理工大学学报》 CAS 2008年第5期68-71,共4页 Journal of Jiangxi University of Science and Technology
关键词 相对文档频 特征降维 信息增益 文本分类 relative document frequency feature reduction information gain text categorization
  • 相关文献

参考文献8

二级参考文献113

共引文献179

同被引文献20

  • 1徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量:56
  • 2申红,吕宝粮,内山将夫,井佐原均.文本分类的特征提取方法比较与改进[J].计算机仿真,2006,23(3):222-224. 被引量:28
  • 3李文斌,刘椿年,陈嶷瑛.基于特征信息增益权重的文本分类算法[J].北京工业大学学报,2006,32(5):456-460. 被引量:19
  • 4YANG Yiming. A comparative study on feature selection in text categorization[ C/OL]// Proceedings of the Fourteenth International Conference on Machine Learning, 1997: 412-420. [2009-04-20], http://www. cs. cmu. edu/- yiming/papers. yy/icm197. ps. gz.
  • 5Fabrizio Sebastiani.Machine Leaning in Automated Text Categorization[J].ACM Computing Surverys,2002,34(1):1-47.
  • 6Yang Yiming,Pedersen J 0.A comparative study on feature selection intext categorization [C] //Proc of the 14th International Conference onMachine Learning ICML97,1997:412-420.
  • 7Forman G.An extensive empirical study of feature selection metrics fortext classification[J].Journal of Machine Learning Research,2003,3:1289-1305.
  • 8谭松波,王月粉.中文文本分类语料库-TanCOrpV1.0[EB/OL].(2007-04-01).
  • 9Weka 数据挖掘开源平台[EB/OL].http://www.cs.waikato.ac.nz/ml/weka/.
  • 10刘海峰,王元元,张学仁,刘守生.基于散度差准则的文本特征降维研究[J].计算机应用研究,2008,25(7):1971-1973. 被引量:5

引证文献3

二级引证文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部