期刊文献+

网页分类中特征提取方法的比较与改进 被引量:6

THE COMPARISON AND IMPROVEMENT OF FEATURE-SELECTION METHOD IN WEB PAGE CLASSIFICATION
下载PDF
导出
摘要 在传统的特征提取算法的基础上,对CHI公式做了两点改进,并结合KNN算法进行了分类测试比较,通过实验证明本文所采用的特征词提取方式,在一定程度上,能够得到较高的分类准确率,存在一定的合理性. The document, on the basis of traditional feature extraction algorithm, makes two improvements on CHI formula and makes classification testing comparison combined with KNN algorithm. It proves via experiment that the feature extraction method adopted in the document can acquire higher classification accuracy rate and certain nationality on certain degree.
出处 《山东师范大学学报(自然科学版)》 CAS 2008年第3期35-37,53,共4页 Journal of Shandong Normal University(Natural Science)
基金 泰山学者建设工程专项经费资助项目 山东省自然科学基金重大项目(Z2004G02)
关键词 特征提取 χ^2 文本分类 feature extraction χ^2 web classification
  • 相关文献

参考文献6

二级参考文献30

  • 1宋枫溪,郑如冰,王积忠.自动文本分类中两种文本表示方式的比较[J].计算机工程,2004,30(18):124-126. 被引量:6
  • 2李文斌,刘椿年,陈嶷瑛.基于特征信息增益权重的文本分类算法[J].北京工业大学学报,2006,32(5):456-460. 被引量:19
  • 3柳伯超,秦茂玲,刘弘.基于遗传算法的多约束背包问题求解方案[J].山东师范大学学报(自然科学版),2007,22(1):19-22. 被引量:8
  • 4Yang Yiming,Pedersen J O.A comparative study on feature selection in text categorization[C]//Proc of the 14th International Conference on Machine Learning ICML97,1997:412-420.
  • 5Karypis G,Han E.Fast supervised dimensionality reduction algorithm with applications to document categorization and retrieval[C]// Proc of the 9th ACM International Conference on Information and Knowledge Management CIKM-00.New York,US:ACM Press,2000: 228-233.
  • 6Baker L D,McCallum A K.Distributional clustering of words for text classification[C]//Proc of the 21st Annual International ACM SIGIR, 1998 :96-103.
  • 7谭松波语料库[DB/OL].http://lcc.software.ict.ac.cn/-tansongbo/corpusl.php.
  • 8Jolliffe I T.Principal component analysis[M].New York:Spriger Verlag, 1986.
  • 9Martinez A M,Kak A C.PCA versus LDA[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,23(2):228-233.
  • 10D. D. Lewis. Naive (Bayes) at forty: The independence assumption in information retrieval. In: Proc. of the 10th European Conf. on Machine Learning. New York: Springer,1998, 4-15.

共引文献162

同被引文献64

引证文献6

二级引证文献13

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部