期刊文献+

基于粗糙集的KNN的WEB文本分类的研究

下载PDF
导出
摘要 随着Internet的飞速发展,Web信息资源的不断丰富,由于%80以上的Web信息是以文本的形式存在的,因此Web文本挖掘显得尤为重要。利用文本分类技术可以对大量文档进行快速、有效地自动分类。帮助用户快速、准确的找到所需要的信息。本文提出了把粗糙集作为预处理,对决策表的属性约简,然后再采用KNN进行分类,提高了准确率和查全率。
出处 《数字技术与应用》 2011年第8期55-55,57,共2页 Digital Technology & Application
基金 佳木斯大学科研课题资助项目(L2009-143)
  • 相关文献

参考文献1

二级参考文献8

  • 1崔林,付克明,石生树,宋瀚涛.基于Boosting机制的Naive Bayesian文本分类器[J].计算机工程与应用,2005,41(8):31-33. 被引量:3
  • 2Chia-Hui Chang, Mohammed Kayed, Moheb Ramzy Girgis. A survey of web information extraction systems[J].IEEE Transactions on Knowledge and Data Engineering,2006,18(10): 1411- 1428.
  • 3Laender A H F, Ribeiro-Neto B A, Silva A S da, et al. A brief survey of web data extraction tools[J].SIGMOD Record,2002,31 (2):84-93.
  • 4Wang Zi-Qiang,Stm Xia,Zhang De-Xian,et al.An optimal SVM- Based Text Classification Algorithm [C]. International Conference on Machine Leaming and Cybernetics, 2006:1378-1381.
  • 5Lewis D D. Naive (Bayes) at forty: The independence assumption in information retrieval[C].Chemnitz, Germany: Proceedings of 10th European Conference on Machine Learning, 1998.
  • 6范焱,郑诚,王清毅,蔡庆生,刘洁.用Naive Bayes方法协调分类Web网页[J].软件学报,2001,12(9):1386-1392. 被引量:53
  • 7肖江,张亚非.Boosting算法在文本自动分类中的应用[J].解放军理工大学学报(自然科学版),2003,4(2):25-28. 被引量:7
  • 8李杨,曾海泉,刘庆华,胡运发.基于kNN的快速WEB文档分类[J].小型微型计算机系统,2004,25(4):725-729. 被引量:13

共引文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部