期刊文献+

一种新的Web分类方法

A New Cassification Method of Web Page
下载PDF
导出
摘要 Web文档分类是Web挖掘中最基本的技术之一,而构造一个按照兴趣分类的分类器,需要做大量的预处理工作,来收集正负的训练样例。但负例的收集是非常困难的。文章提出了一个只有正例没有负例的学习模型。该模型主要是重复执行SVM。实验表明,该学习模型对于Web文档分类的分类精度和速度都是非常理想的。 Web page classification is one of the basic techniques for Web mining. However, to collecting positive and negative training examples, constructing a classifier for an interesting calss requires laborious preprocessing. But collecting negative examples is very diffcult. In this paper , a modle with positive examples, is brought forward without negative. The modle outperforms mainly SVM. The experiments show that this modle is very ideal for precision and speed of Web page classification.
出处 《微计算机应用》 2005年第4期432-435,共4页 Microcomputer Applications
关键词 分类方法 文档分类 学习模型 WEB挖掘 分类精度 分类器 预处理 SVM 收集 Web page classification , Documentg classification, Learning modle without negative examples, SVM
  • 相关文献

参考文献6

  • 1范明 孟小峰.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
  • 2(美)Geoge E Luger著,史忠植、张银奎等译[M].人工智能复杂问题求解的结构和策略.北京:机械工业出版社,2004.
  • 3H. Mase, Experiments on Automatic Web Page Categorization for IR System[, J]. technical report, Standford Univ. , Stanford, Calif. , 1998.
  • 4K. Nigam. Text Classification from Labled and Unlabled Documents Using EM. [,J]. Machine Learing, 2000, 39:103~134
  • 5L.M. Manevitz and M. Yousef. One- Class SVMs for Document Classification. [,J]. Machine Learing Reseach.1995,17:241~250
  • 6T. Joachims. Text Categorization with Support Vector Machine. [, J]. Proc. 10th European conf. Machine Learing(ECML '98) 1998,137 ~ 142

共引文献63

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部