期刊文献+

一种基于元数据方法的KNN网页分类器的设计与实现

下载PDF
导出
摘要 网页分类是指在给定分类体系的情况下,根据网页的属性自动确定其所属类别的过程。近年来,网页分类在信息检索和机器学习领域得到了广泛的关注,有不少效果较好的方法,如SVM,KNN等。但是由于网页是具有丰富的描述信息的结构体,使用纯文本分类技术处理网页是不合理的。本文提出了一种新的网页分类方法将网页分类粒度从整个网页作为分类的原子对象细化到网页的各内容部分,强调了重点部分,弱化了次要部分。本文在KNN算法的基础上,实现了基于元数据的网页分类方法。
作者 陈益军
出处 《福建电脑》 2007年第6期137-137,145,共2页 Journal of Fujian Computer
  • 相关文献

参考文献4

二级参考文献24

  • 1Salton G,Lesk M E.Computer Evaluation of Index and Text Processing. Association for Computing Machinery,1968,15(1).
  • 2Maron M E. On Relevance,Probabilistic Indexing and Information Retrieval. Journal of the ACM,1960,7(3).
  • 3Lewis D D. Feature Selection and Feature Extraction for Text Categorization. In Proceedings of Speech and Natural Language Workshop. Defense Advanced Research Projects Agency,Morgan Kaufmann,1992-02:212-217.
  • 4Yang Yiming,Liu Xin. A Re-examination of Text Categorization Methods. Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR),1999:42-49.
  • 5Salton G, McGill J. Introduction to Modern Information Retrieval 1 edition [M]. Auckland: McGraw Hill, 1983.
  • 6Slattery S. Hypertext Classification [D]. Pittsburgh: Carnegie Mellon Univ, 2001.
  • 7Yang Y, Slattery S, Ghani R. A study of approaches to hypertext categorization [J]. J Intelligent Info Syst, 2002, 18(2/3): 219-241.
  • 8Furnkranz J. Exploiting structural information for text classification on the WWW [A]. IDA'99 [C]. Amsterdam: Springer Verlag, 1999. 487-497.
  • 9Chakrabarti S, Dom B, Indyk P. Enhanced hypertext categorization using hyperlinks [A]. Laura M H, Tiwary A. Proc ACM SIGMOD Int Conf on Management of Data [C]. New York: ACM Press, 1998. 307-318.
  • 10Ghani R, Slattery S, Yang Y. Hypertext categorization using hyperlink patterns and meta data [A]. Brodley C, ICML'01 [C]. San Francisco: Morgan Kaufmann, 2001.

共引文献120

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部