期刊文献+

使用KNN算法的文本分类 被引量:96

Text Categorization with KNN Algorithm
下载PDF
导出
摘要 介绍了数据挖掘的一个分枝——文本自动分类的相关技术,在对数据进行预处理的基础上,实现了K最近邻居分类算法,并结合实验结果对数据预处理在文本分类中的重要性进行了讨论。 This paper introduces a branch of data mining technology-text categorization, and discusses some related key technologies of text categorization. Based on data preprocess, it implements one algorithm, K nearest neighbor algorithm. In the end, it utilizes the experiment results to prove the importance of data preprocess for clarifying capability.
出处 《计算机工程》 EI CAS CSCD 北大核心 2005年第8期171-172,185,共3页 Computer Engineering
基金 国家自然科学基金资助项目(60173017 9010402) 北京市自然科学基金资助项目(4011003)
关键词 数据挖掘 文本分类 KNN算法 向量空间模型 Data mining Text categorization KNN algorithm VSM
  • 相关文献

参考文献5

  • 1王继成,潘金贵,张福炎.Web文本挖掘技术研究[J].计算机研究与发展,2000,37(5):513-520. 被引量:275
  • 2Salton G,Lesk M E.Computer Evaluation of Index and Text Processing. Association for Computing Machinery,1968,15(1).
  • 3Maron M E. On Relevance,Probabilistic Indexing and Information Retrieval. Journal of the ACM,1960,7(3).
  • 4Lewis D D. Feature Selection and Feature Extraction for Text Categorization. In Proceedings of Speech and Natural Language Workshop. Defense Advanced Research Projects Agency,Morgan Kaufmann,1992-02:212-217.
  • 5Yang Yiming,Liu Xin. A Re-examination of Text Categorization Methods. Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR),1999:42-49.

二级参考文献4

共引文献274

同被引文献697

引证文献96

二级引证文献383

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部