期刊文献+

基于KNN和SVM的中文文本自动分类研究 被引量:10

Reseach on Automatic Classification for Chinese Text Based on KNN and SVM
原文传递
导出
摘要 借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。 This paper describes the experimental process of automatic text categorization. The experiment chooses Chinese text data sets from 10 categories,and distributes the training set and test set based on the ratio of 1:2. With the help of text automatic classification system software,the experiment does automatic classification based on algorithms of KNN and SVM,in order to compare different classification algorithms and explore key technologies of text classification.
作者 张野 杨建林
出处 《情报科学》 CSSCI 北大核心 2011年第9期1313-1317,1377,共6页 Information Science
基金 国家社会科学基金项目(09BTQ020)
关键词 自动分类 KNN SVM 中文信息处理 automatic classification KNN SVM Chinese information process
  • 相关文献

参考文献7

二级参考文献22

  • 1王建会,王洪伟,申展,胡运发.一种实用高效的文本分类算法[J].计算机研究与发展,2005,42(1):85-93. 被引量:20
  • 2李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量:95
  • 3黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 4鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 5卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 6黄昌宁 等.对自动分词的反思[A]..语言计算与基于内容的文本处理[C].北京:清华大学出版社,2003,7.26-38.
  • 7Kjersti Aas,et al. Text Classification: A Survey[ M]. 1999.
  • 8Yiming Yang. An Evaluation of Statistical Approaches to Text Categorization[ J]. Information Retrieval, 1999,1 ( 1/2 ) :67-88.
  • 9Yiming Yang, Xin Liu. A Re-Examination of Text Categorization Methods[ C]. Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval(SIGIR) , 1999. 42-49.
  • 10黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页

共引文献883

同被引文献114

引证文献10

二级引证文献73

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部