期刊文献+

基于SVM与KNN的中文文本分类比较实证研究 被引量:10

Empirical Study of the Comparison of SVM and KNN-based Categorization of Chinese Text
下载PDF
导出
摘要 本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。 After describing the categorization process of the Chinese text and the concrete steps of using SVM and KNN to categorize the Chinese text,a model of Chinese text categorization is proposed.An empirical study of using the SVM algorithm and the traditional KNN algorithm to categorize the Chinese text is conducted.The experiment shows that,compared with KNN,SVM has better categorization effect of the Chinese text and higher recall ratio and pertinency ratio.
出处 《情报理论与实践》 CSSCI 北大核心 2008年第6期941-944,共4页 Information Studies:Theory & Application
基金 国家自然科学基金资助项目"基于语义网的多媒体检索与数据挖掘"(项目编号:70503022) 中国博士后基金项目"基于支持向量机的视频语义检索研究"(项目编号:20060400996)的研究成果之一
关键词 支持向量机 文本分类 实证研究 support vector machine text categorization empirical study
  • 相关文献

参考文献9

二级参考文献43

  • 1张云涛,龚玲,王永成.An improved TF-IDF approach for text classification[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2005,6(1):49-55. 被引量:4
  • 2翟林,刘亚军.支持向量机的中文文本分类研究[J].计算机与数字工程,2005,33(3):21-23. 被引量:14
  • 3王海涌,郑丽英,刘丽艳.基于文本表示的特征项权值确定方法研究[J].甘肃科学学报,2005,17(3):86-89. 被引量:8
  • 4C Cortes, V N Vapnik. Support vector networks. Machine Learning, 1995, 20(3): 273-297
  • 5C Burges. A tutorial on support vector machines for pattern recongnition. Data Mining and Knowledge Discovery, 1998, 2(2): 1~43
  • 6T Joachims. Text categorization with support vector machines:Learning with many relevant features. In: C Nedellec ed. Proc of ECML-98. Heidelberg: Springer-Verlag, 1998. 137~142
  • 7E Leopold, J Kindermann. Text categorization with support vector machines, How to represent texts in input space? Machine Learning, 2002,46(1-3): 423~444
  • 8N Cristianini, J S Taylor. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods. New York:Cambridge University Press, 2000
  • 9Y Yang, S Slattery, R Ghani. A study of approaches to hypertext categorization. Journal of Intelligent Information Systems, 2002,18(2/3): 219~241
  • 10V N Vapnik. Statistical Learning Theory. New York:John Wiley & Sons, 1998

共引文献230

同被引文献117

引证文献10

二级引证文献25

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部