摘要
本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。
After describing the categorization process of the Chinese text and the concrete steps of using SVM and KNN to categorize the Chinese text,a model of Chinese text categorization is proposed.An empirical study of using the SVM algorithm and the traditional KNN algorithm to categorize the Chinese text is conducted.The experiment shows that,compared with KNN,SVM has better categorization effect of the Chinese text and higher recall ratio and pertinency ratio.
出处
《情报理论与实践》
CSSCI
北大核心
2008年第6期941-944,共4页
Information Studies:Theory & Application
基金
国家自然科学基金资助项目"基于语义网的多媒体检索与数据挖掘"(项目编号:70503022)
中国博士后基金项目"基于支持向量机的视频语义检索研究"(项目编号:20060400996)的研究成果之一
关键词
支持向量机
文本分类
实证研究
support vector machine
text categorization
empirical study