摘要
中文文本分类是中文信息处理过程中的关键技术。本文介绍了中文文本分类的基本过程和基本原理,讨论了朴素贝叶斯(NB)、K-最近邻(KNN)、支持向量机(SVM)这三种中文文本分类方法,并对这三种分类方法进行分析和比较。
Chinese text categorization is a key technique in Chinese Information processing. The basic process and principles of Chinese text categorization are presented. And three widely applied methods, such as Naive Bayes (NB), K-nearest neighbor (KNN) and Support vector machines (SVM), are discussed and analyzed by comparison in this paper.
出处
《科技信息》
2008年第2期7-8,共2页
Science & Technology Information
基金
国家自然科学基金(70571021)
河北省自然科学基金(A2005000087)
河北教育厅指导计划(Z2006305)的支持