期刊文献+

中文文本分类方法比较研究 被引量:2

A Comparison Study of Chinese Text Categorization
下载PDF
导出
摘要 中文文本分类是中文信息处理过程中的关键技术。本文介绍了中文文本分类的基本过程和基本原理,讨论了朴素贝叶斯(NB)、K-最近邻(KNN)、支持向量机(SVM)这三种中文文本分类方法,并对这三种分类方法进行分析和比较。 Chinese text categorization is a key technique in Chinese Information processing. The basic process and principles of Chinese text categorization are presented. And three widely applied methods, such as Naive Bayes (NB), K-nearest neighbor (KNN) and Support vector machines (SVM), are discussed and analyzed by comparison in this paper.
作者 高媛 刘大中
机构地区 河北大学
出处 《科技信息》 2008年第2期7-8,共2页 Science & Technology Information
基金 国家自然科学基金(70571021) 河北省自然科学基金(A2005000087) 河北教育厅指导计划(Z2006305)的支持
关键词 文本分类 朴素贝叶斯(NB) K-最近邻(KNN) 支持向量机(SVM) Text Categorization, K-nearest neighbor (KNN), Support vector machines(SVM), Naive Bayes (NB)
  • 相关文献

参考文献4

二级参考文献21

  • 1龚汉明,周长胜.汉语分词技术综述[J].北京机械工业学院学报,2004,19(3):52-55. 被引量:26
  • 2梁开健.基于DCSSM的文本特征提取及文本挖掘研究[J].自动化技术与应用,2005,24(5):54-56. 被引量:2
  • 3王元珍,钱铁云,冯小年.基于关联规则挖掘的中文文本自动分类[J].小型微型计算机系统,2005,26(8):1380-1383. 被引量:13
  • 4Fabrizio Sebastiani.Machine learning in automated text categorization[J].ACM Computing Curveys,2002,34(1):11-12,32-33.
  • 5McCALLUM A,NIGAM K.A comparison of event models for Naive Bayes text retrival[J].Information Processing and Management,1998,24(5):513-523.
  • 6KONONENKO I.Semi-Naive Bayesian classifiers[C]//Proceedings of European Conference on Artificial Intelligence.Berlin:Springer-Verlag,1991:206-219.
  • 7FRIEDMAN N,GEIGER D,GOLDSZMIDT M.Bayesian network classifiers[J].Machine Learning,1997,29(2/3):131-163.
  • 8YANG Yi-ming.An evaluation of statistical approach to text categorization[J].Information Retrieval,1999,1(1/2):69-90.
  • 9Zijian Zheng,Geoffrey I. Webb. Lazy Learning of Bayesian Rules[J] 2000,Machine Learning(1):53~84
  • 10Corinna Cortes,Vladimir Vapnik. Support-Vector Networks[J] 1995,Machine Learning(3):273~297

共引文献50

同被引文献25

引证文献2

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部