期刊文献+

基于改进的朴素贝叶斯文本分类研究 被引量:7

The text categorization study on improval Nal¨ve Bayes
下载PDF
导出
摘要 文本分类(Text Categorization,TC)指的是把一个自然语言文本,根据其主题归入到预先定义好的类别中的过程。文本分类是自然语言处理的一个基础性工作,也是近年来人们研究的热点话题。针对朴素贝叶斯算法在小样本集分类效果不高的原因进行了分析,对其进行了改进和调整,提出了基于改进的朴素贝叶斯文本分类方法,试验结果表明,该方法取得了更好的效果。 Text categorization is such a procedure that it can classify the text automatically by computer,and the categories have been defined before classify. It's a hot topic in our study area and it's also a basic work in the area of natural language disposal.Here on the nave Bayes algorithm is modified and the result is better than before.A text categorization study on improval nave Bayes is presented.The result of the experition indicates that this method have better effect.
出处 《河北省科学院学报》 CAS 2007年第1期22-25,共4页 Journal of The Hebei Academy of Sciences
基金 河北省自然科学基金资助项目(2004000132)
关键词 文本分类 朴素贝叶斯 K近邻 知网 中文分词 Text categorization Nave bayes KNN HowNet Chinese word segmentation
  • 相关文献

参考文献5

  • 1[1]Narayanan Shivakumar,et.Finding near-replicas of documents on the web.WebDB 1998.204-212.
  • 2[2]Lewis,D.D.Naive Bayes at forty:The independence assumption in information retrieval.Machine Learning:ECML = 98,Tenth European Conference on Machine T.Parninu.1998:4-15.
  • 3[3]Tom M.Mitchell,Machine Learning[M].机械工业出版社,2003:204-258.
  • 4[5]Y.Yang and X.Liu.A re-examination of text categorization methods.In:M.A.Hearst,F.Gey,and R.Tong eds.Proceedings of SIGIR-99,22nd ACM International Conference on Research and Development in Information Retrieval.New York:ACM Press,1999.42-49.
  • 5庞剑锋,卜东波,白硕.基于向量空间模型的文本自动分类系统的研究与实现[J].计算机应用研究,2001,18(9):23-26. 被引量:293

二级参考文献8

  • 1黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 2鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 4黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页
  • 5鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页
  • 6卜东波,博士学位论文,2000年
  • 7Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页
  • 8Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页

共引文献292

同被引文献56

引证文献7

二级引证文献27

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部