期刊文献+

一种基于迭代学习的文本分类器构造方法

An Iterative Learningbased Construction Method of Text Categorizer
下载PDF
导出
摘要 文本自动分类系统是信息处理的重要研究方向。针对文本分错类和相似度低找不到合适类别等两种错误 ,提出一种迭代的学习算法 ,它利用分错的文本向量来提高或降低相应类别向量的权重 ,从而纠正分类错误 ,提高了分类准确率 ,并且最终得到了较精确的类别描述向量和较优的分类器。 The text categorization system is an important research aspect of information processing.On text error categorization and low similarity that can't find the adaptable class,etc.,this paper presents an iterative learning algorithm,which adopts error text vector to improve or decrease the weight of relative class vector to correct the error categorization,and improve category accuracy.Finally a more accuracy category description vector and better classifier has been obtained.
作者 檀林 张永奎
机构地区 山西大学
出处 《电脑开发与应用》 2004年第2期5-6,共2页 Computer Development & Applications
基金 山西省回国留学人员基金资助 (2 0 0 2 0 0 4 )
关键词 迭代学习 文本分类器 信息处理 度量函数 特征抽取 text categorization,categorization system,automatic categorization,iterative learning algorithm,classifier
  • 相关文献

参考文献3

  • 1周水庚,关佶红,俞红奇,胡运发.基于Ngram信息的中文文档分类研究[J].中文信息学报,2001,15(1):34-39. 被引量:23
  • 2P Langley,W Iba,K Thompson.An Ananalysis of Bayesian classifiers.In:Proc of the 10th National Conf on Artificial Intelligence.San Jose,CA:AAAI Press,1992,223-228
  • 3Schapire R,Singer Y.BoosTexter:a boosting-based system for text categorization.Machine Learning,2000,39(2/3):135-168

二级参考文献3

共引文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部