期刊文献+

基于SVM技术的文本分类研究 被引量:2

Research of Text Classification Base on SVM Technology
下载PDF
导出
摘要 SVM(Support Vector Machine,支持向量机)是由Vapnik等人提出的一种新的机器学习方法。以结构误差理论、条件二次优化理论与核空间理论作为理论基础,能够较地的解决机器学习的问题,如模型选择、过学习、非线性问题和灾难维数等,很适合应用在文本分类领域。针对文本分类技术的新问题,研究了已有的主动学习方法并对其进行改进,提出了一种新的主动学习算法,很好地解决了小规模标注样本集的分类问题。该方法尤其在难以获得大量类标签或者标注样本耗费较大的领域,更能显示出它的优越性,适合日新月异的互联网的应用。 SVM takes structural error theory, condition quadratic optimization theory and kernel space theory foundation, so it can preferably solve machine learning problems such as model selection, excessive learning, non-linear problem, the cruse of dimensionality and so on. SVM is quite suitable to be used in the field of text classification.In this paper, the advantages and new problems of SVM in text classification are discussed and an improved active learning method is proposed. It makes small-scale labeled training set get good classification effect and quite suitable to be used in those fields facing difficulty of labeling large-scale training set or costing a lot to do so.
作者 祝磊
出处 《软件导刊》 2006年第12期26-28,共3页 Software Guide
关键词 文本分类 SVM技术 支持向量 主动学习 text classification support vector active learningn
  • 相关文献

参考文献3

二级参考文献4

共引文献146

同被引文献17

引证文献2

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部