期刊文献+

运用文本领域的常识改善基于支撑向量机的文本分类器性能 被引量:16

Improving the Performance of the Text Classifier Based on Support Vector Machine Using the Common Sense in Text Domain
下载PDF
导出
摘要 本文提出了一种提高中文文本分类器推广性能的方法。一般而言 ,采用机器学习的方法对文本集合进行训练 ,可以获得文本分类器。本文引入了文本语义不变性常识 ,并将其融合到文本分类器中 ,提出了改进文本分类器的方法。与支撑向量机相结合 ,设计并实现了改进的文本分类器。对中文文本分类的实验表明 。 In the paper,a method to improve the generalization performance of the Chinese text classifier is put forward.Generally speaking,a text classifier is obtained by training text set with a machine learning method.A kind of common sense about text semantic invariance is introduced.A method to improve the text classifier is put forward by fusing the common sense into it.With the combination with a Support Vector Machine,we design and implement the improved text classifier.The experiment shows that the generalization performance of the text classifier is improved with the method.
出处 《中文信息学报》 CSCD 北大核心 2002年第2期7-13,共7页 Journal of Chinese Information Processing
基金 国家自然科学基金 (6 0 0 730 19) 国家自然科学基金重大项目 (6 9790 0 80 )支持
关键词 文本分类器 同语义文档子段替换 人工文档样本 相容性条件 支撑向量机 文本信息机理 Text Categorization Synonymy Sub-Document Replacement Artificial Document Sample Compatibility Condition Support Vector Machine
  • 相关文献

参考文献2

  • 1李辉.支撑向量机及其在文本分类中的应用,北京大学博士论文[M].,2001..
  • 2Peter Cord等 邵维忠等(译).Object-Oriented Analysis.Yourdon Press[M].北京:北京大学出版社,1992.65-77.

同被引文献103

引证文献16

二级引证文献135

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部