期刊文献+

一种基于粗糙-神经网络的文本自动分类方法 被引量:1

A Hybrid Classifier Based on the Rough Sets and Neural Networks
下载PDF
导出
摘要 结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法.首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类.这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点.试验结果表明,与朴素贝叶斯、SVM、KNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本. A Hybrid Classifier is presented based on the combination of rough set theory and BP neural network. Firstly, the documents are denoted by vector space model. Secondly it reduced the feature vector by using rough sets. Finally classed the documents by BP neural network. Experimental results show that the algorithm Rough-ANN is effective for the texts classification, and has the better performance in classification precision, stability and fault-tolerance comparing with the traditional classification methods, Bayesian classifiers SVM and kNN, especially for the complex classification problems with many feature vectors.
出处 《情报学报》 CSSCI 北大核心 2006年第4期475-480,共6页 Journal of the China Society for Scientific and Technical Information
关键词 文本分类 粗糙集 神经网络 属性约简 VSM text classification, rough-sets, neural networks, attribute reduction, VSM
  • 相关文献

参考文献10

二级参考文献18

  • 1Yang Yiming,Proceedings of the 14th International Conference on Machine rning,1997年,412页
  • 2Yang Yiming,Information Retrieval,1999年,1卷,1/2期,69页
  • 3Yang Yiming,Proceedings ICML 97 14th Int Conference on Machine Learning,1997年
  • 4李国臣,中文信息学报,1997年,13卷,4期,10页
  • 5Yang Y,http://citeseernjneccom/yang97comparativehtml,1997年
  • 6史忠植.知识发现.北京:清华大学出版社,2002,334-363
  • 7R.D.Romero et al.Optical Chinese character recognition using probabilistic neural networks.Pattern Recognition,1997,30(8):1279~1292
  • 8Z.R.Yang et al.Probabilistic neural networks in bankruptcy prediction.Journal of Business Research,1999,44:67~74
  • 9许东等.基于MATLAB6.X的系统分析与设计一神经网络(第二版).西安电子科技大学出版社,2002
  • 10李国臣.文本分类中基于对数似然比测试的特征词选择方法[J].中文信息学报,1999,13(4):16-21. 被引量:17

共引文献240

同被引文献46

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部