期刊文献+

基于BP网络的中文文本分类技术 被引量:2

Chinese Text Categorization Technology Using BP Neural Network
下载PDF
导出
摘要 本文在对文本分类的问题,关键技术及系统结构进行介绍的基础上,详细阐述了一种利用带动力项的BP神经网络作为分类器的中文文本自动分类方法。该法采用归一化TFIDF算法对特征向量进行权值计算,并使用期望交叉熵统计方法对特征向量集进行精简。此外,我们在TanCorp12数据集上测试了特征项数目和训练次数对于分类器的宏平均和微平均性能的影响。 This paper has illustrated the description of the Chinese text categorization problem, the key technology and system design, and base on that, this paper explains the method how to use BP artificial network( with momentum) to achieve the goal of automatically classifying Chinese texts into different categories. The method adopts the TF - IDF formula to calculate weight and uses Expected Cross Entropy method as a way of reducing space dimension. Finally,on the TanCorpl2 text set, we use macro- average F1 and micro- average F1 as evaluation criterion to test the impact of parameters, such as input node number,training times, on the performance of the classifier.
出处 《微计算机应用》 2008年第3期31-36,共6页 Microcomputer Applications
基金 国家自然科学基金重大项目(No.60496322) 北京市组织部优秀人才(No.2005D0501508) 北京工业大学校青基金
关键词 文本分类 BP神经网络 特征降维 text categorization, BP neural network, feature reduction
  • 相关文献

参考文献2

二级参考文献11

  • 1黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 2鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 4Marco Ramoni, Paola Sebastiani.Bayesian Methods for Intelligent Data Analysis.New York: Springer Press,1999.
  • 5Freund Y,Schapire.A decision-theoretic generalization of on-line learning and an application to boosting.Proc.of the Second European Conf on Computational Learning.1995.
  • 6黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页
  • 7鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页
  • 8卜东波,博士学位论文,2000年
  • 9Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页
  • 10Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页

共引文献293

同被引文献17

引证文献2

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部