期刊文献+

基于概率神经网络的文本自动分类研究 被引量:14

Study on Automatic Text Categorization with Probabilistic Neural Networks
下载PDF
导出
摘要 本文提出了将一种径向基网络的重要变形--概率神经网络应用于文本自动分类的研究,与常用的K-最邻近法相比,具有一定的优势,特别是在训练集中各类的训练样本数很不平衡时;与BP等其他神经网络相比,其特点是需调节的参数少,不需确定隐层数、隐层中的神经元数量等网络结构,比较容易使用.此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是非常重要的.
作者 施洁斌
机构地区 浙江大学图书馆
出处 《情报学报》 CSSCI 北大核心 2004年第2期147-151,共5页 Journal of the China Society for Scientific and Technical Information
  • 相关文献

参考文献12

二级参考文献25

  • 1吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量:24
  • 2黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43.
  • 3鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36.
  • 4卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000..
  • 5戴乾圜.化学致癌剂及化学致癌机理的研究,多环芳烃致癌性能的定量分子轨道模型--双区理论[J].中国科学:B辑,1979,(10):964-977.
  • 6Yang Yiming,Proceedings of the 14th International Conference on Machine rning,1997年,412页
  • 7Yang Yiming,Information Retrieval,1999年,1卷,1/2期,69页
  • 8Yang Yiming,Proceedings ICML 97 14th Int Conference on Machine Learning,1997年
  • 9李国臣,中文信息学报,1997年,13卷,4期,10页
  • 10Yang Y,http://citeseernjneccom/yang97comparativehtml,1997年

共引文献544

同被引文献162

引证文献14

二级引证文献42

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部