摘要
本文提出了将一种径向基网络的重要变形--概率神经网络应用于文本自动分类的研究,与常用的K-最邻近法相比,具有一定的优势,特别是在训练集中各类的训练样本数很不平衡时;与BP等其他神经网络相比,其特点是需调节的参数少,不需确定隐层数、隐层中的神经元数量等网络结构,比较容易使用.此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是非常重要的.
出处
《情报学报》
CSSCI
北大核心
2004年第2期147-151,共5页
Journal of the China Society for Scientific and Technical Information