-
题名基于扩展角分类神经网络的文档分类方法(英文)
被引量:12
- 1
-
-
作者
陈恩红
张振亚
合源一幸
王煦法
-
机构
中国科学技术大学计算机系
东京大学数学工程与信息物理系
-
出处
《软件学报》
EI
CSCD
北大核心
2002年第5期871-878,共8页
-
基金
国家自然科学基金
国家重点基础研究发展规划973项目~~
-
文摘
CC4神经网络是一种三层前馈网络的新型角分类(corner classification)训练算法,原用于元搜索引擎Anvish的文档分类.当各文档之间的规模接近时,CC4神经网络有较好的分类效果.然而当文档之间规模差别较大时,其分类性能较差.针对这一问题,本文意图扩展原始CC4神经网络,达到对文档有效分类的效果.为此,提出了一种基于MDS-NN的数据索引方法,将每一文档映射至k维空间数据点,并尽可能多地保持原始文档之间的距离信息.其次,通过将索引信息变换为CC4神经网络接受的0,1序列,实现对CC4神经网络的扩展,使其能够接受索引信息作为输入.实验结果表明对相互之间规模差别较大的文档,扩展CC4神经网络的性能优于原始CC4神经网络的性能.同时,扩展CC4神经网络的分类精度与文档索引方法有密切关系.
-
关键词
角分类
神经网络
文档分类
数据索引
距离信息
-
Keywords
document classification
CC4 neural network
data indexing
distance information
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-