摘要
本文阐述了自动分类中的仿人思想 ,并用分类域模型来描述中文信息自动分类中的分类法 ,通过计算类别特征项在分类域中的Hamming距离 ,对类别特征项依据其在分类域中的类别分布进行聚类 ,从而实现对向量分类法中的特征向量维数的压缩 ,并进一步构造用于中文自动分类的知识库。
In this paper,the model of categorizing field is put forward to describe the taxonomy.By computing the Hamming distance among features in the categorizing field,we make features with same category distribution in the categorizing field clustered,and the result is used to compress the dimension of the feature vector and constructing knowledge base in the automatic categorizing.
出处
《情报学报》
CSSCI
北大核心
2000年第3期248-253,共6页
Journal of the China Society for Scientific and Technical Information