摘要
为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的分类准则。通过适当训练建立分类库,计算待分类样本与已知分类的相似性,判别各分类。实验表明,该分类算法可以获得85%以上的分类识别率。
出处
《现代图书情报技术》
CSSCI
北大核心
2002年第S1期59-62,共4页
New Technology of Library and Information Service
基金
国家重点基础研究973项目(G19990330)