中文文献自动分类中的知识库构造及其仿人算法被引量：5

Knowledge Base Constructing and Apery Algorithm in Chinese Automatic Categorizing

下载PDF

导出

摘要本文阐述了自动分类中的仿人思想 ,并用分类域模型来描述中文信息自动分类中的分类法 ,通过计算类别特征项在分类域中的Hamming距离 ,对类别特征项依据其在分类域中的类别分布进行聚类 ,从而实现对向量分类法中的特征向量维数的压缩 ,并进一步构造用于中文自动分类的知识库。 In this paper,the model of categorizing field is put forward to describe the taxonomy.By computing the Hamming distance among features in the categorizing field,we make features with same category distribution in the categorizing field clustered,and the result is used to compress the dimension of the feature vector and constructing knowledge base in the automatic categorizing.

作者刁倩张惠惠王永成何骥

机构地区上海交通大学

出处《情报学报》 CSSCI 北大核心 2000年第3期248-253,共6页 Journal of the China Society for Scientific and Technical Information

关键词自动分类中文文献知识库仿人算法概念联想概念抽象 automatic categorizing,knowledge base,feature vector,apery algorithm.

分类号 G254.1 [文化科学—图书馆学]

引文网络
相关文献

参考文献5

1战学刚林鸿飞等.中文文献的层次分类方法.上海交通大学OA室技术报告[M].,1999..
2刁倩王永成.中文信息自动分类的仿人算法.Proceedings of ICCIP’98,Nov[M].,1998..
3战学刚，上海交通大学OA室技术报告，1999年
4刁倩，ProceedingsofICCIP′98,Nov，1998年
5Chen Hsinchun，InternetCategorizationandSearch :ASelf OrganizationApproach，1996年

同被引文献54

1诸青,郁亦明.文献自动分类的分析与研究[J].现代图书情报技术,1985(4):40-46. 被引量：8
2徐进鸿.文献自动分类的一种算法[J].现代图书情报技术,1993(3):25-28. 被引量：1
3叶新明.基于《中图法》的中文文献自动分类[J].情报学报,1995,14(6):423-433. 被引量：11
4石志伟,刘涛,吴功宜.一种快速高效的文本分类方法[J].计算机工程与应用,2005,41(29):180-183. 被引量：15
5白小明,邱桃荣.基于SVM和KNN算法的科技文献自动分类研究[J].微计算机信息,2006(12X):275-276. 被引量：10
6Yang Y, Liu X. A re-examination of text categorization methods[A]. Proceedings, 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR'99)[C]. Berkeley: ACM Press, 1999.42-49.
7Han E H, George K, Vipin K. Text categorization using weight adjusted k-nearest neighbor classification[R]. Technical Report#00-046, University of Minnesota, 2000.
8Joachims T. Advances in kernel methods-support vector learning[M]. Cambridge MA:MIT Press, 1998.169-184.
9Joachims T. Optimizing search engines using clickthrough data[A]. The Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD2002)[C]. Edmonton: ACM Press, 2002.102-110.
10He J, Tan A H, Tan C L. A comparative study on chinese text categorization methods[A]. Proceedings of the International Workshop on Text and Web Mining[C]. Singapore: Melbourne, 2000.24-35.

引证文献5

1张开选,夏旭.基于小波分析的电子文献分类[J].情报学报,2013,32(9):1000-1008.
2陈树年.网络信息的自动分类问题[J].图书馆杂志,2001,20(10):2-6. 被引量：13
3张晓辉,李莹,王华勇,赵宏.应用特征聚合进行中文文本分类的改进KNN算法[J].东北大学学报（自然科学版）,2003,24(3):229-232. 被引量：60
4董慧,安璐.数字图书馆关键技术的分析与启示（下）[J].情报学报,2003,22(1):52-58. 被引量：13
5李伟,王永成,蔡巍,尹中航.一种自动分类系统学习功能的实现方法[J].情报学报,2003,22(3):302-305.

二级引证文献86

1朱丹,吴兹古力.基于机器视觉的农业机械图像识别系统分析[J].农机化研究,2020,42(10):28-31. 被引量：13
2李敏,冯亚丽,吴东林.采摘机器人动态果实目标检测与跟踪技术研究——基于云存储[J].农机化研究,2020,42(9):207-211. 被引量：10
3张莉.网页自动分类技术概念分析[J].娄底职业技术学院学报（职教与经济研究）,2007(2):58-62.
4孔凡村,胡勤友,陈宇里.基于VDR回放数据的船舶碰撞过程仿真系统的设计[J].中国航海,2004,27(2):25-28. 被引量：9
5杨丹.网络环境下的信息资源分类[J].江西社会科学,2004,24(7):196-202. 被引量：3
6张莉,康耀红,王曙光,张春元.中文网页自动分类现状的研究[J].福建电脑,2004,20(5):3-4. 被引量：1
7翁仕鹏.中美一流大学图书馆数字资源管理对比研究[J].图书馆研究与工作,2004(3):20-26. 被引量：3
8郭启智.数字图书馆的特征及其发展趋势[J].晋图学刊,2004(6):38-40.
9何峰,林亚丽.改进的KNN文本分类算法综述[J].福建电脑,2005,21(1):4-5. 被引量：1
10郭启智.关于数字图书馆有关问题的探讨[J].科技情报开发与经济,2004,14(12):99-101.

1史磊,王永成.英文文献自动摘要系统研究[J].情报学报,1999,18(6):504-508. 被引量：4
2刁倩,王永成,张惠惠.基于神经网络的中文信息概念联想构造算法[J].情报学报,2000,19(2):170-175. 被引量：11
3史磊,王永成.英文文献自动摘要系统的研制与开发[J].高技术通讯,1999,9(11):22-26. 被引量：3
4包金耀.基于图表的人力资源论文的研究[J].网络财富,2009(2):137-138.
5陈海伟.插画,不是“插花”[J].新闻实践,2012(6).
6欧阳兆明.对情报定义的选择和补充[J].情报学刊,1989(2):57-57.
7朱兰娟.中文文献自动分类的理论与实践[J].情报学报,1987,6(6):433-437. 被引量：9
8沈玮杰.基于文献结构的自动文摘的初探[J].现代图书情报技术,2002(3):23-27. 被引量：6
9盛秋艳,何文广.基于Hopfield神经网络的概念检索技术[J].情报科学,2004,22(3):346-348. 被引量：6
10宋玲,马军,刘怀辉.基于神经网络的概念联想和概念聚类[J].情报学报,2002,21(2):167-172. 被引量：8

情报学报

2000年第3期

浏览历史

内容加载中请稍等...

中文文献自动分类中的知识库构造及其仿人算法被引量：5

参考文献5

同被引文献54

引证文献5

二级引证文献86

相关作者

相关机构

相关主题

浏览历史

中文文献自动分类中的知识库构造及其仿人算法 被引量：5

参考文献5

同被引文献54

引证文献5

二级引证文献86

相关作者

相关机构

相关主题

浏览历史

中文文献自动分类中的知识库构造及其仿人算法被引量：5