中文文献自动分类的理论与实践被引量：9

AUTOMATIC CLASSIFICATION OF DOCUMENTS IN CHINESE— THEORY AND PRACTICE

下载PDF

导出

摘要本文介绍的中文文献自动分类实践，是基于文献主题属性的分析，运用概率标引技术和Bayes分类准则等理论依据，防人工实际工作过程而实现的一种仿人算法。系统使用了以加权的题中关键词为基础的切实可行的方法，借助中文文献自动抽词系统的技术成果，以期达到科学性、继承性、实用性兼顿的目的。算法在微型机IBM-5550上实现。 The practices in automatic classification in Chinese introduced in this paper are based on an analysis of the theoretical criteria for the attributes of document titles employing the probability indexing technique and Bayest classification norms forming a kind of man-micmicking algorithm realised in imitating the actual process of manual work. The system makes use of the really feasible method taking the keywords in the weighted topics as the basis aided by the technological results of the automatic term-extraction system in Chinese with the expectation of achieving the purpose of being seientitic, inheritable and applicable. The algorithm is realised on the microcomputer IBM-5550.

作者朱兰娟

机构地区上海交通大学

出处《情报学报》 1987年第6期433-437,共5页 Journal of the China Society for Scientific and Technical Information

关键词理论与实践自动分类中文文献仿人算法系统使用文献主题标引技术技术成果

分类号 G354.4 [文化科学—情报学]

引文网络
相关文献

参考文献4

1朱兰娟,王永戍.中文史献的自动分类,《中文信息》,1980,(4).26-28.
2Salton. G., McGill.M.J.: Introduction to Modern Information Retrieval, 1983, New York.
3Robertson, S. E., Van Rijsbergen, C. J., et at.:Probabiiistic Models of Inde- xing and Searching, Information Retrieval Research, 1981.
4北京图书馆系.《图书分类》,书目文献出版社,1983,北京.

同被引文献46

1丁信善.语料库语言学的发展及研究现状[J].当代语言学,1998(1):5-13. 被引量：80
2陈建生.语篇的自动词性附码[J].当代语言学,1998(1):18-29. 被引量：12
3陈建生.关于语料语言学[J].当代语言学,1997(1):1-11. 被引量：24
4诸青,郁亦明.文献自动分类的分析与研究[J].现代图书情报技术,1985(4):40-46. 被引量：8
5莫少强.计算机辅助图书分类系统的设计与试验[J].现代图书情报技术,1984(1):29-35. 被引量：5
6侯汉清,黄刚.电子计算机与文献分类[J].现代图书情报技术,1982(1):5-14. 被引量：10
7苏新宁.汉语文献自动标引综析[J].情报学报,1993,12(4):309-318. 被引量：18
8周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43
9吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量：24
10苏新宁,徐进鸿,史九林.档案自动分类算法研究[J].情报学报,1995,14(3):194-200. 被引量：11

引证文献9

1苏武华.汉语自动分词和自动标引方法研究[J].农业图书情报学刊,2004,15(7):103-105. 被引量：4
2高洁,吉根林.文本分类技术研究[J].计算机应用研究,2004,21(7):28-30. 被引量：36
3鞠小林,陈继红,邵浩然.基于向量空间模型的分层网页分类方法[J].南通大学学报（自然科学版）,2010,9(1):24-29.
4宗永升,张祎.支持向量机与K近邻结合的网页分类方法[J].计算机仿真,2010,27(9):208-211. 被引量：5
5牟尧,李曦.关于文本自动分类算法的研究——以档案自动归类的应用为例[J].中国西部科技,2011,10(24):49-51. 被引量：1
6史九林,成颖.论语料库技术在自动分类研究中的应用[J].江苏图书馆学报,2000(4):31-35. 被引量：2
7张义忠,赵明生,朱精南.基于内容的网页特征提取[J].计算机工程与应用,2001,37(10):1-3. 被引量：9
8张义忠,赵明生,朱精南.基于内容的中文网页自动分类研究[J].信息与控制,2001,30(5):408-412. 被引量：5
9张昭楠.基于SVM的中文文本分类系统的设计与实现[J].电子设计工程,2016,24(16):139-141. 被引量：6

二级引证文献68

1王新福.基于数据分析技术的人才成长规律研究[J].产业科技创新,2019(1):80-81.
2常娟.针对短文本数据的自动分类方法比较研究[J].消费导刊,2008,0(4):177-178.
3郭庚麒,陈启买.一个基于Web挖掘的中文专业搜索引擎的设计与实现[J].计算机工程与科学,2004,26(9):16-20. 被引量：6
4许建潮,侯锟.Web信息的自主抽取方法[J].计算机工程与应用,2005,41(14):185-189. 被引量：15
5何静媛,张程.基于Agent的搜索引擎智能个性化设计[J].重庆大学学报（自然科学版）,2005,28(12):48-50. 被引量：4
6罗杰,陈力,夏德麟,王凯.基于新的关键词提取方法的快速文本分类系统[J].计算机应用研究,2006,23(4):32-34. 被引量：17
7叶帮利.特教网络资源自动搜集整理机器人的开发研究[J].电脑知识与技术,2006(9):76-76. 被引量：2
8石淼磊,苏璞睿,冯登国.Web浏览器历史数据自动分类取证系统[J].计算机应用,2006,26(10):2427-2429. 被引量：3
9李荣艳,金鑫,王春辉,郑宁,别荣芳.一种新的中文文本分类算法[J].北京师范大学学报（自然科学版）,2006,42(5):501-505. 被引量：6
10刘冬梅,王俊义.HTML文本自动分类预处理方法的研究应用[J].内蒙古大学学报（自然科学版）,2007,38(1):75-78. 被引量：4

1罗增瑜.主题标引技术巧探讨[J].电子情报工作,1991(1):17-21.
2史磊,王永成.英文文献自动摘要系统研究[J].情报学报,1999,18(6):504-508. 被引量：4
3毛雅君,许培扬.信息检索系统的检索效率影响因素研究进展[J].医学情报工作,2001,22(3):41-43. 被引量：3
4王建平.我馆增设主题目录之浅见[J].图书馆研究,1988,31(4):68-70.
5吴玉珍.分类编目一体化对编目人员业务技能的要求[J].科技情报开发与经济,2003,13(12):64-65. 被引量：5
6陈树年.面向机检的中文图书主题标引技术研究[J].图书馆理论与实践,2000(4):6-9. 被引量：12
7叶新明.中文文献自动分类研究概述[J].情报理论与实践,1992,15(5):39-41. 被引量：3
8史磊,王永成.英文文献自动摘要系统的研制与开发[J].高技术通讯,1999,9(11):22-26. 被引量：3
9谢少俊.浅析“法律文书”归类难的问题[J].中国图书情报科学,2004(2):69-70.
10苏.,ЕЖ,胡小菁.苏联分类实践的现状与发展趋势[J].文献工作研究,1990(2):45-48.

情报学报

1987年第6期

浏览历史

内容加载中请稍等...

中文文献自动分类的理论与实践被引量：9

参考文献4

同被引文献46

引证文献9

二级引证文献68

相关作者

相关机构

相关主题

浏览历史

中文文献自动分类的理论与实践 被引量：9

参考文献4

同被引文献46

引证文献9

二级引证文献68

相关作者

相关机构

相关主题

浏览历史

中文文献自动分类的理论与实践被引量：9