期刊文献+

关键词-分类号关联词表构建 被引量:6

Construction of Key words-Chinese Library Classification Codes Integrated Thesaurus
原文传递
导出
摘要 在多年海量文献人工标引的数据基础上,采用互信息法(MI)、卡方检验法(Chi-Square)、最大似然估计法(MLE)等概率与数理统计方法计量分析关键词与《中国图书资料分类法》分类号的关联关系,构建适用于科技文献自动标引的关键词-分类号关联词表,并通过实际标引文献数据的封闭与开放测试分析其应用效果。 Based on years of massive manual indexing data, this paper constructs a natural language classification thesanrus with Mutual Information ( MI), Chi - Square ( X^2 ) and Maximum Likelihood Estimate (MLE) to analyze the corresponding relation between keywords and Chinese Library Classification Codes. The performances of the Keywords - Chinese Library Classification Codes Integrated Thesaurus used for automatic indexing of sci - tech literatures are tested by close and open testing.
出处 《现代图书情报技术》 CSSCI 北大核心 2013年第7期107-113,共7页 New Technology of Library and Information Service
基金 国家高技术研究发展计划(863计划)基金项目"以科技文献服务为主的搜索引擎研制"(项目编号:2011AA01A206)的研究成果之一
关键词 关键词-分类号关联词表 文献加工 自动标引 自动分类 Keywords -Chinese Library Classification Codes Integrated Thesaurus Literature processing Automatic indexing Automatic categorization
  • 相关文献

参考文献18

  • 1国家图书馆《中国图书馆分类法》编辑委员会.《中国分类主题词表》(第二版)及其电子版手册[M].北京:北京图书馆出版社,2006:299.
  • 2国家图书馆《中国图书馆分类法》编辑委员会.《中国分类主题词表》(第二版)[DB/CD].北京:北京图书馆出版社,2006.
  • 3王梦云,曹素青.基于字频向量的中文文本自动分类系统[J].情报学报,2000,19(6):644-649. 被引量:17
  • 4周茜,赵明生,扈旻.中文文本分类中的特征选择研究[J].中文信息学报,2004,18(3):17-23. 被引量:165
  • 5Yang Y, Pedersen J O. A Comparative Study on Feature Selection in Text Categorization [ C ]. In: Proceedings of the 14th International Conference on Machine Learning, Nashville, Tennessee. 1997 : 412 - 420.
  • 6Yang Y. An Evaluation of Statistical Approaches to Text Categori- zation [ J]. Information Retrieval, 1999,1 ( 1 - 2 ) :69 - 90.
  • 7Yang Y, Liu X. A Re - examination of Text Categorization Methods [ C ]. In: Proceedings of the 22rid Annual International ACM S1GIR Conference on Research and Development in Information Retrieval. New York, NY, USA: ACM, 1999:42 -49.
  • 8Mladenic D, Grobelnik M. Feature Selection for Unbalanced Class Distribution and Naive Bayes[ C ]. In: Proceedings of the 16th In- ternational Conference on Machine Learning. San Francisco, CA, USA : Morgan Kaufmann Publishers Inc. , 1999 : 258 - 267.
  • 9Kolcz A, Prabakarmurthi V, Kalita J. Summarization as Feature Selection for Text Categorization [ C ]. In: Proceedings of the lOth International Conference on Information and Knowledge Manage- ment. New York, NY, USA: ACM, 2001:365-370.
  • 10Lassi M. Automatic Thesaurus Construction [ EB/OL]. [ 2013 - 03 -09]. http://citeseerx, ist. psu. edu/viewdoc/download? doi = 10.1.1. 106. 3346&rep = repl &type = pdf.

二级参考文献54

共引文献440

同被引文献113

引证文献6

二级引证文献18

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部