期刊文献+

中文Web概念挖掘系统设计与测评 被引量:7

Design & Test of the Web Concept Mining System in Chinese
下载PDF
导出
摘要 Web概念挖掘系统的总体设计思想是 :基于《中图法》知识库的主题标引和自动分类 ,即依据标引源权重方案进行文本的概念提取 ,利用语义相似度算法进行文本的自动分类 .本文简要介绍了概念挖掘系统的基本情况 ,并进行了 4种加权标引方案的比较和性能的测评 . The paper introduced the web concept mining system in Chinese, tested and evaluated the efficiency & function of the system. Based on the automatic indexing function of the Chinese Web Concept Mining System, we sample 150 web pages of economic science at random, index them manually and assign them the class numbers automatically. The statistics are worked out on the conforming between the manual indexing and the automatic indexing in order to compare four indexing schemes to prove the feasiblity of the Web Concept Mining System.
出处 《上海交通大学学报》 EI CAS CSCD 北大核心 2003年第S1期207-211,共5页 Journal of Shanghai Jiaotong University
关键词 概念挖掘 自动标引 主题标引 自动分类 concept mining automatic indexing subject indexing automatic classification
  • 相关文献

参考文献4

二级参考文献13

  • 1贺定安.《中国分类主题词表》一体化标引实验分析及其评价[J].图书馆论坛,1996,16(6):58-61. 被引量:6
  • 2薛鹏军.基于知识库的中文网络检索工具--经济信息智搜索引擎研究.南京农业大学硕士论文[M].,2001..
  • 3薛鹏军 侯汉清指导.基于知识库的中文网络检索工具--经济信息智能搜索引擎研究.南京农业大学硕士论文[M].,2001..
  • 4李朝阳 侯汉清指导.经济文献数据库计算机标引研究.南京农业大学硕士论文[M].,2000(6)..
  • 5查贵庭 侯汉清指导.经济新闻自动标引系统的研究.南京农业大学硕士论文[M].,2000(6)..
  • 6侯汉清,Internationalconferenceonnewmissionsofacademiclibrariesinthe 2 1stcentury,1998年,564页
  • 7侯汉清,计算机建立分类法和主题词表转换系统的尝试,1998年
  • 8Chan L M,IFLAsectiononclassificationandindexingandOCLCForestpress,1997年,29页
  • 9许培扬,索引技术和索引标准,1997年,73页
  • 10Chan L M,Feasibilityofacomputer generatedsubjectvalidationfilebasedonfrequencyofoccurrenc

共引文献64

同被引文献92

引证文献7

二级引证文献48

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部