期刊文献+

基于叙词表的主题爬虫技术研究 被引量:8

The Focused-crawler Based on Thesaurus
下载PDF
导出
摘要 将叙词表同传统的信息检索技术相结合,提出用叙词表的族对爬虫的主题进行描述的方法并用该方法设计实现一主题爬虫。实验结果证明本文提出模型和算法的有效性。 Combining the thesaurus with the traditional information retrieval technology, a new method is presented that family in thesaurus is used to describe the predefined topic. Also develops a focused - crawler based on this method. On which we compare its efficiency with other well - known Web search engine. The experimental results showes the effectiveness of our models and algorithms.
作者 夏崇镨 康丽
出处 《现代图书情报技术》 CSSCI 北大核心 2007年第5期41-44,共4页 New Technology of Library and Information Service
基金 北京市自然科学基金资助项目"基于遗传算法网页信息搜索技术"(项目编号:4062013)的研究成果之一
关键词 主题爬虫 叙词表 搜索引擎 Focused crawler Thesaurus Search engine
  • 相关文献

参考文献5

二级参考文献40

  • 1宋翠云.中外叙词表的发展[J].河南图书馆学刊,1995,15(4):27-28. 被引量:3
  • 2曹树金 罗春荣.信息知识的分类法与主题法[M].北京图书馆出版社,2000.438.
  • 3史济民.软件工程原理、方法与应用[M].北京:高等教育出版社,1992..
  • 4侯汉清.《中国分类主题词表》的原理、应用及改进[J].江苏高等学校图书馆学报,1998,(1).
  • 5戴晶萍.计算机实现分类号与对应主题词标引的必要性[A]..南京农业大学信息管理系毕业论文[C].,1997..
  • 6安树兰 等.中国机读目录格式使用手册[M].北京:华艺出版社,1995..
  • 7Tim Berners--Lee,James Hendler and Ora Lassila. The Sem-antic Web. Scientific American, May 2001.
  • 8Heather Kreger. Web Services Conceptual Architecture 1.0. IBM Software Group. May 2001.
  • 9T.R. Gruber. A translation approach to portable ontology specifications. Knowledge Acquisition 5(2).
  • 10Jeen Broekstra, Mickel Klein, Stefan Decker, Dieter Fensel, etc.Enabling knowledge representation on the Web by extending RDF Schema. Computer Networks 2002,39 : 609.

共引文献79

同被引文献201

引证文献8

二级引证文献139

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部