期刊文献+

智能Web中文主题信息收集系统IRobot的设计 被引量:7

The Design of Intelligent Chinese Web Topic Information Gather System IRobot
下载PDF
导出
摘要 本文介绍了智能Web中文主题信息收集系统IRobot的设计思想和方法。针对Web主题信息收集所具有的许多新特性,系统采用了对待收集URL进行相关度预测为主,对已收集页面进行相关度评价结合的收集机制。尤其在URL的相关度预测中,深入考虑了Web主题信息结构和组织特性的多种因素,综合提高了系统的性能。相比已有的研究,系统的精度和收集效率更高,且更为稳定,并能够自动获得主题领域内重要资源的列表。 This paper introduces the design of intelligent Chinese Web topic information gather system IRobot in detail. According to the new features of Web topic informationgather, this system do relevance predication to the URLs to be gathered,together with the relevance scoring to the pages gathered. Especially in relevant predication, new issues about topic information are taken into account thoroughly. All the factors together improve the performance of system. Compared to other research results in this field, IRobot perform better in precision,efficiency and stability, also it can provide us a list of most important Web resources in topic field searched.
出处 《中文信息学报》 CSCD 北大核心 2002年第5期23-29,共7页 Journal of Chinese Information Processing
关键词 智能Web中文主题信息收集系统 IROBOT 信息检索 相关度预测 相关度评价 中文信息处理 系统设计 information retrieval topic information gather relevance predication relevance scoring Chinese information processing
  • 相关文献

参考文献1

二级参考文献2

共引文献7

同被引文献40

引证文献7

二级引证文献42

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部