期刊文献+

集群式智能型网络信息自动搜寻与采集系统 被引量:1

Automatic Network Information Retrieving System Based onCluster Mode with Intellectual Characteristic
下载PDF
导出
摘要 互联网上分布的许多用于搜集网络信息的WebSpiders(网络爬虫)一般都工作在单机上,难以快速完成大规模的信息采集工作.对此提出了一种集群式Spider系统的构想,它能够使许多Spider工作在不同的主机上完成同一项任务(每个Spider负责一部分,可动态调整),因此可大大加速信息采集工作.文中描述了这种系统的体系结构与模型,并介绍了该系统的一种实现,即ChinaWebWizard.它不仅可以在集群模式下工作,还能动态地发现新的站点.该系统为搜索引擎提供了底层支持,对网点建设者和开发者具有参考价值. There have been many spiders on the Web and they normally can run only on one machine.Here we suggest a system that belongs to the Spider family but has significant differences from others. It can work in cluster which means that many Spiders can host on many machines to perform one task and speed up the whole process. The article describes the system architecture and models and introduces an implementation of this system that is China Web Wizard and can work in cluster and dynamically find new Web sites. The system provides fundamental support for search engineers and has great reference values for Web site builder developers.
作者 王宇 张秀彬
出处 《上海交通大学学报》 EI CAS CSCD 北大核心 1998年第8期36-41,共6页 Journal of Shanghai Jiaotong University
关键词 搜索引擎 INTERNET 集群式 智能型 CWWizard search engine Web spiders cluster mode HTTP server
  • 相关文献

参考文献5

  • 1张秀彬,褚贵宏,王宇,李卫平.基于 PCL818HG 高速数据采集系统的设计[J].上海交通大学学报,1998,32(6):115-118. 被引量:2
  • 2刘素丽(译),Internet编程,1996年
  • 3方敏,网络环境下的编程技巧及实例,1996年
  • 4郑全战(译),Windows NT高级编程技术,1994年
  • 5周明天,TCP/IP网络原理与技术,1993年

二级参考文献5

共引文献1

同被引文献2

引证文献1

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部