期刊文献+

并行数据采集器任务分配策略的设计与实现

Design and implementation of parallel crawler task assignment strategy
下载PDF
导出
摘要 介绍了搜索引擎数据采集器的并行技术 ,分析了并行数据采集器的任务分配模式及其工作原理 ,讨论了任务粒度对动态分配效果的影响 ,并提出了动态分配模式下的任务分配策略 ,最后介绍了SunONEGridEngine的任务调度机制 。 In this paper, parallel technology of Web crawler of search engine is introduced. Parallel crawler task assignment modes and their principles are analyzed. The impact of Task granularity on dynamic task assignment is discussed. A dynamic task assignment strategy is proposed and finally implemented using Sun ONE Grid Engine after an introduction to the Sun ONE Grid Engine task scheduling mechanism.
出处 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第S1期105-107,共3页 Journal of Huazhong University of Science and Technology(Natural Science Edition)
基金 广东省计算机网络重点实验室项目 (2 0 0 1 2 7)
关键词 搜索引擎 并行数据采集 分配策略 search engine parallel crawler assignment strategy
  • 相关文献

参考文献1

二级参考文献5

  • 1Arocena97 G.O. Arocena, A.O. Mendelzon, G.A. Mihaila. Applications of a web query language[C]. Proc. 6th International World Wide Web Conference. 1997.
  • 2Spertus97 E. Spertus. ParaSite: mining structural information on the web[C]. Proc. 6th International World Wide Web Conference. 1997.
  • 3G.Salton, M.J.McGill. Introduction to modern information retrieval[M]. New York: McGraw-Hill 1993.
  • 4Jon Kleinberg. Authoritative sources in a hyperlinked environment[C]. Proc. ACM-SLAM Symposium on Discrete Algorithms, 1998
  • 5Lawrence Page, Sergey Brin. The anatomy of a large-scale hypertextual web search engine[J].Computer Networks.1998.30(1~7):107~117

共引文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部