可扩展负载均衡Spider的设计

Design of An Extendable Load-Balancing Spider

下载PDF

导出

摘要随着Web信息的快速增长,如何对Web信息进行检索,获取有价值的信息,已经成为Web信息检索的重点研究内容。本文设计一种可扩展的蜘蛛程序Spider,运用负载均衡策略调度分布Spider的协同工作,实现Web站点页面的分布式下载,在获取页面信息的同时,获取站点的拓扑结构。 As Web information grows quickly, how to get important information from Web has being a research focus of Web information retrieval. This paper proposed a new extendable Spider, which was designed by distributed computing and implemented load-balancing collaborative work, so to obtain Website structure when downloading Website info pages.

作者黎才茂陈少凡

机构地区海南大学信息学院计算机系

出处《微计算机信息》北大核心 2008年第30期116-118,共3页 Control & Automation

基金海南省自然科学基金资助项目(80636) 海南省教育厅高校科研基金资助项目(Hjkj200704)

关键词 SPIDER 蜘蛛程序负载均衡分布式 Spider Spider program Load-balancing Distribution

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1吕志花.网络信息挖掘及其在搜索引擎方面的应用[J].微计算机信息,2008,24(6):173-174. 被引量：6
2Shkapenyuk V, SuelT. Design and implementation of a highperformance distributed Web crawler [D]. Polytechnic University: Brooklyn, Mars 2001.
3Youns Hafri, Chabane Djeraba. High Performance Crawling System [C]. In:Proceedings of the 6th ACM SIGMM international workshop on Multimedia information retrieval, 2004, 299-306.
4王征,刘心松,李美安.一种高效的基于可复制资源的分布式负载均衡策略[J].电子学报,2006,34(8):1452-1455. 被引量：3

二级参考文献11

1李英梅,臧宏.面向Web的数据挖掘技术[J].农机化研究,2005,27(3):260-261. 被引量：1
2赵春艳.网络检索中的数据挖掘技术理论与应用[J].情报探索,2006(1):45-47. 被引量：1
3杨占华,杨燕.数据挖掘在智能搜索引擎中的应用[J].微计算机信息,2006,22(04X):244-246. 被引量：22
4Bryant,Raymond M.A stable distributedscheduling algorithm[A].Proceedings of International Wire and Cable Symposium[C].Los Alamitos,California,USA:Comput Soc Press,1981.314-323.
5Barak,Shiloh.Distributed load-balancing policy for a multicomputer[J].Software-Practice and Experience,1985,15(9):901 -913.
6Stankovic.Adaptive bidding algorithm for processes,clusters and distributed groups[A].Proceedings-International Conference on Distributed Computing Systems[C].New York,NY,USA:IEEE,1984.49-59.
7Legrand.Mapping and load-balancing iterative computations[J].Parallel and Distributed Systems,2004,6 (3):546-558.
8Barker K.A load balancing framework for adaptive and asynchronous applications[J].Parallel and Distributed Systems,2004,2(1):183 -192.
9尹俊文,邹鹏,等.分布式操作系统[M].长沙:国防科技大学出版社,2001.123-173.
10王玉珍.Web数据挖掘的分析与探索[J].电脑开发与应用,2003,16(4):73-74. 被引量：13

共引文献7

1帅剑平,周娅,徐芳虹.一种有效的基于密度聚类的排序算法[J].郑州大学学报（理学版）,2009,41(2):52-55.
2韩枫,周光明.地质分析专家系统GAES的设计[J].计算机工程与设计,2007,28(19):4732-4733. 被引量：1
3黎才茂,陈少凡,梁保恩.可扩展Spider负载均衡策略的研究与实现[J].计算机与数字工程,2009,37(2):38-41.
4周朋红.基于Web的图像检索设计与研究[J].微计算机信息,2009,25(21):136-138. 被引量：2
5赵梦龙,龙士工,刘春英.基于HITS算法的云化模型[J].微计算机信息,2009,25(30):169-170.
6魏正曦,邱玲,赵攀.基于灰度分类的图像搜索引擎[J].四川理工学院学报（自然科学版）,2014,27(1):37-40. 被引量：3
7聂璐.搜索引擎在网络信息挖掘中的应用[J].电脑知识与技术,2009,5(9X):7736-7737. 被引量：1

1陈向阳.一个用于web测试的蜘蛛程序[J].商场现代化,2005,0(1S):116-118.
2高克宁,柴桥子,张斌,马安香.支持Web信息分类的高性能蜘蛛程序[J].小型微型计算机系统,2006,27(7):1308-1312. 被引量：6
3县小平.对中文搜索引擎缺陷的思考[J].科技信息,2009(6):143-143.
4县小平.中文搜索引擎缺陷之我见[J].福建电脑,2009,25(5):62-62. 被引量：1
5王小林,刘宏申.搜索引擎的设计研究[J].计算机技术与发展,2007,17(2):5-7. 被引量：7
6孙永鸿.提高“蜘蛛程序”对动态网页访问计数量的方案[J].电脑知识与技术（技术论坛）,2005(2):33-35.
7田晓辉.面向垂直的搜索引擎的设计[J].福建电脑,2014,30(11):29-30.
8王达.提升网站转化率的四步优化方案[J].计算机与网络,2014,40(19):46-47.
9日遥.搜索生活[J].中国计算机用户,2008(1):22-23.
10贾海蕾,胡宏涛.企业信息门户中网络蜘蛛的设计与实现[J].软件导刊,2009,8(2):114-116.

微计算机信息

2008年第30期

浏览历史

内容加载中请稍等...

可扩展负载均衡Spider的设计

参考文献4

二级参考文献11

共引文献7

相关作者

相关机构

相关主题

浏览历史