期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
广域网分布式爬虫中的Agent协同与Web划分研究
1
作者 许笑 张伟哲 +1 位作者 张宏莉 方滨兴 《高技术通讯》 EI CAS CSCD 北大核心 2010年第3期239-245,共7页
针对广域网环境下分布式Web爬虫的Agent协同和Web划分两个核心问题进行深入研究,提出了基于顾问服务的分布式Web爬虫系统模型,给出了详细的系统设计方案及Agent协同算法框架,并通过推导证明了顾问服务参与Agent协同能够使分布式爬虫系... 针对广域网环境下分布式Web爬虫的Agent协同和Web划分两个核心问题进行深入研究,提出了基于顾问服务的分布式Web爬虫系统模型,给出了详细的系统设计方案及Agent协同算法框架,并通过推导证明了顾问服务参与Agent协同能够使分布式爬虫系统承受相对较小的网络负载。提出了分布式Web爬虫Web划分的概念,围绕Web划分单元选取及Web划分策略,对Web划分的分类和实现进行了详细的讨论,并通过实验对多种Web划分方法进行了对比和评价,验证了广域网系统相对于局域网系统的优势,并发现运营商互连因素对爬虫系统性能的影响大于地理位置因素的影响。 展开更多
关键词 分布式web爬虫 AGENT协同 web划分 顾问服务
下载PDF
广域网分布式Web爬虫 被引量:25
2
作者 许笑 张伟哲 +1 位作者 张宏莉 方滨兴 《软件学报》 EI CSCD 北大核心 2010年第5期1067-1082,共16页
分析了广域网分布式Web爬虫相对于局域网爬虫的诸多优势,提出了广域网分布式Web爬虫的3个核心问题:Web划分、Agent协同和Agent部署.围绕这3个问题,对目前学术界和商业界出现的多种实现方案和策略进行了全面的综述,深入讨论了研究中遇到... 分析了广域网分布式Web爬虫相对于局域网爬虫的诸多优势,提出了广域网分布式Web爬虫的3个核心问题:Web划分、Agent协同和Agent部署.围绕这3个问题,对目前学术界和商业界出现的多种实现方案和策略进行了全面的综述,深入讨论了研究中遇到的问题与挑战,并论述了广域网分布式Web爬虫的评价模型.最后,对未来的研究方向进行了总结. 展开更多
关键词 搜索引擎 广域网分布式爬虫 web划分 AGENT协同 Agent部署
下载PDF
分布式网络爬虫的设计与实现 被引量:11
3
作者 吴黎兵 柯亚林 +1 位作者 何炎祥 刘楠 《计算机应用与软件》 CSCD 2011年第11期176-179,213,共5页
提出一种可部署于单一网域及多网域间的分布式爬虫DSpider。DSpider能够通过调整节点规模和连接超时阈值,有效部署于LAN和WAN两种网络环境中。首先简要介绍了DSpider的系统结构,然后详细分析了DSpider的任务调度策略,并且在实验中将DSpi... 提出一种可部署于单一网域及多网域间的分布式爬虫DSpider。DSpider能够通过调整节点规模和连接超时阈值,有效部署于LAN和WAN两种网络环境中。首先简要介绍了DSpider的系统结构,然后详细分析了DSpider的任务调度策略,并且在实验中将DSpider爬虫部署在LAN和WAN两种环境中的不同性能作了详细的分析。 展开更多
关键词 DSpider 系统架构 节点协同 web划分
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部