期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
分布式爬虫系统中URL去重的设计与实现 被引量:2
1
作者 陈宇伦 周奎 《现代信息科技》 2019年第11期105-106,110,共3页
目前全球URL总数在350亿以上,在满足时效性的前提下,越来越多地选择采用分布式爬虫技术,它可以快速高效地从Web中获取有价值的数据。基于Redis数据库设计一种相关去重协议,实现URL去重,有利于提高分布式系统的稳定性和高效性,以及保持... 目前全球URL总数在350亿以上,在满足时效性的前提下,越来越多地选择采用分布式爬虫技术,它可以快速高效地从Web中获取有价值的数据。基于Redis数据库设计一种相关去重协议,实现URL去重,有利于提高分布式系统的稳定性和高效性,以及保持整个系统对URL去重的一致性。 展开更多
关键词 分布式爬虫系统 url去 url去重协议
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部