期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Crawler4j和Quartz的分布式爬虫系统
1
作者 刘晓东 林凤德 朱文欢 《科技创新与应用》 2020年第13期15-16,共2页
网络爬虫是实现数据分析的重要基础,通过网络爬虫可实现对数据的获取。针对爬虫的渠道广、数量多且杂、单点效率低的问题,引入了轻量级的多线程爬虫框架Crawler4j和分布式定时任务调度框架Quartz,文章主要基于这两个框架来搭建稳定、高... 网络爬虫是实现数据分析的重要基础,通过网络爬虫可实现对数据的获取。针对爬虫的渠道广、数量多且杂、单点效率低的问题,引入了轻量级的多线程爬虫框架Crawler4j和分布式定时任务调度框架Quartz,文章主要基于这两个框架来搭建稳定、高效的分布式爬虫系统。 展开更多
关键词 网络爬虫 分布式 crawler4j QUARTZ
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部