-
题名基于NCrawler的网络爬虫设计及其应用探讨
被引量:3
- 1
-
-
作者
杨琳
慕云逸
时铭月
-
机构
上海计算机软件技术开发中心
上海民航华东凯亚系统集成有限公司
上海华虹宏力半导体制造有限公司
-
出处
《软件产业与工程》
2016年第5期31-35,共5页
-
基金
张江专项发展资金(201501-PD-LJZ-C104-004)
-
文摘
网络爬虫技术经过多年的发展,传统的应用和分析相对成熟,但是随着大数据、移动互联网时代的到来,在大规模、海量异构、隐蔽信息的实时快速采集和获取方面,仍然存在诸多的困难。本文对网络爬虫的技术原理进行分析,开发了基于NCrawler的网络爬虫软件并进行应用,可依据关键词灵活在网页深度、广度搜索两种搜索策略中调整权重,具有广泛的扩展能力,支持各种类型及格式资源的爬取。最后本文对网络爬虫技术的应用领域和趋势进行了分析和展望。
-
关键词
网络爬虫
NCrawler
网络爬虫设计
网络爬虫应用
-
Keywords
Device Interface Protocol, Network System Safely Docking, Entrance Control System
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
-