摘要
从网络爬虫技术的原理出发,介绍如何利用该技术对网页数据进行智能抓取,为互联网海量数据的智能抓取提供了一种新思路。
Based on the principle of web crawler technology, how to use it to intelligently capture web page data are introduced, which providing a new idea for intelligent capture of massive internet data.
作者
肖敏
周舟涛
熊斌
张译
Xiao Min;Zhou Zhoutao;Xiong Bin;Zhang Yi(Xinyu Iron & Steel Group Co.,Ltd.Xinyu 338001 Jiangxi,China)
出处
《江西冶金》
2018年第5期43-45,共3页
Jiangxi Metallurgy
关键词
爬虫技术
数据抓取
数据清洗
crawler technology
data capture
data cleaning