摘要
网络爬虫一种自动下载网络资源的程序,是搜索引擎的组成之一。使用网络爬虫可以批量采集数据,大大提高数据分析的速度和效率。Python语言简洁、高效,被称“胶水语言”,具有丰富的第三方库,处理网页和链接非常方便。本文介绍了网络爬虫的类型、工作原理以及Python爬虫技术,构建了爬取网页图片的爬虫系统。
Web crawkers are programs to download resources from internet,oen of basic componments of search engines.Using web crawler can collect data in batches,which greatly improves the speed and efficiency of data analysis.Python language is simple and efficient,known as"glue language",with rich third library,which is very convenient to handle web pages and links.This paper introduces the types of web crawler,working principle and python crawler technology,and constructs a crawler system for crawling web images.
作者
冯艳茹
FENG Yan-ru(Jiyuan vocational and Technical College,Jiyuan 459000,China)
出处
《电脑与信息技术》
2021年第6期47-50,共4页
Computer and Information Technology
基金
济源职业技术学院院级重点课题(课题编号:JZXY-2020-62)
河南省教育科学“十三五”规划2020年度一般课题(课题编号:2020YB0653)。