期刊文献+

基于Python的网络爬虫系统的设计与实现 被引量:24

Design and Implementation of Web Crawler System Based on Python
下载PDF
导出
摘要 网络爬虫一种自动下载网络资源的程序,是搜索引擎的组成之一。使用网络爬虫可以批量采集数据,大大提高数据分析的速度和效率。Python语言简洁、高效,被称“胶水语言”,具有丰富的第三方库,处理网页和链接非常方便。本文介绍了网络爬虫的类型、工作原理以及Python爬虫技术,构建了爬取网页图片的爬虫系统。 Web crawkers are programs to download resources from internet,oen of basic componments of search engines.Using web crawler can collect data in batches,which greatly improves the speed and efficiency of data analysis.Python language is simple and efficient,known as"glue language",with rich third library,which is very convenient to handle web pages and links.This paper introduces the types of web crawler,working principle and python crawler technology,and constructs a crawler system for crawling web images.
作者 冯艳茹 FENG Yan-ru(Jiyuan vocational and Technical College,Jiyuan 459000,China)
出处 《电脑与信息技术》 2021年第6期47-50,共4页 Computer and Information Technology
基金 济源职业技术学院院级重点课题(课题编号:JZXY-2020-62) 河南省教育科学“十三五”规划2020年度一般课题(课题编号:2020YB0653)。
关键词 网络爬虫 数据分析 PYTHON语言 搜索 HTML Web crawker data analysis Python language search HTML
  • 相关文献

参考文献3

二级参考文献37

共引文献107

同被引文献161

引证文献24

二级引证文献23

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部