期刊文献+

基于Python的多线程网络爬虫系统的研究与实现

Research and implementation of multi-threaded Web crawler system based on Python
下载PDF
导出
摘要 网络爬虫是通过编写程序模拟浏览器访问服务器、获取目标数据的方法。在大数据环境下,爬虫速度成为影响网络爬虫性能的重要评价条件之一。Python语言因其丰富的第三方库,被广泛应用于网络爬虫及数据分析等场景。文章基于Python编程语言,以提高网络爬虫速度为目的,探讨实现网络爬虫速度提升的方案,并以某网站智能图片爬取为例实现多线程爬虫系统。 A Web crawler is a method of obtaining target data by programming to simulate a browser accessing a server.In the big data environment,the speed of Web crawler is one of the important evaluation criteria affecting the performance of Web crawler.The Python language is widely used in scenarios such as Web crawler and data analysis due to its rich third-party libraries.Based on the Python programming language,the solution to improve the speed of Web crawling is explored in this paper with the target of improving the speed of Web crawling.And taking the intelligent image crawling on a certain Website as an example,a multi-threaded crawling system is implemented.
作者 刘莹 LIU Ying(Jinan Polytechnic Engineering,Jinan 250200,China)
出处 《无线互联科技》 2024年第14期44-46,共3页 Wireless Internet Technology
关键词 Python技术 网络爬虫 大数据 多线程 Python technology Web crawler big data multi-threading
  • 相关文献

参考文献5

二级参考文献30

共引文献50

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部