期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于Python的多线程网络爬虫系统的研究与实现

Research and implementation of multi-threaded Web crawler system based on Python

下载PDF

导出

摘要网络爬虫是通过编写程序模拟浏览器访问服务器、获取目标数据的方法。在大数据环境下,爬虫速度成为影响网络爬虫性能的重要评价条件之一。Python语言因其丰富的第三方库,被广泛应用于网络爬虫及数据分析等场景。文章基于Python编程语言,以提高网络爬虫速度为目的,探讨实现网络爬虫速度提升的方案,并以某网站智能图片爬取为例实现多线程爬虫系统。 A Web crawler is a method of obtaining target data by programming to simulate a browser accessing a server.In the big data environment,the speed of Web crawler is one of the important evaluation criteria affecting the performance of Web crawler.The Python language is widely used in scenarios such as Web crawler and data analysis due to its rich third-party libraries.Based on the Python programming language,the solution to improve the speed of Web crawling is explored in this paper with the target of improving the speed of Web crawling.And taking the intelligent image crawling on a certain Website as an example,a multi-threaded crawling system is implemented.

作者刘莹 LIU Ying(Jinan Polytechnic Engineering,Jinan 250200,China)

机构地区济南工程职业技术学院

出处《无线互联科技》 2024年第14期44-46,共3页 Wireless Internet Technology

关键词 Python技术网络爬虫大数据多线程 Python technology Web crawler big data multi-threading

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1何西远,张岳,张秉文.基于分布式爬虫的微博舆情监督与情感分析系统设计[J].现代信息科技,2024,8(5):111-114. 被引量：3
2黄子纯,蔡敏.基于Java多线程的智能图片爬虫系统的研究与实现[J].电脑知识与技术,2022,18(22):55-57. 被引量：2
3沈冰,周亮,李娟,冯平,刘瑾.基于定制主题网络爬虫技术的不良信息检测系统设计[J].电子技术与软件工程,2022(5):5-8. 被引量：1
4杨健,陈伟.基于Python的三种网络爬虫技术研究[J].软件工程,2023,26(2):24-27. 被引量：21
5钟机灵.基于Python网络爬虫技术的数据采集系统研究[J].信息通信,2020(4):96-98. 被引量：28

二级参考文献30

1刘子谦,王志强.基于爬虫和文本处理的微博舆情分析系统[J].北京电子科技学院学报,2020(3):31-39. 被引量：5
2王林.基于Linux的高并发网络聊天系统设计[J].智能计算机与应用,2020(7):176-179. 被引量：1
3周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969. 被引量：153
4曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008,17(5):122-126. 被引量：39
5孙强,李建华,李生红.基于Python的文本分类系统开发研究[J].计算机应用与软件,2011,28(3):13-14. 被引量：15
6高万林,张港红,李桢,赵佳宁.关于农业信息化与农村信息化关系的探讨[J].中国农学通报,2011,27(1):466-470. 被引量：49
7夏火松,李保国.基于Python的动态网页评价爬虫算法[J].软件工程,2016,19(2):43-46. 被引量：20
8薛丽敏,吴琦,李骏.面向专用信息获取的用户定制主题网络爬虫技术研究[J].信息网络安全,2017(2):12-21. 被引量：18
9张芳,王培进.主题网络爬虫技术在高速公路信息采集中的应用[J].烟台大学学报（自然科学与工程版）,2017,30(3):255-260. 被引量：4
10姚云飞,杜洪波,梁建辉.基于SpringMVC框架毕业设计管理系统设计[J].软件,2018,39(1):91-93. 被引量：17

共引文献50

1高生华,何济武,胡素臻,赵雪.面向遗留系统的数据采集方法[J].网络安全与数据治理,2023,42(S02):156-160.
2居梓俊,邓居旺,孙建振,李东阳,黄翀鹏.基于Python和Hadoop的图书馆实时监控系统设计与实现[J].电脑编程技巧与维护,2020(8):20-22. 被引量：1
3温佐承,贾雪.基于Python的网络爬取[J].电脑编程技巧与维护,2020(12):23-24. 被引量：8
4李艳,丁国强,张庆.网络招聘数据可视化系统的设计与实现[J].信息与电脑,2021,33(1):112-115. 被引量：2
5陈海燕,朱庆华,常莹.基于Python的网页信息爬取技术研究[J].电脑知识与技术,2021,17(8):195-196. 被引量：4
6李文华.基于Python的网络爬虫系统的设计与实现分析[J].内江科技,2021,42(2):58-59. 被引量：9
7买买提・许库尔,艾孜尔古丽.现代维吾尔语句子资源库构建研究[J].信息与电脑,2021,33(5):204-207.
8胡雅丽.基于Python爬取视频的设计与实现[J].通信电源技术,2021,38(3):191-193.
9吴道君.大数据背景python在网络爬虫框架中的应用[J].科学技术创新,2021(21):97-99. 被引量：4
10贺宗平,王正路.一种面向互联网文本数据采集框架的设计[J].电子技术与软件工程,2021(12):187-189. 被引量：4

1曲彤晖.基于蚁群算法的分布式网络爬虫系统研究[J].信息与电脑,2023,35(12):88-91. 被引量：2
2郭婺,郭建,张劲松,石翠萍,刘道森,刘超.基于Python的网络爬虫的设计与实现[J].信息记录材料,2023,24(4):159-162. 被引量：5
3何佳知.基于Scrapy框架的分布式网络爬虫系统设计[J].电子产品世界,2024,31(6):31-34.
4林永意,卜言彬.一种支持动态页面的分布式爬虫系统设计与实现[J].无线互联科技,2024,21(6):84-86.
5张军,魏继桢,李钰彬.基于资源感知的分布式爬虫任务调度方法[J].现代电子技术,2024,47(9):86-90.
6池国俊.基于Storm的可扩展的分布式网络爬虫系统设计研究[J].电脑知识与技术,2024,20(20):89-91.
7刘逸凯,吴瑰.融合ChatGPT的智能化Selenium网络爬虫设计与实现[J].现代信息科技,2024,8(14):69-75.
8朱玉全,孙蕾,黄承宁.面向复杂工程问题的算法系列课程教学案例选择与设计方法探讨[J].高教学刊,2024,10(26):110-113.

无线互联科技

2024年第14期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部