基于Python和Requests快速获取网页数据的方法研究被引量：2

Research on Method of Quickly Obtaining Web Data Based on Python and Requests

下载PDF

导出

摘要随着“互联网+”和大数据时代的到来,网络上充斥着各种各样的数据,过滤并获取有用的数据在当今环境下至关重要。文章提出一种基于Python和Requests模块的快速获取网页数据的方法,使用该方法可以获取解析前的网页源代码文本和图片数据,并保存为本地文件,为之后的数据分析和深入学习大数据技术奠定基础。实验结果表明,该方法步骤和代码编写简单易学,运行结果较好,具有一定的实用性。 With the arrival of the“Internet+”and big data era,the network is full of all kinds of data.Filtering and obtaining useful data is crucial in today's environment.This paper proposes a method to quickly acquire web data based on Python and Requests modules.Using this method,you can obtain the text and image data of the web source code before parsing,and save them as local files,laying the foundation for later data analysis and in-depth study of big data technology.The experimental results show that the steps and coding of this method are easy to learn,the running results are good,and it has certain practicability.

作者姜庆玲张樊 JIANG Qingling;ZHANG Fan(Wuchang Institute of Technology,Wuhan 430065,China)

机构地区武昌工学院

出处《现代信息科技》 2023年第16期100-103,108,共5页 Modern Information Technology

基金基于计算机设计大赛视角的计算机类专业应用型创新能力培养的研究与实践(2023JY11)。

关键词 Python技术 Requests模块网络图片爬取 Python technology Requests module network image crawling

分类号 TP312.1 [自动化与计算机技术—计算机软件与理论] TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1邓晓璐,姚松.基于Scrapy的新浪微博数据爬虫研究[J].现代信息科技,2023,7(3):44-47. 被引量：4
2曾水新,黄日胜.基于Scrapy的房产信息爬取系统设计[J].电脑编程技巧与维护,2022(12):26-28. 被引量：1
3胡学军,李嘉诚.基于Scrapy-Redis的分布式爬取当当网图书数据[J].软件工程,2022,25(10):8-11. 被引量：4
4魏海昱,林伟鸿,贺超波.基于Scrapy的食品安全舆情数据爬取与分析[J].现代计算机,2022,28(14):49-54. 被引量：5
5伍高巍,刘杰,葛晓龙,徐望成.基于Scrapy的研招网硕士目录爬虫的设计与实现[J].电脑知识与技术,2022,18(17):53-55. 被引量：3
6杨健,陈伟.基于Python的三种网络爬虫技术研究[J].软件工程,2023,26(2):24-27. 被引量：21

二级参考文献31

1张宁蒙.基于Python的网络爬虫技术探析[J].移动信息,2020(2):84-85. 被引量：1
2刘世涛.简析搜索引擎中网络爬虫的搜索策略[J].阜阳师范学院学报（自然科学版）,2006,23(3):59-62. 被引量：15
3王锋,王伟,张璟,罗作民.基于Linux的网络爬虫系统[J].计算机工程,2010,36(1):280-282. 被引量：8
4郑岚.Python访问MySQL数据库[J].电脑编程技巧与维护,2010(6):59-61. 被引量：13
5SU Fei,LIN Zhao-wen,MA Yan.Modeling and analysis of Internet worm propagation[J].The Journal of China Universities of Posts and Telecommunications,2010,17(4):63-68. 被引量：3
6陈莉莉,张丽,刘正龙.搜索引擎中基于状态的Ajax动态网页提取研究[J].计算机应用与软件,2013,30(7):217-220. 被引量：9
7夏火松,李保国.基于Python的动态网页评价爬虫算法[J].软件工程,2016,19(2):43-46. 被引量：20
8王亚民,胡悦.基于BTM的微博舆情热点发现[J].情报杂志,2016,35(11):119-124. 被引量：27
9刘宇,郑成焕.基于Scrapy的深层网络爬虫研究[J].软件,2017,38(7):111-114. 被引量：29
10罗娇敏,耿茜.一种基于Redis的分布式爬虫系统设计与实现[J].软件,2017,38(10):83-87. 被引量：5

共引文献27

1高生华,何济武,胡素臻,赵雪.面向遗留系统的数据采集方法[J].网络安全与数据治理,2023,42(S02):156-160.
2何芳.基于Scrapy的电子商务数据分析系统设计[J].电子技术与软件工程,2022(24):200-204.
3姜庆玲,张樊.基于Python与Requests模块的网络图片爬虫程序设计[J].电脑编程技巧与维护,2023(6):59-61.
4徐正雄,刘辉,李思琳,雷姣惠,李捷波,肖文博.阳光采购平台数据自动采集信息系统设计与实现[J].电脑编程技巧与维护,2023(6):106-108. 被引量：1
5徐博.基于NLPIR框架的食品安全网络舆情管理指标体系建构[J].食品科学技术学报,2023,41(5):165-174. 被引量：1
6赵鹏,苏楠,于慧霞.基于Scrapy的高性能网站状态批量采集系统[J].中国新通信,2023,25(13):48-50.
7房伟伟,韩猛.人工智能在自然语言处理中的应用[J].信息记录材料,2023,24(9):221-223.
8龚建生,许丽金.基于Python和Qt的车载乘客信息系统设备状态检测平台[J].设备管理与维修,2023(21):147-149. 被引量：2
9万好,谢叶康,段志应.基于文本挖掘的计算机类招聘数据分析与可视化系统设计[J].电脑与电信,2023(8):29-35. 被引量：1
10张豪,朱石磊,胡建华,杨洁.基于B/S架构的校园论坛系统的设计与实现[J].电脑知识与技术,2023,19(33):32-35. 被引量：2

同被引文献22

1侯亮.2020国外测井技术进展与趋势[J].世界石油工业,2020(6):49-54. 被引量：11
2陈殿房,韩祥立,杨晶.油井液面探测方法探讨[J].油气井测试,2008,17(2):60-61. 被引量：17
3方娟.基于LabVIEW的实时信号处理软件在随钻测量系统上的设计与应用[J].石油管材与仪器,2016,2(3):24-27. 被引量：4
4巫伟峰,张群英.基于互联网学术搜索引擎分析国内树莓研究现状——以“百度学术”为例[J].安徽农学通报,2019,25(14):50-52. 被引量：1
5郭媛媛.新技术发展背景下的媒体与社会[J].新闻文化建设,2020,0(2):32-38. 被引量：2
6关欣,王魁生,宋彩利.油井动液面监测系统的设计与实现[J].西安石油大学学报（自然科学版）,2020,35(3):122-126. 被引量：7
7王清媛,黄全舟.浅析机器学习在石油测井领域的研究进展[J].清洗世界,2021,37(3):120-122. 被引量：4
8王路平,魏勇,汪玉祥,陈强,刘国权,马伟楠.井下动液面声波信号处理方法研究[J].电子测量技术,2021,44(22):87-95. 被引量：9
9崔小名,魏勇,郭涛,张杰,张学.动液面检测仪中声波信号模拟器的设计[J].国外电子测量技术,2022,41(1):57-62. 被引量：4
10时春波,李卫东,秦丹阳,张海啸,吴峥嵘.Python环境下利用Selenium与JavaScript逆向技术爬虫研究[J].河南科技,2022,41(10):20-23. 被引量：8

引证文献2

1崔梦银,邓茵,刘满意.Python爬虫技术在学术聚合系统中的应用[J].现代信息科技,2024,8(10):68-74.
2刘国权,陈强,王璐,陈子欣,魏勇,甘如饴.基于Python的动液面测控软件开发[J].石油管材与仪器,2024,10(4):87-91.

1姜庆玲,张樊.基于Python与Requests模块的网络图片爬虫程序设计[J].电脑编程技巧与维护,2023(6):59-61.
2董格格.网络图片著作权钓鱼式维权行为的法律规制[J].河北企业,2023(6):142-144.
3南鹏,群诺,温瑶,尼玛扎西.基于决策级融合策略的中文网络模因图片判别方法研究[J].中央民族大学学报（自然科学版）,2023,32(2):24-30.
4张火妹.信息技术与数学教学的融合探析[J].成才之路,2023(23):93-96. 被引量：1

现代信息科技

2023年第16期

浏览历史

内容加载中请稍等...

基于Python和Requests快速获取网页数据的方法研究被引量：2

参考文献6

二级参考文献31

共引文献27

同被引文献22

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Python和Requests快速获取网页数据的方法研究 被引量：2

参考文献6

二级参考文献31

共引文献27

同被引文献22

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Python和Requests快速获取网页数据的方法研究被引量：2