基于Selenium框架实现Boss直聘网数据爬取与分析被引量：2

Data Crawling and Analysis of Boss Employment Network Based on Selenium Framework

下载PDF

导出

摘要本文基于Selenium框架绕过网站设置的反爬机制,实现Boss直聘网爬虫工程师岗位的自动化爬取,将爬取后的数据存储到csv文件,之后利用pandas库对岗位数据进行数据分析并将分析结果可视化展示,在《数据爬取》课程中以此为教学案例,可以提升学生的专业和职业认同感,同时为学生未来就业提供了参考。 Based on selenium framework,this paper passes the anti crawling mechanism set by the website,realizes the automatic crawling of the web crawler engineer,then stores the crawled data to CSV file and analyzes the crawled data by pandas,at last,visual display of analysis results is carries out.Taking this as a teaching case in the course of data crawling,it can enhance students?professional and professional identity,at the same time,it provides a reference for students?future employment.

作者裴丽丽 Pei Lili(Shanxi Institute of Mechanical and Electrical Engineering,Changzhi Shanxi 046011,China)

机构地区山西机电职业技术学院

出处《山西电子技术》 2022年第5期66-68,76,共4页 Shanxi Electronic Technology

关键词 SELENIUM 数据爬取数据分析职业认同感 Selenium data crawling data analysis professional identity

分类号 TP311.52 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1李培.基于Python的网络爬虫与反爬虫技术研究[J].计算机与数字工程,2019,47(6):1415-1420. 被引量：52
2沈熠辉.以Selenium为核心的亚马逊爬虫与可视化[J].福建电脑,2021,37(12):43-46. 被引量：5
3韩贝,马明栋,王得玉.基于Scrapy框架的爬虫和反爬虫研究[J].计算机技术与发展,2019,29(2):139-142. 被引量：26

二级参考文献20

1陈晴光.电子商务数据挖掘可视化系统模型研究及应用[J].计算机工程与应用,2007,43(5):242-245. 被引量：4
2漆志辉,杨天奇.网络爬虫性能研究[J].微型机与应用,2011,30(5):72-74. 被引量：3
3赵本本,殷旭东,王伟.基于Scrapy的GitHub数据爬虫[J].电子技术与软件工程,2016(6):199-202. 被引量：18
4邹科文,李达,邓婷敏,李嘉振,陈义明.网络爬虫针对“反爬”网站的爬取策略研究[J].电脑知识与技术,2016,0(3):61-63. 被引量：15
5鲁萍.带你进入网络爬虫与反爬虫的世界[J].软件和集成电路,2016(12):12-13. 被引量：3
6黄媛.面向网络爬虫的企业网站优化策略[J].信息系统工程,2017,30(4):23-23. 被引量：2
7闫立达,薛朋强.基于匿名网络的网络爬虫设计与实现[J].现代计算机,2017,23(11):45-49. 被引量：4
8花君林.基于Selenium的Python网络爬虫的实现[J].电脑编程技巧与维护,2017(15):30-31. 被引量：17
9刘宇,郑成焕.基于Scrapy的深层网络爬虫研究[J].软件,2017,38(7):111-114. 被引量：29
10陆文.十分钟解决爬虫问题超轻量级反爬虫方案[J].计算机与网络,2017,43(17):58-60. 被引量：1

共引文献78

1邓子云.基于Scrapy的网站增量式爬取功能的研制与应用[J].湖南工业职业技术学院学报,2022,22(6):25-29.
2姚万勤,宋俊豪.在技术与法律之间:网络爬虫刑法规制的边界[J].法治论坛,2023(1):3-17. 被引量：1
3郝光兆,杨静,吴迪,生龙.“Python程序设计”课程智能答疑系统的设计与实现[J].电脑知识与技术,2019,15(3):86-88. 被引量：4
4苏艺航,徐海蛟,何佳蕾,杨振宇,王佳鹏.基于Python爬虫的校园数据获取[J].电脑知识与技术,2019,15(6Z):86-88. 被引量：2
5蔡勇.智慧洪泽时空信息云平台关键技术研究与应用[J].江苏科技信息,2019,36(20):41-44. 被引量：2
6徐勤亚,楚士杰.基于Tableau的北京市房屋租赁市场现状分析[J].无线互联科技,2019,16(15):129-130.
7叶文全.基于C#+ScrapySharp+Selenium的数据采集技术研究[J].湖北第二师范学院学报,2019,36(8):44-48. 被引量：2
8尤天琪,冯思毓,周陈雯淑,潘润超.电商数据的爬取及价格模型的建立[J].信息与电脑,2019,0(17):138-140.
9鲁丰玲.基于Scrapy的招聘信息爬虫设计与实现[J].科技资讯,2019,17(20):7-10. 被引量：4
10庄旭菲,田雪.基于Scrapy和Elasticsearch的校园网搜索引擎的研究与实现[J].科技资讯,2019,17(29):12-15. 被引量：3

同被引文献10

1张倩.后疫情时代高校毕业生“慢就业”现象破解路径探究[J].就业与保障,2022(9):9-11. 被引量：2
2章胤,赵文慧,包恒玥,李亚健,周克强.基于k-means和关联度分析的网络招聘信息数据挖掘[J].软件工程,2017,20(5):10-14. 被引量：5
3何苗,张蕴.基于Selenium框架的定向网络数据获取的设计与实现[J].工业控制计算机,2020,33(6):45-47. 被引量：3
4许景贤,林锦程,程雨萌.Selenium框架的反爬虫程序设计与实现[J].福建电脑,2021,37(1):26-29. 被引量：6
5张渊博.网站反爬虫策略的分析与研究[J].电子元器件与信息技术,2021,5(1):14-15. 被引量：5
6李嘉恩.大数据反爬虫技术的应用分析[J].无线互联科技,2021,18(24):82-83. 被引量：5
7周毅,宁亮,王鸥,孙海波,何金.基于Python的网络爬虫和反爬虫技术研究[J].现代信息科技,2021,5(21):149-151. 被引量：8
8彭仲生,谌雯洁.基于工作搜寻理论的后疫情时代高校毕业生高质量就业策略探析[J].高教学刊,2022,8(25):1-5. 被引量：4
9杨嘉怡.民办高校大学生就业质量影响实证研究[J].黑龙江科学,2022,13(19):26-29. 被引量：2
10金萌.地方高校毕业生就业质量影响因素研究[J].商洛学院学报,2022,36(5):70-77. 被引量：5

引证文献2

1王帅.基于Selenium框架的反爬虫程序设计与实现[J].信息记录材料,2023,24(6):86-88. 被引量：3
2戎蓉,王凤,申云成.大数据技术助推地方本科院校毕业生求职能力提升研究[J].科学与信息化,2024(19):62-64.

二级引证文献3

1乔显栋,任睿智,史贺龙,费嘉琛.气象网页数据反爬虫措施探讨[J].数字技术与应用,2024,42(2):112-114.
2刘志鹏,陈琦,许超焕,梅灿,李逸雪.基于Selenium的课程评论自动爬取软件设计与实现[J].电脑编程技巧与维护,2024(6):19-22.
3刘晓魁,肖树鹏.开放网络环境下的反爬虫技术研究[J].网络安全技术与应用,2024(7):19-22. 被引量：1

1桑丽丽,朱晗.基于Neo4J的人物事件关系知识图谱构建研究[J].电脑知识与技术,2022,18(22):18-20. 被引量：1
2跟小灵通学数学知识的英语表达[J].数学小灵通（烧脑版）（中高年级）,2022(10):47-47.
3张紫云.基于Python计算生态的财务异常数据检测[J].科学与信息化,2022(19):79-82. 被引量：1
4鲁国良,袁铁山.基于CNN的新型诈骗网站识别系统开发[J].科学技术创新,2022(28):61-64. 被引量：2
5Zhang Shasha.Holiday in Colors[J].Beijing Review,2022,65(42):36-37.

山西电子技术

2022年第5期

浏览历史

内容加载中请稍等...

基于Selenium框架实现Boss直聘网数据爬取与分析被引量：2

参考文献3

二级参考文献20

共引文献78

同被引文献10

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Selenium框架实现Boss直聘网数据爬取与分析 被引量：2

参考文献3

二级参考文献20

共引文献78

同被引文献10

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Selenium框架实现Boss直聘网数据爬取与分析被引量：2