期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于Python爬虫技术的互联网数据抓取方法设计被引量：1

Design of Internet Data Grasping Method Based on Python Crawler Technology

下载PDF

导出

摘要针对传统数据抓取方法存在抓取成功率小和时延长的问题,提出基于Python爬虫技术的互联网数据抓取方法。首先,定义目标函数,通过计算获得网络数据关键特征;其次,建立爬虫网络相空间格局,获得Python爬虫的维度;最后,运用广度优先法抓取初始数据中的所有信息数据,找到对应的平衡点。实验结果表明,运用该方法的抓取成功率最高,时延最短。 Aiming at the problems of low success rate and prolonged time in traditional data crawling methods,a Python crawler based internet data crawling method is proposed.Firstly,define the objective function and obtain key features of network data through calculation.Secondly,establish the pattern of phase space of the crawler network to obtain the dimensions of Python crawlers.Finally,use the breadth first method to capture all the information data in the initial data and find the corresponding balance point.The experimental results show that using this method has the highest success rate and the shortest delay in grasping.

作者王芳 WANG Fang(Gandong College,Fuzhou Jiangxi 344000,China)

机构地区赣东学院

出处《信息与电脑》 2023年第7期41-43,共3页 Information & Computer

基金江西省教育厅科技项目(项目编号:GJJ218604)。

关键词 PYTHON 爬虫技术数据抓取 Python crawler technology data capture

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1陈丛,周力臻.基于Python爬虫技术的虚假数据溯源与过滤[J].计算机仿真,2021,38(3):346-350. 被引量：7
2白天瑰.基于网络爬虫技术的大数据采集系统设计[J].电子技术与软件工程,2022(21):251-254. 被引量：5
3沈贵明,刘源.数据抓取行为反不正当竞争法规制困境与对策[J].中国流通经济,2021,35(1):89-96. 被引量：23
4高建成.限制数据抓取行为的正当性及其价值衡量[J].中国流通经济,2022,36(8):117-127. 被引量：9
5姜智彬,崔艳菊.区块链赋能互联网广告数据安全管理研究[J].当代传播,2022(4):95-98. 被引量：4
6昌燕,林雨生,黄思维,张仕斌.面向工业互联网隐私数据分析的量子K近邻分类算法[J].计算机研究与发展,2022,59(5):1082-1091. 被引量：6
7唐巧盈,惠志斌.数据价值链视角下互联网平台的数据权责关系及其治理[J].学术论坛,2021,44(4):56-66. 被引量：10
8陈兵,马贤茹.互联网时代用户数据保护理路探讨[J].东北大学学报（社会科学版）,2021,23(1):96-104. 被引量：7
9庄旭东,王志坚.基于R语言爬虫技术的网页信息抓取方法研究——以抓取二手房数据为例[J].科技风,2019(6):54-54. 被引量：4
10谢蓉蓉,徐慧,郑帅位,马刚.基于网络爬虫的网页大数据抓取方法仿真[J].计算机仿真,2021,38(6):439-443. 被引量：17

二级参考文献96

1梅夏英.企业数据权益原论:从财产到控制[J].中外法学,2021,33(5):1188-1207. 被引量：137
2刘金红,陆余良.主题网络爬虫研究综述[J].计算机应用研究,2007,24(10):26-29. 被引量：132
3黄武双.经济理性、商业道德与商业秘密保护[J].电子知识产权,2009(5):37-42. 被引量：22
4王先林.论反不正当竞争法调整范围的扩展——我国《反不正当竞争法》第2条的完善[J].中国社会科学院研究生院学报,2010(6):64-72. 被引量：63
5蒋舸.关于竞争行为正当性评判泛道德化之反思[J].现代法学,2013,35(6):85-95. 被引量：91
6杨华权.论爬虫协议对互联网竞争关系的影响[J].知识产权,2014,24(1):12-21. 被引量：31
7杨轩.程序化广告的信任危机与对策[J].青年记者,2018,0(34):37-38. 被引量：3
8李扬,张旗.私力救济抗辩初探[J].中山大学学报（社会科学版）,2019,59(1):146-157. 被引量：4
9高富平.论个人信息保护的目的——以个人信息保护法益区分为核心[J].法商研究,2019,36(1):93-104. 被引量：148
10孟小峰,张啸剑.大数据隐私管理[J].计算机研究与发展,2015,52(2):265-281. 被引量：93

共引文献82

1高生华,何济武,胡素臻,赵雪.面向遗留系统的数据采集方法[J].网络安全与数据治理,2023,42(S02):156-160.
2陈为.数据抓取行为的反不正当竞争法规制[J].网络信息法学研究,2021(1):81-96. 被引量：1
3王晨.数据抓取行为的不正当竞争问题与法律规制研究[J].中国产经,2023(4):51-53. 被引量：1
4任保平,巩羽浩.数字经济发展促进区域协调发展:理论机理与实现路径[J].改革与战略,2023,39(4):89-98. 被引量：9
5周行.人脸信息立法保护的规范体系建构[J].中南民族大学学报（人文社会科学版）,2021,41(8):128-135. 被引量：5
6邓社民,侯燕玲.企业数据竞争法保护的现实困境及其出路[J].科技与法律（中英文）,2021(5):1-10. 被引量：24
7刘星,姜南,欧忠辉,马艺闻.数字经济时代企业数据权益保护研究[J].情报杂志,2021,40(10):91-98. 被引量：19
8林婧,陈琳.数据抓取行为的反不正当竞争法规制[J].电子科技大学学报（社科版）,2021,23(6):28-35. 被引量：10
9方莎莎.数据收集行为中反垄断法与数据保护规则的衔接[J].经济研究导刊,2021(34):156-158.
10成曼丽.大数据时代算法歧视的协同治理[J].中国流通经济,2022,36(1):104-116. 被引量：10

同被引文献4

1胡海潮.基于新浪微博的爬虫程序设计与实现[J].无线互联科技,2018,15(9):40-42. 被引量：3
2温娅娜,袁梓梁,何咏宸,黄猛.基于Python爬虫技术的网页解析与数据获取研究[J].现代信息科技,2020,4(1):12-13. 被引量：15
3丁然.基于Python爬虫技术的高校网络舆情数据分析研究--以“安徽审计职业学院百度贴吧”为例[J].现代信息科技,2023,7(5):106-108. 被引量：2
4古志敏,吴明珠.基于Python网络爬虫设计与实现[J].电脑编程技巧与维护,2023(9):163-166. 被引量：9

引证文献1

1彭健.基于Python的抖音“高职教育教学”舆情数据抓取与分析[J].科技资讯,2024,22(15):253-256. 被引量：1

二级引证文献1

1张梦莹,陈柯萱.基于计算思维的高职“Python程序设计”课程教学模式创新研究[J].计算机应用文摘,2024,40(23):36-38.

1林海,赵路犇,胡雅淇.数字乡村建设是否能够推动革命老区共同富裕[J].中国农村经济,2023(5):81-102. 被引量：38
2宫慧.《声生不息宝岛季》如何实现音综的创新发展——基于豆瓣评论数据的文本分析[J].统计学与应用,2023,12(3):630-637.
3柯黎明.大数据背景下制造业企业税务风险管控问题及其对策探讨[J].企业改革与管理,2023(9):136-138. 被引量：5
4黄文倩,李雪莲.基于在线评论挖掘的宠物家具产品设计改进方法[J].Design（汉斯）,2023,8(2):140-152.
5李佳玉.基于POI数据的成都市旅游资源空间分布特征与影响因素研究[J].自然资源信息化,2023(3):53-59. 被引量：2

信息与电脑

2023年第7期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部