期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
大数据背景下依托于Python的网络爬虫技术研究
被引量:
4
下载PDF
职称材料
导出
摘要
网络爬虫在网络数据收集与分析上发挥了重要的作用。在大数据背景下,依托于Python的网络爬虫技术具有操作简单、应用便捷、第三方库功能齐全以及文本字符串处理效果好等优势。论文利用爬虫技术进行网页抓取具有广度最先、深度最先以及相似最先三种检索方案,包含了URL管理器模块、网页下载器模块与网页解析器模块。
作者
周竞鸿
机构地区
湖北国土资源职业学院
出处
《信息系统工程》
2021年第3期69-70,73,共3页
关键词
PYTHON
网络爬虫
技术研究
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
33
参考文献
8
共引文献
69
同被引文献
26
引证文献
4
二级引证文献
2
参考文献
8
1
刘顺程,岳思颖.
大数据时代下基于Python的网络信息爬取技术[J]
.电子技术与软件工程,2017(21):160-160.
被引量:14
2
逄菲.
基于Python的分布式网络爬虫系统的设计与实现[J]
.电子技术与软件工程,2018(23):6-6.
被引量:11
3
孙艺乘,张建敏.
大数据数字媒体时代网络爬虫技术下的精准招商[J]
.贵州大学学报(自然科学版),2017,34(2):80-84.
被引量:9
4
王思敏,尹伊秋,宣静雯,马冲.
基于网络爬虫技术的数字资源检测软件的设计与实现[J]
.现代电子技术,2019,42(10):132-135.
被引量:13
5
温娅娜,袁梓梁,何咏宸,黄猛.
基于Python爬虫技术的网页解析与数据获取研究[J]
.现代信息科技,2020,4(1):12-13.
被引量:16
6
李杰秦.
基于Python语言下网络爬虫的技术特点及应用设计[J]
.数字通信世界,2020,0(1):209-210.
被引量:8
7
余本国.
基于python网络爬虫的浏览器伪装技术探讨[J]
.太原学院学报(自然科学版),2020,38(1):47-50.
被引量:8
8
胡少宇,刘志民,董科.
大数据数字媒体时代网络爬虫技术下的精准招商[J]
.电子技术与软件工程,2019(5):4-5.
被引量:3
二级参考文献
33
1
王琦,唐世渭,杨冬青,王腾蛟.
基于DOM的网页主题信息自动提取[J]
.计算机研究与发展,2004,41(10):1786-1792.
被引量:81
2
许文,都云程,李渝勤,施水才.
一种通用HTML网页主题信息提取方法[J]
.现代图书情报技术,2007(1):40-43.
被引量:11
3
刘金红,陆余良.
主题网络爬虫研究综述[J]
.计算机应用研究,2007,24(10):26-29.
被引量:132
4
庄纪林.
数字图书馆网络服务的监测[J]
.大学图书馆学报,2008,26(3):38-42.
被引量:4
5
宋磊,王静文.
OpenBSD下基于Nagios的网络服务监控报警系统的研究[J]
.电脑编程技巧与维护,2009(14):112-113.
被引量:27
6
陈涛.
网络服务性能监测系统设计与实现[J]
.现代电子技术,2010,33(10):133-135.
被引量:4
7
彭晓庆.
高校图书馆电子资源服务监控系统设计与实现[J]
.现代图书情报技术,2011(4):82-88.
被引量:12
8
金涛.
网络爬虫在网页信息提取中的应用研究[J]
.现代计算机,2012,18(1):16-18.
被引量:11
9
叶兰.
电子资源管理系统实施与应用研究[J]
.图书情报工作,2012,56(13):89-94.
被引量:12
10
温晓明.
基于Python的电子资源可用性检测方案[J]
.中华医学图书情报杂志,2013,22(1):68-71.
被引量:6
共引文献
69
1
姜宝华.
大数据时代Python课程教学改革与学科竞赛[J]
.计算机产品与流通,2020,9(4):237-237.
2
周峦,林芸,陈露诗.
剖宫产术中出血相关因素的探讨[J]
.广东医学,2000,21(5):420-421.
被引量:1
3
张即帅.
基于爬虫技术的校园网络热点话题提取分类研究[J]
.自动化与仪器仪表,2018,0(3):90-92.
被引量:2
4
盛逍遥,吴友邦,王翔,李丽.
智能推荐算法在规国房系统中的应用[J]
.天津科技,2018,45(9):73-76.
5
张喜红,王玉香.
基于Scrapy的中药材网络信息采集方法研究[J]
.江汉大学学报(自然科学版),2018,46(6):522-527.
被引量:2
6
唐琳,董依萌,何天宇.
基于Python的网络爬虫技术的关键性问题探索[J]
.电子世界,2018,0(14):32-33.
被引量:6
7
逄菲.
基于Python的分布式网络爬虫系统的设计与实现[J]
.电子技术与软件工程,2018(23):6-6.
被引量:11
8
李小红,吕向风,董保莲.
大数据背景下的Java知识地图构建研究[J]
.电脑与电信,2018(12):15-17.
9
刘清.
网络爬虫针对“反爬”网站的爬取策略分析[J]
.信息与电脑,2019,31(3):23-24.
被引量:11
10
胡俊潇,陈国伟.
网络爬虫反爬策略研究[J]
.科技创新与应用,2019,9(15):137-138.
被引量:9
同被引文献
26
1
关俊波,谭瑛,黄彬.
5G时代网管架构和技术方案研究[J]
.广西通信技术,2021(3):38-41.
被引量:2
2
谢红.
Python多线程机制初探[J]
.电脑知识与技术,2011,7(7):4739-4740.
被引量:2
3
朱茵,隋晓庆.
国内外综合运输系统智能化发展现状[J]
.综合运输,2012,34(4):22-26.
被引量:7
4
王松,黄柯棣,杨妹.
基于动态数据驱动的交通在线决策[J]
.计算机仿真,2019,36(1):167-170.
被引量:7
5
李瑞敏.
城市交通信号控制系统发展分析[J]
.综合运输,2015,37(7):104-108.
被引量:6
6
夏新海.
多Agent强化学习下的城市路网自适应交通信号协调配时决策研究综述[J]
.交通运输研究,2017,3(2):17-23.
被引量:2
7
仇善梁,房翠.
基于阿里钉钉的班级管理应用探索与实践[J]
.河北软件职业技术学院学报,2018,20(1):1-3.
被引量:15
8
孙红光,藏润强,姬传德,杨凤芹,冯国忠.
基于语义的聚焦爬虫算法研究[J]
.东北师大学报(自然科学版),2018,50(2):51-57.
被引量:9
9
余本国.
基于python网络爬虫的浏览器伪装技术探讨[J]
.太原学院学报(自然科学版),2020,38(1):47-50.
被引量:8
10
赵俊杰,李思霖,孙博瑞,李梦浩.
浅谈大数据环境下基于python的网络爬虫技术[J]
.中国新通信,2020,22(4):68-68.
被引量:6
引证文献
4
1
吴宇鹏.
分布式计算视域的网络爬虫技术研究[J]
.信息与电脑,2021,33(19):87-89.
2
朱昭俊,李雪芹.
基于Python与Tensorflow的交通信号决策系统[J]
.综合运输,2022,44(5):74-79.
被引量:1
3
张利峰,孙永凤.
基于IT的5G工程优化过程管控[J]
.长江信息通信,2022,35(5):215-218.
被引量:1
4
李强.
基于Python的新闻聚合系统网络爬虫研究[J]
.软件,2023,44(1):168-170.
二级引证文献
2
1
林志广.
基于IT的5G工程优化过程管控研究[J]
.通讯世界,2022,29(10):4-6.
2
邓兰,吴义虎.
基于异步优势强化学习的交通信号控制策略[J]
.交通科学与工程,2023,39(3):110-117.
1
梁敏,秦海波,覃京燕,殷绪成.
AI设计下的智能驾驶场景文本识别技术[J]
.包装工程,2021,42(6):13-19.
被引量:6
2
邹维,李廷元.
基于Scrapy爬虫框架的领域网站文件爬取[J]
.现代信息科技,2020,4(21):6-9.
被引量:5
信息系统工程
2021年 第3期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部