期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
面向海量网络数据的收集方法研究与分析
被引量:
2
下载PDF
职称材料
导出
摘要
网络爬虫是当前应用最普遍的针对海量网络数据的收集方法,其通过一定规则和URL自动抓取互联网信息及数据,主要是由程序来实现的。研究和分析了海量网络数据收集方法的理论基础,针对微博用户信息数据收集,提出了一种基于Scrapy框架的爬虫方法。
作者
鲜敏
机构地区
陕西省地震局
出处
《电脑编程技巧与维护》
2021年第8期64-66,共3页
Computer Programming Skills & Maintenance
基金
陕西省地震局启航与创新基金课题QC202020o。
关键词
网络数据
爬虫
微博
Scrapy框架
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
10
参考文献
2
共引文献
60
同被引文献
20
引证文献
2
二级引证文献
2
参考文献
2
1
吴永聪.
浅谈Python爬虫技术的网页数据抓取与分析[J]
.计算机时代,2019,0(8):94-96.
被引量:19
2
曾健荣,张仰森,郑佳,黄改娟,陈若愚.
面向多数据源的网络爬虫实现技术及应用[J]
.计算机科学,2019,46(5):304-309.
被引量:44
二级参考文献
10
1
周立柱,林玲.
聚焦爬虫技术研究综述[J]
.计算机应用,2005,25(9):1965-1969.
被引量:155
2
王晶,朱珂,汪斌强.
基于信息数据分析的微博研究综述[J]
.计算机应用,2012,32(7):2027-2029.
被引量:21
3
孙青云,王俊峰,赵宗渠,高梦超.
一种基于模拟登录的微博数据采集方案[J]
.计算机技术与发展,2014,24(3):6-10.
被引量:30
4
周中华,张惠然,谢江.
基于Python的新浪微博数据爬虫[J]
.计算机应用,2014,34(11):3131-3134.
被引量:62
5
王曙燕,王璇,孙家泽.
基于XPath路径的Web应用测试脚本修复[J]
.计算机应用研究,2017,34(5):1393-1396.
被引量:6
6
刘宇,郑成焕.
基于Scrapy的深层网络爬虫研究[J]
.软件,2017,38(7):111-114.
被引量:29
7
于营.
面向微博的网络爬虫数据采集[J]
.信息系统工程,2017,30(12):36-37.
被引量:7
8
罗咪.
基于Python的新浪微博用户数据获取技术[J]
.电子世界,2018,0(5):138-139.
被引量:10
9
胡萍瑞,李石君.
基于URL模式集的主题爬虫[J]
.计算机应用研究,2018,35(3):694-699.
被引量:18
10
高峰,刘震,高辉.
结合有监督广度优先搜索策略的通用垂直爬虫方法[J]
.计算机工程,2018,44(11):289-299.
被引量:7
共引文献
60
1
金昌锦.
多数据源招聘信息采集的爬虫系统实现[J]
.福建电脑,2019,35(11):13-16.
被引量:1
2
杨毅.
基于爬虫大数据的网络负载异常监测方法[J]
.河南科技,2019,38(34):33-35.
被引量:2
3
李仕阳,唐万梅.
爬虫及可视化技术辅助“MOOC+SPOC”混合式教学的探索与应用[J]
.计算机时代,2020,0(1):98-101.
被引量:3
4
王中伟,裘杭萍,孙毅,邓巧雨.
基于时间上下文的军事信息推荐方法[J]
.指挥信息系统与技术,2019,10(6):55-59.
被引量:4
5
成文莹,李秀敏.
基于Python的电影数据爬取与数据可视化分析研究[J]
.电脑知识与技术,2019,15(11):8-10.
被引量:14
6
翟普.
python网络爬虫爬取策略对比分析[J]
.电脑知识与技术,2020,16(1):29-30.
被引量:7
7
高艳.
基于Selenium框架的大数据岗位数据爬取与分析[J]
.工业控制计算机,2020,33(2):109-111.
被引量:6
8
张艳,吴玉全.
基于Python的网络数据爬虫程序设计[J]
.电脑编程技巧与维护,2020,0(4):26-27.
被引量:14
9
朱乐,李秋萍,朱燚丹.
基于深度学习的“教育公平”网络舆情分析[J]
.情报探索,2020,0(6):40-47.
被引量:9
10
曾诚.
基于Python的网络爬虫及数据可视化和预测分析[J]
.信息与电脑,2020,32(9):167-169.
被引量:6
同被引文献
20
1
郑玉刚,谢永健.
中小城市旅游市场发展机制创新的对策建议[J]
.价格月刊,2007(6):35-36.
被引量:3
2
胡娅丽.
贵州饮食文化旅游资源开发研究[J]
.河南师范大学学报(哲学社会科学版),2011,38(3):128-130.
被引量:18
3
马兴超,马树才.
旅游发展能够降低城乡收入差距吗?——来自浙江省县级层面的实证[J]
.经济体制改革,2017(1):18-25.
被引量:18
4
周晓琴,明庆忠,李美婷.
山区中小城市交通驱动旅游发展及其关联性[J]
.经济地理,2017,37(7):216-224.
被引量:11
5
田梓辰,刘淼.
基于改进灰色GM(1,1)模型的GDP预测实证[J]
.统计与决策,2018,0(11):83-85.
被引量:34
6
田梓辰,刘淼.
基于高斯正交化插值的灰色GM(1,1)模型的新疆GDP实证分析与预测[J]
.伊犁师范学院学报(自然科学版),2018,12(2):17-21.
被引量:1
7
刘德光,王朝举,刘玲.
少数民族地区农户对旅游发展的福利感知研究——以贵州肇兴侗寨为例[J]
.贵州社会科学,2019(5):88-93.
被引量:3
8
董少林,李钟慎.
采用Scrapy分布式爬虫技术的微博热点舆情信息获取与分析[J]
.电脑与信息技术,2020,28(5):23-26.
被引量:3
9
陈盼.
基于GM(1,1)模型的陕西省旅游发展研究[J]
.现代营销(下),2020(10):180-182.
被引量:2
10
张友友,许云斐.
丝路经济带甘肃段旅游业发展影响因素研究[J]
.忻州师范学院学报,2020,36(5):61-65.
被引量:11
引证文献
2
1
樊国庆,朱轩民,高润平.
贵州省旅游收入预测及发展研究分析[J]
.保山学院学报,2023,42(4):91-99.
被引量:2
2
黄志高.
微博数据爬虫的检测方法研究[J]
.现代计算机,2023,29(16):64-68.
二级引证文献
2
1
赵秀兰.
基于向量自回归模型的旅游业相关因素分析——以贵州省为例[J]
.科技资讯,2024,22(13):249-252.
2
马啸天.
新疆旅游收入的组合预测及发展研究分析[J]
.特区经济,2024(9):112-115.
1
李承远.
时频转换在自动扶梯梯级机器人自动抓取检测中的应用[J]
.中国电梯,2021,32(16):39-41.
被引量:1
2
刘莹,祝学云,徐佳文.
基于视觉机器人的自动抓取机械手控制研究[J]
.现代信息科技,2021,5(8):156-158.
被引量:3
电脑编程技巧与维护
2021年 第8期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部