期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Scrapy的GitHub数据爬虫
被引量:
18
1
作者
赵本本
殷旭东
王伟
《电子技术与软件工程》
2016年第6期199-202,共4页
作为最大的社交编程及代码托管网站,GitHub提供了丰富的数据来源。基于Python开源框架Scrapy设计实现了一个Web爬虫,能对GitHub的资源抓取和分析,并进行了结构化处理和存储,可为后续数据分析提供基础。介绍了GitHub爬虫的设计原理、算...
作为最大的社交编程及代码托管网站,GitHub提供了丰富的数据来源。基于Python开源框架Scrapy设计实现了一个Web爬虫,能对GitHub的资源抓取和分析,并进行了结构化处理和存储,可为后续数据分析提供基础。介绍了GitHub爬虫的设计原理、算法的实现方式,对实验结果进行了分析。
展开更多
关键词
网络爬虫
数据爬取
Scrapy
GitHub
PYTHON
NOSQL
下载PDF
职称材料
题名
基于Scrapy的GitHub数据爬虫
被引量:
18
1
作者
赵本本
殷旭东
王伟
机构
常熟理工学院计算机科学与工程学院
苏州市浪潮电子信息有限公司
出处
《电子技术与软件工程》
2016年第6期199-202,共4页
基金
2015年江苏省大学生实践创新训练计划校企合作基金项目(201510333068H)
文摘
作为最大的社交编程及代码托管网站,GitHub提供了丰富的数据来源。基于Python开源框架Scrapy设计实现了一个Web爬虫,能对GitHub的资源抓取和分析,并进行了结构化处理和存储,可为后续数据分析提供基础。介绍了GitHub爬虫的设计原理、算法的实现方式,对实验结果进行了分析。
关键词
网络爬虫
数据爬取
Scrapy
GitHub
PYTHON
NOSQL
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Scrapy的GitHub数据爬虫
赵本本
殷旭东
王伟
《电子技术与软件工程》
2016
18
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部