期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Scrapy的GitHub数据爬虫 被引量:18
1
作者 赵本本 殷旭东 王伟 《电子技术与软件工程》 2016年第6期199-202,共4页
作为最大的社交编程及代码托管网站,GitHub提供了丰富的数据来源。基于Python开源框架Scrapy设计实现了一个Web爬虫,能对GitHub的资源抓取和分析,并进行了结构化处理和存储,可为后续数据分析提供基础。介绍了GitHub爬虫的设计原理、算... 作为最大的社交编程及代码托管网站,GitHub提供了丰富的数据来源。基于Python开源框架Scrapy设计实现了一个Web爬虫,能对GitHub的资源抓取和分析,并进行了结构化处理和存储,可为后续数据分析提供基础。介绍了GitHub爬虫的设计原理、算法的实现方式,对实验结果进行了分析。 展开更多
关键词 网络爬虫 数据爬取 Scrapy GitHub PYTHON NOSQL
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部