期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于MapReduce的开源代码并行爬取方法研究与实现
被引量:
2
1
作者
马军岩
曾国荪
《信息网络安全》
CSCD
北大核心
2018年第1期58-66,共9页
随着互联网上开源代码越来越多,设计程序时寻找和复用已有的开源代码已经成为软件工程的一种趋势。为了快速和精准地搜索开源代码,文章设计了基于Map Reduce计算模型的源代码并行爬取方法,并编写代码,实现了源代码并行爬取系统。文章首...
随着互联网上开源代码越来越多,设计程序时寻找和复用已有的开源代码已经成为软件工程的一种趋势。为了快速和精准地搜索开源代码,文章设计了基于Map Reduce计算模型的源代码并行爬取方法,并编写代码,实现了源代码并行爬取系统。文章首先分析当前各种开源代码库,选择合适的代码爬取场所和爬取对象,明确并行爬取的工作流程和目标;然后给出源代码并行爬取的Map方法和Reduce方法,基于此设计一套开源代码并行爬取算法;最后利用集群计算环境实现开源代码的并行爬取。实验表明,多机并行搜索源代码与传统方法相比,速度明显提高,且搜索的返回结果可信度更高。
展开更多
关键词
软件工程
源代码搜索
并行爬取
MAPREDUCE
开源代码
下载PDF
职称材料
题名
基于MapReduce的开源代码并行爬取方法研究与实现
被引量:
2
1
作者
马军岩
曾国荪
机构
同济大学计算机科学与技术系
国家高性能计算机工程技术中心同济分中心
出处
《信息网络安全》
CSCD
北大核心
2018年第1期58-66,共9页
基金
国家高技术研究发展计划(863计划)[2009AA012201]
同济大学实验教学改革基金[0800104214]
文摘
随着互联网上开源代码越来越多,设计程序时寻找和复用已有的开源代码已经成为软件工程的一种趋势。为了快速和精准地搜索开源代码,文章设计了基于Map Reduce计算模型的源代码并行爬取方法,并编写代码,实现了源代码并行爬取系统。文章首先分析当前各种开源代码库,选择合适的代码爬取场所和爬取对象,明确并行爬取的工作流程和目标;然后给出源代码并行爬取的Map方法和Reduce方法,基于此设计一套开源代码并行爬取算法;最后利用集群计算环境实现开源代码的并行爬取。实验表明,多机并行搜索源代码与传统方法相比,速度明显提高,且搜索的返回结果可信度更高。
关键词
软件工程
源代码搜索
并行爬取
MAPREDUCE
开源代码
Keywords
software engineering
source code searching
parallel crawling
Map Reduce
open source code
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于MapReduce的开源代码并行爬取方法研究与实现
马军岩
曾国荪
《信息网络安全》
CSCD
北大核心
2018
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部