期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
MapReduce框架下基于R-树的k-近邻连接算法 被引量:60
1
作者 刘义 景宁 +1 位作者 陈荦 熊伟 《软件学报》 EI CSCD 北大核心 2013年第8期1836-1851,共16页
针对大规模空间数据的高性能k-近邻连接查询处理,研究了MapReduce框架下基于R-树索引的k-近邻连接查询处理.首先利用无依赖并行和串行同步计算的形式化定义抽象了MapReduce并行编程模型,基于此并行计算模型抽象,分别提出了R-树索引快速... 针对大规模空间数据的高性能k-近邻连接查询处理,研究了MapReduce框架下基于R-树索引的k-近邻连接查询处理.首先利用无依赖并行和串行同步计算的形式化定义抽象了MapReduce并行编程模型,基于此并行计算模型抽象,分别提出了R-树索引快速构建算法和基于R-树的并行k-近邻连接算法.在索引构建过程中,提出一种采样算法以快速确立空间划分函数,使得索引构建符合无依赖并行和串行同步计算抽象,在MapReduce框架下非常容易进行表达.在k-近邻连接查询过程中,基于构建的分布式R-树索引,引入k-近邻扩展框限定查询范围并进行数据划分,然后利用R-树索引进行k-近邻连接查询,提高了查询效率.从理论上分析了所提出算法的通信和计算代价.实验与分析结果表明,该算法在真实数据集的查询上具有良好的效率和可扩展性能,可以很好地支持大规模空间数据的k-近邻连接查询处理,具有良好的实用价值. 展开更多
关键词 云计算 MAPREDUCE k-近邻连接 空间查询 R-树
下载PDF
基于数据流的k-近邻连接算法 被引量:3
2
作者 王飞 秦小麟 +1 位作者 刘亮 沈尧 《计算机科学》 CSCD 北大核心 2015年第5期204-210,共7页
k-近邻连接查询是空间数据库中一种常用的操作,该查询处理过程涉及连接和最近邻查询两个复杂操作。传统的集中式k-近邻连接查询算法已不能适应当前呈爆炸式增长的数据规模,设计分布式k-近邻连接查询算法成为了目前亟需解决的问题。现有... k-近邻连接查询是空间数据库中一种常用的操作,该查询处理过程涉及连接和最近邻查询两个复杂操作。传统的集中式k-近邻连接查询算法已不能适应当前呈爆炸式增长的数据规模,设计分布式k-近邻连接查询算法成为了目前亟需解决的问题。现有的分布式k-近邻连接查询算法都包括了多轮串行的MapReduce任务,而每个MapReduce任务均需要读写分布式文件系统,导致MapReduce不能有效表达多个任务之间的依赖关系,因此算法效率低下。首先提出了一种基于数据流的计算框架,该框架建立在MapReduce之上,将数据处理过程按照数据流图建模。在该框架基础上,提出了一种高效的k-近邻连接算法,它利用空间填充曲线将多维数据映射为一维数据,从而将k-近邻连接查询转化为一维范围查询。实验结果表明,该算法的可扩展性较高,且效率比现有算法更优。 展开更多
关键词 k-近邻连接 数据流 MAPREDUCE 计算框架
下载PDF
基于CUDA的并行K-近邻连接算法实现 被引量:2
3
作者 潘茜 张育平 陈海燕 《计算机科学》 CSCD 北大核心 2016年第10期190-192,219,共4页
针对大规模空间数据的K-近邻连接查询问题,设计了一种CUDA编程模型下K-近邻连接算法的并行优化方法。将K-近邻连接算法的并行过程分两个阶段:1)对参与查询的数据集P和Q分别建立R-Tree索引;2)基于RTree索引进行KNNJ查询。首先根据结点所... 针对大规模空间数据的K-近邻连接查询问题,设计了一种CUDA编程模型下K-近邻连接算法的并行优化方法。将K-近邻连接算法的并行过程分两个阶段:1)对参与查询的数据集P和Q分别建立R-Tree索引;2)基于RTree索引进行KNNJ查询。首先根据结点所在位置划分最小外包框,在CUDA下基于递归网格排序算法创建RTree索引。然后在CUDA下基于R-Tree索引进行KNNJ查询,其中涉及并行求距离和并行距离排序两个阶段:求距离阶段利用每一个线程计算任意两点之间的距离,点与点之间距离的求取无依赖并行;排序阶段将快速排序基于CUDA以实现并行化。实验结果表明,随着样本量的不断增大,基于R-Tree索引的并行K-近邻连接算法的优势更加明显,具有高效性和可扩展性。 展开更多
关键词 CUDA k-近邻连接 空间查询 并行计算 R-Tree索引
下载PDF
MapReduce框架下基于R-树的K-近邻连接算法设计
4
作者 吴丽鑫 闫思宇 《数字技术与应用》 2015年第7期135-135,共1页
计算机技术的发展,使得算法的统计被逐步的处理出来,大规模的数据处理必须被目前阶段的算法所满足,这使得Map Reduce框架下基于R-树的K-近邻连接算法被逐步应用。在Map Reduce框架下,通过抽象提取的方式,能够有效地使得R-树的算法能够... 计算机技术的发展,使得算法的统计被逐步的处理出来,大规模的数据处理必须被目前阶段的算法所满足,这使得Map Reduce框架下基于R-树的K-近邻连接算法被逐步应用。在Map Reduce框架下,通过抽象提取的方式,能够有效地使得R-树的算法能够很好地被K-的临近算法所使用。本文就主要对Map Reduce框架下基于R-树的K-近邻连接算法的设计进行了分析。 展开更多
关键词 MAPREDUCE R-树 云计算 k-近邻连接
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部