期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于R-树索引的Map-Reduce空间连接聚集操作 被引量:5
1
作者 刘义 陈荦 +1 位作者 景宁 熊伟 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第1期136-141,共6页
空间连接聚集是一种常用并且非常耗时的空间数据库操作,特别是在面对大规模空间数据集时,单机运行环境难以满足其对时空开销的需求,如何设计高效的面向云计算环境中的分布式空间连接聚集算法越来越受到人们关注。Map-Reduce作为云计算... 空间连接聚集是一种常用并且非常耗时的空间数据库操作,特别是在面对大规模空间数据集时,单机运行环境难以满足其对时空开销的需求,如何设计高效的面向云计算环境中的分布式空间连接聚集算法越来越受到人们关注。Map-Reduce作为云计算的核心模式受限于其扁平化的串行扫描操作模型,常被用来加速非索引的空间连接操作,现有工作尚无将Map-Reduce和R-树索引结合来处理空间连接聚集。因此,提出了基于R-树索引的Map-Reduce空间连接聚集算法(RSJA-MR)来更高效地返回连接聚集结果。提出一种分布式R-树索引结构以支持大规模空间数据的索引,RSJA-MR算法利用分布式R-树生成任务集,任务集的执行满足无依赖并行计算模式,很容易在Map-Reduce框架中进行表达。文中提出一种实时缓存策略以支持索引并发访问。实验结果表明:相比非索引的Map-Reduce连接聚集算法,在空间交叠连接聚集查询上,时间性能最少提升8%,在空间包含连接聚集查询上,时间性能最少提升近35%。 展开更多
关键词 云计算 MAP-REDUCE 空间连接聚集 R-树
下载PDF
基于MapReduce的连接聚集查询算法研究 被引量:7
2
作者 陈勇旭 陈梦杰 +1 位作者 刘雪冰 宋杰 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期306-311,共6页
数据的指数级增长给数据管理和分析带来了严峻的挑战.连接聚集查询是数据分析中一种常用运算,而MapReduce是一种用于大规模数据集并行处理的编程模型,研究基于MapReduce的连接聚集查询算法有着学术意义和应用价值.首先在归纳和扩展现有... 数据的指数级增长给数据管理和分析带来了严峻的挑战.连接聚集查询是数据分析中一种常用运算,而MapReduce是一种用于大规模数据集并行处理的编程模型,研究基于MapReduce的连接聚集查询算法有着学术意义和应用价值.首先在归纳和扩展现有连接算法的基础上总结出4种基于MapReduce的连接聚集查询算法;接着根据应用场景的不同又提出另外两种实现算法;同时提出I/O代价是决定基于MapReduce的连接聚集查询算法性能的主要因素;最后通过大量实验分析这6种算法在不同查询应用下的优劣,总结了它们各自的适用场景,并分析了各个算法的性能与数据特征之间的关系. 展开更多
关键词 海量数据 连接聚集查询 MAPREDUCE I/O代价 算法优化
下载PDF
海量数据上的近似连接聚集操作 被引量:3
3
作者 韩希先 杨东华 李建中 《计算机学报》 EI CSCD 北大核心 2010年第10期1919-1933,共15页
连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信区间方式来处理近似连接聚集,因此... 连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信区间方式来处理近似连接聚集,因此提出了一种新的算法——(p,ε)-近似连接聚集查询(pε-AJA)来有效地返回满足任意置信区间的近似连接聚集结果.文章提出且预计算两个数据结构:连接随机样本(JRS)和连接位置索引对表(JPIPT).利用JRS,pε-AJA向用户返回近似结果的快速响应.如果利用JRS得到的近似结果没有满足给定的置信区间,pε-AJA利用JPIPT获得更多的随机连接元组.文中提出一种采样算法来获得JPIPT给定数量的样本,并且利用获得的JPIPT样本,该文提出的算法可通过对连接表的一遍顺序扫描获得连接元组.该文还提供了JPIPT和JRS有效的构建和维护算法.实验结果表明:pε-AJA可以获得相对于准确查询1~5个数量级的加速,并且可以有效地完成JPIPT和JRS的构建和维护操作. 展开更多
关键词 pε-近似连接聚集 连接位置索引对表 连接随机样本 海量数据
下载PDF
融合多核和MapReduce的连接聚集查询优化 被引量:1
4
作者 尚宏佳 周萍 +3 位作者 杨青 李优 钱俊彦 张敬伟 《计算机研究与发展》 EI CSCD 北大核心 2015年第S1期9-18,共10页
连接聚集查询是大规模数据分析的核心操作算子之一,多核处理器为大规模数据的连接聚集查询操作提供了优化空间但同时也存在很大挑战.主要针对多核处理器集群环境,研究MapReduce框架下大规模数据连接聚集查询的优化算法.首先,基于传统Map... 连接聚集查询是大规模数据分析的核心操作算子之一,多核处理器为大规模数据的连接聚集查询操作提供了优化空间但同时也存在很大挑战.主要针对多核处理器集群环境,研究MapReduce框架下大规模数据连接聚集查询的优化算法.首先,基于传统MapReduce框架设计并实现了Map端的单线程连接聚集查询算法,基于实验分析指出MapReduce和多核处理器融合提升性能的必要性;其次,针对处理器的多核架构,设计并实现了Map端的多线程连接聚集查询算法,找出了MapReduce和多核处理器融合的性能瓶颈;进而,提出了Map端对输入分片无竞争读取的多线程连接聚集查询算法,该算法让MapReduce充分利用了多核处理器的性能优势.实验结果表明,提出的算法在大规模数据的连接聚集查询处理上充分发挥了硬件优势,具有较好的时间性能和可扩展性. 展开更多
关键词 查询优化 分布式处理 连接聚集查询 多核处理器 无竞争读取
下载PDF
基于共享Cache多核处理器的Radix聚集连接优化
5
作者 邓亚丹 景宁 +1 位作者 熊伟 吴秋云 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第4期68-73,共6页
基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并... 基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并根据聚集连接执行时的代价模型,优化了聚集连接执行框架和各种线程参数。在实验中,基于内存数据库EaseDB实现了本文提出了算法,实验结果表明,聚集连接性能得到较大提高。 展开更多
关键词 多核处理器 radix—join 聚集连接
下载PDF
基于滑动窗口的数据流连续J-A查询的处理方法 被引量:18
6
作者 王伟平 李建中 +1 位作者 张冬冬 郭龙江 《软件学报》 EI CSCD 北大核心 2006年第4期740-749,共10页
数据流滑动窗口连接聚集连续查询(简记J-A查询)是经常使用的一类查询.这类查询的直观处理方法是创建查询操作树,以流水线的方式计算查询结果.这种方法需要在主存中保存滑动窗口连接的结果,查询处理的主存空间开销为Ο(α×β),其中... 数据流滑动窗口连接聚集连续查询(简记J-A查询)是经常使用的一类查询.这类查询的直观处理方法是创建查询操作树,以流水线的方式计算查询结果.这种方法需要在主存中保存滑动窗口连接的结果,查询处理的主存空间开销为Ο(α×β),其中α,β为参加连接两个滑动窗口的大小.在数据流的查询处理中,内存是最重要的计算资源.提出了两种滑动窗口J-A连续查询处理算法——IC算法和TC算法,使得查询处理的空间开销降为Ο(α+β).理论分析和实验结果表明,所提出的算法具有更高的效率. 展开更多
关键词 数据流 滑动窗口 连接聚集 连续查询
下载PDF
一种简单方法制备具有项链结构的介孔磷酸铈材料 被引量:1
7
作者 邵高耸 《化工新型材料》 CAS CSCD 北大核心 2013年第11期31-33,共3页
新颖的具有项链结构的一维介孔磷酸铈材料通过一种简单方法(水包油的“微型反应器”)成功合成。通过SEM,TEM,XRD和氮气吸附对合成材料形貌、晶体结构、比表面积及孔径分布进行表征分析。合成的磷酸铈为六方相晶体结构;由宽约10nm,... 新颖的具有项链结构的一维介孔磷酸铈材料通过一种简单方法(水包油的“微型反应器”)成功合成。通过SEM,TEM,XRD和氮气吸附对合成材料形貌、晶体结构、比表面积及孔径分布进行表征分析。合成的磷酸铈为六方相晶体结构;由宽约10nm,长10-20nm的纳米珠组成具有项链结构的链状纳米结构,链长度约几百纳米;氮气吸附表征证明材料具有典型介孔特征,比表面积为74m2/g,孔径大小集中在2-3nm和10-12nm。项链结构的形成可通过定向连接聚集生长机理实现。在合成制备其它新型复杂纳米材料中会起到积极作用。 展开更多
关键词 磷酸铈 项链 介孔 定向连接聚集
下载PDF
制造物联网中高吞吐率复杂事件检测技术研究
8
作者 李幸斌 程良伦 《传感器与微系统》 CSCD 2015年第9期44-47,共4页
复杂事件处理能非常有效地检测到事件流中有价值的模式,高吞吐率意味着单位时间内获取更多有价值的信息。为复杂事件处理提出一种提高吞吐率的查询技术,通过聚集活动实例栈中的连接,并批量执行序列构造,减少了相同连接的遍历,降低了序... 复杂事件处理能非常有效地检测到事件流中有价值的模式,高吞吐率意味着单位时间内获取更多有价值的信息。为复杂事件处理提出一种提高吞吐率的查询技术,通过聚集活动实例栈中的连接,并批量执行序列构造,减少了相同连接的遍历,降低了序列构造处理的运行频率,从而提高了复杂事件处理的吞吐率。仿真实验表明:提出的方案相比于SASE提出的传统方案,吞吐率有数倍的提升。 展开更多
关键词 聚集连接 制造物联网 复杂事件处理 活动实例栈
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部