期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于MapReduce的封闭立方体并行计算方法 被引量:8
1
作者 奚建清 游进国 +1 位作者 汤德佑 肖伟吉 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第1期91-95,112,共6页
封闭立方体是一种非常有效而重要的数据立方体压缩技术,目前还缺乏对其并行算法的研究.为此,文中提出一种采用C-Cubing方法并通过MapReduce并行模型进行并行化的新方法.该方法首先在Map过程中对各个数据分块计算出数据单元的代表元组和... 封闭立方体是一种非常有效而重要的数据立方体压缩技术,目前还缺乏对其并行算法的研究.为此,文中提出一种采用C-Cubing方法并通过MapReduce并行模型进行并行化的新方法.该方法首先在Map过程中对各个数据分块计算出数据单元的代表元组和封闭掩码,然后在Reduce过程中进行聚合以获得封闭单元.实验结果表明,文中方法能有效地提高在大数据集上计算封闭立方体的速度. 展开更多
关键词 数据仓库 联机分析处理 并行算法 封闭立方体 mapreduce技术
下载PDF
在PC集群上的封闭立方体计算 被引量:1
2
作者 游进国 奚建清 +1 位作者 张平健 刘艳霞 《计算机科学》 CSCD 北大核心 2009年第6期153-155,161,共4页
封闭立方体是联机分析处理中一种有效的数据立方体压缩技术,但封闭立方体的并行算法目前很少有相关文献研究。提出了一种简单而实用的解决方案,即基于MapReduce计算框架,在非共享内存的PC集群上对封闭立方体进行分布式的预计算和查询。... 封闭立方体是联机分析处理中一种有效的数据立方体压缩技术,但封闭立方体的并行算法目前很少有相关文献研究。提出了一种简单而实用的解决方案,即基于MapReduce计算框架,在非共享内存的PC集群上对封闭立方体进行分布式的预计算和查询。相关实验表明,本方法能快速处理千万级的数据,具有较好的线性加速比,而且能够更大地压缩数据立方体存储空间。 展开更多
关键词 联机分析处理 并行计算 封闭立方体 mapreduce技术
下载PDF
PHCC:一种处理稀疏变化的封闭数据立方体算法 被引量:2
3
作者 牟雁超 李红燕 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2013年第S2期85-93,共9页
完全数据立方体是一种需要在数据集上对属性列进行上卷聚集运算的复杂模型,而封闭数据立方体是一种对应的高效压缩模型.近年来海量数据管理系统的发展使得在大数据上进行数据立方体的计算成为可能,但是大数据环境中的数据可能稀疏也可... 完全数据立方体是一种需要在数据集上对属性列进行上卷聚集运算的复杂模型,而封闭数据立方体是一种对应的高效压缩模型.近年来海量数据管理系统的发展使得在大数据上进行数据立方体的计算成为可能,但是大数据环境中的数据可能稀疏也可能密集,因此,要求在不同的数据稀疏程度下算法都要有稳定的表现.面对这样的要求,提出了一种基于大数据环境的封闭数据立方体并行化方法,首先通过构造2种树结构进行本地封闭数据子立方体的构造,然后利用位运算的方式在遍历树结构的同时进行封闭数据立方体的判断和聚集运算,最后经过合并得到查询的最终结果.并且通过在大数据中进行对比实验证明混合并行封闭数据立方体(parallel hybrid closed cubing,PHCC)算法能够满足在稀疏数据变化的数据中进行稳定聚集运算的条件. 展开更多
关键词 封闭数据立方体 大数据 树结构 mapreduce 并行化计算
下载PDF
基于Map/Reduce的外壳片段立方体并行计算方法 被引量:4
4
作者 唐珊珊 朱跃龙 朱凯 《计算机工程与应用》 CSCD 北大核心 2015年第22期124-129,共6页
针对高维、维度分层的大数据集,提出一种基于Map/Reduce框架的并行外壳片段立方体构建算法。算法采用Map/Reduce框架,实现外壳片段立方体的并行构建与查询。构建算法在Map过程中,计算出各个数据分块所有可能的数据单元或层次维编码前缀;... 针对高维、维度分层的大数据集,提出一种基于Map/Reduce框架的并行外壳片段立方体构建算法。算法采用Map/Reduce框架,实现外壳片段立方体的并行构建与查询。构建算法在Map过程中,计算出各个数据分块所有可能的数据单元或层次维编码前缀;在Reduce过程中,聚合计算得到最终的外壳片段和度量索引表。实验证明,并行外壳片段立方体算法一方面结合了Map/Reduce框架的并行性和高扩展性,另一方面结合了外壳片段立方体的压缩策略和倒排索引机制,能够有效避免高维数据物化时数据量的爆炸式增长,提供快速构建和查询操作。 展开更多
关键词 联机分析处理 外壳片段立方体 Map/Reduce技术 并行计算
下载PDF
一种基于MapReduce的频繁闭项集挖掘算法 被引量:18
5
作者 陈光鹏 杨育彬 +1 位作者 高阳 商琳 《模式识别与人工智能》 EI CSCD 北大核心 2012年第2期220-224,共5页
频繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一种基于Hadoop云计算平台的频繁闭项集的并行挖掘算法.该算法主... 频繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式.当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路.文中提出并实现一种基于Hadoop云计算平台的频繁闭项集的并行挖掘算法.该算法主要包括并行计数、构造全局频繁项表、并行挖掘局部频繁闭项集和并行筛选全局频繁闭项集四个步骤.在多个数据集上的实验表明,该方法能较大提高数据挖掘的效率,具有较好的加速比. 展开更多
关键词 云计算 并行算法 数据挖掘 频繁闭项集 mapreduce
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部