期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
非均匀数据分布下的MapReduce连接查询算法优化
被引量:
1
1
作者
张敬伟
尚宏佳
+2 位作者
钱俊彦
周萍
杨青
《计算机科学与探索》
CSCD
北大核心
2017年第5期752-767,共16页
MapReduce分布式计算框架有助于提升大规模数据连接查询的效率,但当连接属性分布不均匀时,其简单的散列策略容易导致计算节点间负载不均衡,影响作业的整体性能。针对连接查询操作中的数据倾斜问题,研究了MapReduce框架下大规模数据连接...
MapReduce分布式计算框架有助于提升大规模数据连接查询的效率,但当连接属性分布不均匀时,其简单的散列策略容易导致计算节点间负载不均衡,影响作业的整体性能。针对连接查询操作中的数据倾斜问题,研究了MapReduce框架下大规模数据连接查询操作的优化算法。首先对经典的改进重分区连接查询算法进行实验分析,研究了传统MapReduce计算框架下连接查询操作的执行流程,找出了基于MapReduce计算框架的连接查询算法在数据分布不均匀时的性能瓶颈;进而提出了组合分割平衡分区优化策略,设计并实现了基于组合分割平衡分区优化策略的改进型连接查询算法。实验结果表明,提出的优化策略在大规模数据的连接查询处理上很好地解决了数据倾斜带来的性能影响,具有好的时间性能和可扩展性。
展开更多
关键词
连接查询
MAPREDUCE
数据倾斜
下载PDF
职称材料
题名
非均匀数据分布下的MapReduce连接查询算法优化
被引量:
1
1
作者
张敬伟
尚宏佳
钱俊彦
周萍
杨青
机构
桂林电子科技大学广西可信软件重点实验室
桂林电子科技大学广西云计算与大数据协同创新中心
桂林电子科技大学广西自动检测技术与仪器重点实验室
出处
《计算机科学与探索》
CSCD
北大核心
2017年第5期752-767,共16页
基金
国家自然科学基金Nos.U1501252
61363005
+6 种基金
61462017
广西自然科学基金Nos.2014GXNSFAA118353
2014GXNSFAA118390
2014GXNSFDA118036
广西高等学校高水平创新团队及卓越学者计划
广西云计算与大数据协同创新中心基金项目
广西物联网技术与产业化推进协同创新中心资助项目~~
文摘
MapReduce分布式计算框架有助于提升大规模数据连接查询的效率,但当连接属性分布不均匀时,其简单的散列策略容易导致计算节点间负载不均衡,影响作业的整体性能。针对连接查询操作中的数据倾斜问题,研究了MapReduce框架下大规模数据连接查询操作的优化算法。首先对经典的改进重分区连接查询算法进行实验分析,研究了传统MapReduce计算框架下连接查询操作的执行流程,找出了基于MapReduce计算框架的连接查询算法在数据分布不均匀时的性能瓶颈;进而提出了组合分割平衡分区优化策略,设计并实现了基于组合分割平衡分区优化策略的改进型连接查询算法。实验结果表明,提出的优化策略在大规模数据的连接查询处理上很好地解决了数据倾斜带来的性能影响,具有好的时间性能和可扩展性。
关键词
连接查询
MAPREDUCE
数据倾斜
Keywords
join query
MapReduce
skewed data
分类号
TP311.130 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
非均匀数据分布下的MapReduce连接查询算法优化
张敬伟
尚宏佳
钱俊彦
周萍
杨青
《计算机科学与探索》
CSCD
北大核心
2017
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部