期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Spark的大数据统计中等值连接问题的优化
1
作者 刘容辰 周明强 +1 位作者 皮兴杰 赵欣 《现代计算机》 2017年第8期3-6,共4页
伴随着互联网应用技术的飞速发展,导致传统的数据处理技术已经无法满足对大数据高效处理的要求。因此对现有的大数据的统计分析便急需相应的大数据技术的支持。为了解决实际Spark应用中的Join操作低效的问题,首先,提出一种高效的基于Blo... 伴随着互联网应用技术的飞速发展,导致传统的数据处理技术已经无法满足对大数据高效处理的要求。因此对现有的大数据的统计分析便急需相应的大数据技术的支持。为了解决实际Spark应用中的Join操作低效的问题,首先,提出一种高效的基于BloomFilter过滤再分区算法,通过该算法率先过滤掉绝大部分不符合条件的无效连接,然后针对过滤数据产生的倾斜问题进行再分区操作,以便能充分发挥各个工作节点的计算资源,达到在最大程序上优化Join过程的目的。 展开更多
关键词 大数据 SPARK 等值连接 BLOOM FILTER SHUFFLE
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部