期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种Spark集群下的shuffle优化机制 被引量:2
1
作者 熊安萍 夏玉冲 杨方方 《计算机工程与应用》 CSCD 北大核心 2018年第4期72-76,共5页
Spark是基于内存的分布式数据处理框架,其shuffle过程中大量数据需要通过网络传输,已成为Spark最主要的瓶颈之一。针对shuffle过程中存在的数据分布不均造成不同节点网络I/O负载不均的问题,设计了基于task本地性等级的重启策略,进一步... Spark是基于内存的分布式数据处理框架,其shuffle过程中大量数据需要通过网络传输,已成为Spark最主要的瓶颈之一。针对shuffle过程中存在的数据分布不均造成不同节点网络I/O负载不均的问题,设计了基于task本地性等级的重启策略,进一步提出了均衡的调度策略来平衡各节点的网络I/O负载。最后通过实验验证了优化机制能够减少计算任务的执行时间,提升整个shuffle过程的执行效率。 展开更多
关键词 Spark集群 shuffle过程 数据传输 本地性 调度策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部