-
题名多核机群主节点并发发送数据的可分负载调度
- 1
-
-
作者
钟诚
蔡德霞
杨锋
-
机构
广西大学计算机与电子信息学院
国家高性能计算中心南宁分中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第6期1281-1294,共14页
-
基金
国家自然科学基金项目(60963001)
-
文摘
对于节点计算、通信与存储能力不同、节点由多个多核处理器(多个片上多处理器)组成且共享L3cache的机群系统,采取计算与传输重叠模式,提出了主节点以多进程方式并发发送数据给从节点的可分负载调度模型.该调度模型自适应节点具有不同的计算、通信和存储能力,动态计算、确定调度轮数和每轮调度分配给各从节点的负载块规模,以平衡各节点的计算负载、减少节点之间的通信开销,缩短任务调度长度.依据各节点中的L3cache,L2cache和L1cache的可用存储容量,提出了对节点主存中接收到的负载块进行多级缓存划分的数据分配方法,以确保分配给节点中各个多核处理器、各个内核的负载平衡.基于提出的多核机群节点间可分负载调度模型和节点内多级存储数据分配方法,设计实现了节点拥有多个多核处理器的异构机群上通信和存储高效的k-选择并行算法.在曙光TC5000A多核机群系统上,测试了主节点并行与串行发送数据给从节点的任务调度方式、各级缓存利用率、每个核心执行不同数目的线程对并行算法运行性能的影响.实验结果表明:基于主节点并发发送数据给从节点的调度模型设计的k-选择并行算法,其运行性能优于基于主节点串行发送数据给从节点的调度模型设计的k-选择并行算法;L3cache和L2cache利用率大小对算法运行性能影响较大;当L3cache,L2cache和L1cache利用率取其优化组合值、每个核心运行3个线程时,算法所需的运行时间最短.
-
关键词
可分负载
并行调度
多核异构机群
多级缓存划分
k-选择
-
Keywords
divisible loads
parallel scheduling
heterogeneous multi-core cluster
multi-level cache partitioning
k-selection
-
分类号
TP338.6
[自动化与计算机技术—计算机系统结构]
TP301.6
[自动化与计算机技术—计算机系统结构]
-