-
题名MPI Alltoall通信在多核机群中的优化
被引量:2
- 1
-
-
作者
李强
孙凝晖
霍志刚
马捷
-
机构
中国科学院计算技术研究所高性能计算机研究中心
中国科学院计算机系统结构重点实验室
中国科学院大学
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第8期1744-1754,共11页
-
基金
国家"九七三"重点基础研究发展计划基金项目(2012CB316502)
国家"八六三"高技术研究发展计划基金项目(2009AA01A129)
+2 种基金
国家"八六三"高技术研究发展计划子课题(2010AA012404-6)
国家杰出青年科学基金项目(60925009)
国家自然科学基金青年科学基金项目(61100014)
-
文摘
MPI Alltoall是一种重要的集合通信.在多核机群中,一个节点内的多个进程同时参与Alltoall通信.一方面,这些进程可以利用共享内存优化通信性能.虽然当前基于首进程的方法利用共享内存提高了Alltoall小消息通信的性能,但由于采用固定数目的首进程,这些方法不能使所有不同长度的小消息都获得最优性能.另一方面,这些进程需要竞争节点内有限的网络资源.在Alltoall大消息的通信中存在许多个同步消息.然而竞争导致同步消息的延迟增大了数十倍,同步开销不可忽略.针对这些问题,提出了两种不同的优化方法.对于Alltoall小消息通信,PLP方法根据小消息的长度采用不同数目的首进程;对于Alltoall大消息通信,LSS方法将同步消息的总数从3N减少到2N(1/2).相关实验结果验证了这两种方法.对于小消息,PLP方法总是可以获得最优的性能.对于大消息,LSS方法获得的性能提升比例几乎为常数,并且与系统的规模无关;其中32KB和64KB消息的性能提高了25%.
-
关键词
Alltoall
共享
竞争
首进程数目
同步开销
-
Keywords
Alltoall
shared memory
contention
leader-based process number
synchronizationoverhead
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-