-
题名面向国产异构系统的HPL异构协同设计
- 1
-
-
作者
甘新标
孙燎原
刘杰
雄成伟
黄嘉昆
-
机构
国防科技大学计算机学院
计算机软件新技术国家重点实验室(南京大学)
国防科技大学量子信息研究所兼高性能计算国家重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2018年第1期10-14,共5页
-
基金
国家重点研发计划(2017YFB0202104)
国家自然科学基金(61602495
+6 种基金
61402039
11401580
11665012)
计算机软件新技术国家重点实验室(南京大学)开放课题(KFKT2016B25)
国防科技大学预研计划(ZK16-03-06)
国家重点实验室专项基金(Y62612A87S)
中国科学院光谱成像技术重点实验室开放基金(LIST201602D)
-
文摘
HPL是高性能计算广泛采用的Linpack测试软件包,传统HPL算法中,求解矩阵将以块为单位循环分布到所有处理器,由于国产加速器(China Accelerator)的底层矩阵乘接口仅支持定制接口,传统HPL算法已不适合CPU+China Accelerator异构系统,因此,必须基于定制接口完成矩阵分布细致划分与封装dPEM,以提供一个通用的HPL测试配置环境;同时,为了充分发挥国产异构系统的效率,设计了异构协同矩阵乘调度算法OA4MM,以提高国产异构系统的效率。实验验证了dPEM的有效性和OA4MM算法的高效性,OA4MM较传统的异构HPL调度算法性能提升近10%。
-
关键词
HPL
国产加速器
矩阵分布细致划分与封装
异构协同矩阵乘调度
-
Keywords
HPL
China accelerator
delicate partition and encapsulation on matrix
orchestrating algorithm for matrix multiplication
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-