期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向国产异构系统的HPL异构协同设计
1
作者 甘新标 孙燎原 +2 位作者 刘杰 雄成伟 黄嘉昆 《计算机工程与科学》 CSCD 北大核心 2018年第1期10-14,共5页
HPL是高性能计算广泛采用的Linpack测试软件包,传统HPL算法中,求解矩阵将以块为单位循环分布到所有处理器,由于国产加速器(China Accelerator)的底层矩阵乘接口仅支持定制接口,传统HPL算法已不适合CPU+China Accelerator异构系统,因此,... HPL是高性能计算广泛采用的Linpack测试软件包,传统HPL算法中,求解矩阵将以块为单位循环分布到所有处理器,由于国产加速器(China Accelerator)的底层矩阵乘接口仅支持定制接口,传统HPL算法已不适合CPU+China Accelerator异构系统,因此,必须基于定制接口完成矩阵分布细致划分与封装dPEM,以提供一个通用的HPL测试配置环境;同时,为了充分发挥国产异构系统的效率,设计了异构协同矩阵乘调度算法OA4MM,以提高国产异构系统的效率。实验验证了dPEM的有效性和OA4MM算法的高效性,OA4MM较传统的异构HPL调度算法性能提升近10%。 展开更多
关键词 HPL 国产加速器 矩阵分布细致划分与封装 异构协同矩阵乘调度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部