-
题名基于神威·太湖之光的非结构网格众核优化技术
被引量:6
- 1
-
-
作者
倪鸿
刘鑫
-
机构
国家并行计算机工程技术研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第6期45-51,共7页
-
基金
国家重点研发计划“大规模多模式多过程地球系统模式耦合平台开发”(2016YFA0602200)
-
文摘
为解决高性能计算中的非结构网格离散访存问题,以神威·太湖之光国产超级计算机为平台,根据异构众核处理器SW26010的体系结构特点,提出一种基于排序思想的通用众核优化算法,以减少非结构网格计算中的随机访存。基于网格划分原理,在O(n)时间内对生成的稀疏矩阵非零元素进行并行重排序。采用一种内部映射方式对计算向量实现扩展或变换,将细粒度访存转化为无写冲突的粗粒度访存。对多个实际应用算例的通量计算进行众核优化,结果表明,相比主核上的串行算法,该算法能够获得平均10倍以上的加速效果。
-
关键词
离散访存
非结构网格
通量计算
异构众核优化
并行排序
-
Keywords
discrete memory access
unstructured grid
flux calculation
heterogeneous multi-core optimization
parallel sorting
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名非结构网格下稀疏下三角方程求解器众核优化技术研究
被引量:3
- 2
-
-
作者
倪鸿
刘鑫
-
机构
国家并行计算机工程技术研究中心
-
出处
《计算机科学》
CSCD
北大核心
2019年第B06期518-522,共5页
-
基金
“全球变化和应对”专项(2016YFA0602200)资助
-
文摘
稀疏下三角方程求解器(SpTRSV)作为基础线性代数库中一个重要的算法,在大规模科学计算中有着广泛应用。在非结构网格中,由于非结构网格具有数据存储无序性、数据强相关性以及频繁地离散访存等特点,该算法在众核架构上难以实现有效的并行。文中基于国产异构众核处理器SW26010体系结构的特点,针对非结构网格计算,提出了一种基于流水线串行-局部并行思想的通用众核优化方法。该方法能够有效减少非结构网格计算中的随机访存,提高计算效率,并且具有很好的扩展性。基于该算法对多个实际应用算例进行众核优化,实验结果表明:该方法能够实现单核组3倍以上的加速,显著降低了运行时间。
-
关键词
稀疏下三角方程求解器
非结构网格
SW26010
异构众核优化
并行算法
-
Keywords
SpTRSV
Unstructured-grids
SW26010
Heterogeneous many-core Optimization
Parallel algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-