-
题名基于神威众核处理器的排列熵算法并行加速方法
被引量:2
- 1
-
-
作者
张浩
花嵘
于建志
梁建国
冯鲁彬
-
机构
山东科技大学计算机科学与工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第7期2022-2026,共5页
-
基金
国家重点研发计划项目子课题(2017YFB0202002)
山东省自然科学基金资助项目(ZR2018BF001)。
-
文摘
随着嵌入维数的增大,排列熵(permutation entropy,PE)算法的运算规模将会成倍增加,对计算的时效性提出了更高的要求。针对国际上首台计算性能超过100P的神威·太湖之光异构众核超级计算机,提出一种针对排列熵算法移植和并行化方法,核组之间基于MPI对相空间矩阵进行数据划分,核组内部基于OpenACC实现划分区域内部并行;然后针对SW26010众核处理器结构特征,调整减少主从核通信次数和消除原子操作,将排列熵算法成功移植并加速;最后通过大坝振荡数据进行测试。测试结果表明,该方法能够很好地发挥SW26010众核处理器加速优势,单核组性能较主核版本最高可获得7.18倍加速,同时在神威·太湖之光大规模集群上进行强可扩展性分析,128核组时最高实现了85.6倍的性能提升。
-
关键词
排列熵
神威众核处理器
MPI
OpenACC
嵌入维数
-
Keywords
permutation entropy
Sunway many-core processor
MPI
OpenACC
embedding dimension
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名第一性原理极化率计算中的众核优化方法研究
被引量:1
- 2
-
-
作者
罗海文
吴扬俊
商红慧
-
机构
中国科学院计算技术研究所处理器芯片全国重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2023年第6期1-9,共9页
-
基金
国家重点研发计划(2020YFB1709500)
国家自然科学基金(22003073)。
-
文摘
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效率,对物理化学性质的计算及其科学应用具有重要意义。文中对DFPT中一阶响应密度和一阶响应哈密顿矩阵的计算针对众核处理器体系结构进行了优化,并在新一代神威处理器上进行了验证。优化技术包括循环分块、离散访存处理和协同规约。其中,循环分块对任务进行划分从而由众核并行地执行;离散访存处理将离散访存转换为更高效的连续访存;协同规约解决了写冲突问题。实验结果表明,在一个核组上,优化后的程序性能较优化前提高了8.2~74.4倍,并且具有良好的强可扩展性和弱可扩展性。
-
关键词
密度函数微扰理论
第一性原理计算
高性能计算
新一代神威异构众核处理器
-
Keywords
Density-functional perturbation theory
First-principle calculation
High-performance computing
New generation Sunway heterogeneous many-core processor
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-