-
题名Intel第二代MIC架构处理器特性分析
- 1
-
-
作者
王冬
赵荣彩
王琦
-
机构
数学工程与先进计算国家重点实验室
-
出处
《信息工程大学学报》
2019年第6期720-726,共7页
-
基金
国家863计划资助项目(2014AA01A300)
国家科技重大专项资助项目(2013ZX0102-8001-001-001)。
-
文摘
2016年6月Intel推出第二代集成众核架构的至强融核处理器(KNL)。相比第一代融核协处理器(KNC),KNL的新特性包括以下4个方面:①提供独立自启动形态,避免KNC依赖于PCI-E进行数据传输的主从结构;②提供宽度为512 bit的向量寄存器,能够一次实现16个单精度或8个双精度浮点数据的处理;③在处理器上集成高带宽内存,缓解内存访问瓶颈;④提供多种集群模式,根据程序特征对融核处理器进行划分,改善数据局部性。首先对第二代融核处理器KNL的新特性进行研究,然后利用扩展性好的典型科学计算程序对KNL的新特性进行测试分析,实验结果表明,新特性增强了KNL的并行计算能力,最后总结利用KNL进行并行优化的方法。
-
关键词
至强融核
高带宽内存
集群模式
并行优化
-
Keywords
Xeon Phi
mcdram
cluster mode
parallel optimization
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名基于KNL平台的LAMMPS优化
- 2
-
-
作者
李盼乐
尚远
黄标
商建东
-
机构
郑州大学超级计算中心智慧城市研究院
-
出处
《科研信息化技术与应用》
2017年第6期21-25,共5页
-
文摘
Intel新一代处理器KNL作为一种具有极强运算能力的多核处理器,拥有16GB高速片上内存(MCDRAM),物理核心数量高达72个,单CPU的双精度浮点峰值为3TFlops,为高并行负载应用提供强大的性能支持。各种主流的并行软件也纷纷使用KNL众核、高速内存技术,由于LAMMPS(large-scale atomic/molecular massively parallel simulator)在材料科学和计算化学中的广泛应用,因此在KNL节点上优化LAMMPS成为相关领域近些年的研究热点。本文以郑州超算中心的KNL集群为平台,采用MCDRAM和第三方扩展包两种方法对LAMMPS进行优化。MCDRAM可以加快CPU读取数据的速度,第三方扩展包从源码的角度对程序中的条件判断进行优化。试验结果表明,优化后的LAMMPS执行时间明显减少,加速比可达49x,是CPU平台加速比的5.5x。
-
关键词
KNL
并行
片上内存
LAMMPS
-
Keywords
KNL
parallel
mcdram
LAMMPS
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
-