-
题名基于矩阵转置优化的Intel KNL特性分析
被引量:2
- 1
-
-
作者
王琦
韩林
高雨辰
李颖颖
王曦
-
机构
信息工程大学数学工程与先进计算国家重点实验室
成都市双流区规划建设局建设工程质量监督站
-
出处
《计算机工程与设计》
北大核心
2018年第5期1358-1364,1371,共8页
-
文摘
矩阵转置访存密集,便于并行优化,因此优化矩阵转置程序,旨在分析Knights Landing平台新特性。分析矩阵转置程序特性,按照矩阵一行元素个数,将矩阵分为3类;利用KNL平台提供的AVX-512扩展指令集对其进行向量化优化以及数据预取,利用OpenMP实现两种不同粒度的并行优化;利用矩阵转置程序,通过实验数据对比,分析KNL平台优化程序的特点及其不同模式的不同特性。
-
关键词
矩阵转置
英特尔第二代至强融合处理器
并行优化
高带宽内存
集群模式
-
Keywords
transposition of square matrices
Intel Xeon Phi processor Knights Landing
parallel optimization
high bandwidth memory
cluster modes
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名Intel第二代MIC架构处理器特性分析
- 2
-
-
作者
王冬
赵荣彩
王琦
-
机构
数学工程与先进计算国家重点实验室
-
出处
《信息工程大学学报》
2019年第6期720-726,共7页
-
基金
国家863计划资助项目(2014AA01A300)
国家科技重大专项资助项目(2013ZX0102-8001-001-001)。
-
文摘
2016年6月Intel推出第二代集成众核架构的至强融核处理器(KNL)。相比第一代融核协处理器(KNC),KNL的新特性包括以下4个方面:①提供独立自启动形态,避免KNC依赖于PCI-E进行数据传输的主从结构;②提供宽度为512 bit的向量寄存器,能够一次实现16个单精度或8个双精度浮点数据的处理;③在处理器上集成高带宽内存,缓解内存访问瓶颈;④提供多种集群模式,根据程序特征对融核处理器进行划分,改善数据局部性。首先对第二代融核处理器KNL的新特性进行研究,然后利用扩展性好的典型科学计算程序对KNL的新特性进行测试分析,实验结果表明,新特性增强了KNL的并行计算能力,最后总结利用KNL进行并行优化的方法。
-
关键词
至强融核
高带宽内存
集群模式
并行优化
-
Keywords
Xeon Phi
MCDRAM
cluster mode
parallel optimization
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-