期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于矩阵转置优化的Intel KNL特性分析 被引量:2
1
作者 王琦 韩林 +2 位作者 高雨辰 李颖颖 王曦 《计算机工程与设计》 北大核心 2018年第5期1358-1364,1371,共8页
矩阵转置访存密集,便于并行优化,因此优化矩阵转置程序,旨在分析Knights Landing平台新特性。分析矩阵转置程序特性,按照矩阵一行元素个数,将矩阵分为3类;利用KNL平台提供的AVX-512扩展指令集对其进行向量化优化以及数据预取,利用OpenM... 矩阵转置访存密集,便于并行优化,因此优化矩阵转置程序,旨在分析Knights Landing平台新特性。分析矩阵转置程序特性,按照矩阵一行元素个数,将矩阵分为3类;利用KNL平台提供的AVX-512扩展指令集对其进行向量化优化以及数据预取,利用OpenMP实现两种不同粒度的并行优化;利用矩阵转置程序,通过实验数据对比,分析KNL平台优化程序的特点及其不同模式的不同特性。 展开更多
关键词 矩阵转置 英特尔第二代至强融合处理器 并行优化 高带宽内存 集群模式
下载PDF
Intel第二代MIC架构处理器特性分析
2
作者 王冬 赵荣彩 王琦 《信息工程大学学报》 2019年第6期720-726,共7页
2016年6月Intel推出第二代集成众核架构的至强融核处理器(KNL)。相比第一代融核协处理器(KNC),KNL的新特性包括以下4个方面:①提供独立自启动形态,避免KNC依赖于PCI-E进行数据传输的主从结构;②提供宽度为512 bit的向量寄存器,能够一次... 2016年6月Intel推出第二代集成众核架构的至强融核处理器(KNL)。相比第一代融核协处理器(KNC),KNL的新特性包括以下4个方面:①提供独立自启动形态,避免KNC依赖于PCI-E进行数据传输的主从结构;②提供宽度为512 bit的向量寄存器,能够一次实现16个单精度或8个双精度浮点数据的处理;③在处理器上集成高带宽内存,缓解内存访问瓶颈;④提供多种集群模式,根据程序特征对融核处理器进行划分,改善数据局部性。首先对第二代融核处理器KNL的新特性进行研究,然后利用扩展性好的典型科学计算程序对KNL的新特性进行测试分析,实验结果表明,新特性增强了KNL的并行计算能力,最后总结利用KNL进行并行优化的方法。 展开更多
关键词 至强融核 高带宽内存 集群模式 并行优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部