期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向神威·太湖之光的国产异构众核处理器OpenCL编译系统 被引量:7
1
作者 伍明川 黄磊 +2 位作者 刘颖 何先波 冯晓兵 《计算机学报》 EI CSCD 北大核心 2018年第10期2236-2250,共15页
近年来硬件设计呈现出异构化的趋势,如何有效开发并行程序成为制约异构系统发展的瓶颈之一已成为业界共识.我国自主研制的"神威·太湖之光"超级计算机,采用了国产片上异构众核处理器SW26010,为了降低程序员的编程难度,同... 近年来硬件设计呈现出异构化的趋势,如何有效开发并行程序成为制约异构系统发展的瓶颈之一已成为业界共识.我国自主研制的"神威·太湖之光"超级计算机,采用了国产片上异构众核处理器SW26010,为了降低程序员的编程难度,同时提高软件的移植效率,作者设计并实现了支持国产SW26010众核处理器的OpenCL编译系统.该编译系统实现了OpenCL平台模型、内存模型和执行模型到SW26010众核处理器的映射与优化机制,同时生成性能良好的可执行文件.最后通过实验验证了该编译系统的正确性和有效性,典型OpenCL应用经该编译系统编译后,在中小输入规模下,性能显著优于Intel Xeon Phi,与NVIDIA GPU可比;在较大输入规模下,受限于局存SPM的容量限制,性能略低于NVIDIA GPU. 展开更多
关键词 OPENCL 异构 国产众核处理器 编译系统
下载PDF
面向神威·太湖之光的多核组协同的OpenCL编译方法 被引量:1
2
作者 伍明川 刘颖 +1 位作者 李立民 冯晓兵 《高技术通讯》 CAS 2022年第9期927-936,共10页
近年来,科学领域对高性能计算的需求与日俱增,如何有效利用新型超算架构的计算能力成为研究重点。我国自主研制的神威·太湖之光超算平台,采用了国产异构众核处理器SW26010,其包含4个核组,但未提供核组间的同步机制。为了增加其易... 近年来,科学领域对高性能计算的需求与日俱增,如何有效利用新型超算架构的计算能力成为研究重点。我国自主研制的神威·太湖之光超算平台,采用了国产异构众核处理器SW26010,其包含4个核组,但未提供核组间的同步机制。为了增加其易编程性,本文提出了面向神威·太湖之光的核组间同步方法,并在SWCL OpenCL编译器中实现了该核组间同步方法。该方法利用跨OpenCL主机内核的数据依赖分析来标识必要的同步操作位置,并通过SW26010的交叉段进行低开销的核组间通信,程序员在不使用消息传递接口(MPI)进行显式控制同步的情况下,可以自动地将一个OpenCL Kernel程序部署到多个核组上。使用SPEC ACCEL 1.2中的OpenCL测试用例在神威太湖之光平台的实验表明,本方法的加速效果明显优于传统的MPI实现版本。 展开更多
关键词 OPENCL 国产众核处理器 异构 同步 数据依赖分析
下载PDF
IAR开发环境下添加SM9B100MAL处理器支持的原理与方法 被引量:2
3
作者 吴昌昊 范云 +3 位作者 黄菊 王文俊 张自圃 邵雨新 《兵工自动化》 2021年第7期28-38,共11页
为解决SM9B100MAL处理器官方未提供IAR开发环境支持的问题,提出为IAR添加处理器支持的方法。通过对IAR开发环境、C-SPY调试器、Flash Loader框架和设备描述配置等多方面的机理分析,给出参考配置与代码及其相关解释,展现添加处理器支持... 为解决SM9B100MAL处理器官方未提供IAR开发环境支持的问题,提出为IAR添加处理器支持的方法。通过对IAR开发环境、C-SPY调试器、Flash Loader框架和设备描述配置等多方面的机理分析,给出参考配置与代码及其相关解释,展现添加处理器支持的过程。结果表明:添加支持后,即可在IAR开发环境中实现快速建立代码工程、一键下载程序、调试会话中结构化展示寄存器内容等功能。 展开更多
关键词 IAR C-SPY Flash Loader SM9B100MAL 开发环境 国产处理器 调试
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部