期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于线性阵列处理器的GRAPES核心代码优化
被引量:
2
1
作者
王为
张悠慧
+2 位作者
姚骏
李艳华
郑纬民
《计算机学报》
EI
CSCD
北大核心
2013年第10期2053-2061,共9页
我国气象局研究开发的数值天气预报系统GRAPES作为典型的高性能计算应用,在人民日常生活中有着极其重要的作用,如何提高GRAPES系统性能并控制其功耗以支持因增加系统分辨率而急剧增加的运算量是一个重大课题.该文使用软硬结合的多种方法...
我国气象局研究开发的数值天气预报系统GRAPES作为典型的高性能计算应用,在人民日常生活中有着极其重要的作用,如何提高GRAPES系统性能并控制其功耗以支持因增加系统分辨率而急剧增加的运算量是一个重大课题.该文使用软硬结合的多种方法对GRAPES系统的核心代码进行优化.采用线性阵列流水处理器LAPP实现循环级并行;采用循环切分、数据预取、缓存分区、多路预取等方法来进行加速;采用电源门控等低功耗技术来降低功耗.实验结果表明,优化后的GRAPES核心模块运行时平均IPC可以达到11.3,是面积相同的通用多核处理器的2.3倍;低功耗技术使其功耗仅为通用多核处理器的12%;同时优化后的LAPP集群性能功耗比可以达到相同计算能力Intel Xeon集群的11.7倍.
展开更多
关键词
计算机系统结构
数值天气预报
赫姆霍兹方程
Stencil计算
下载PDF
职称材料
题名
基于线性阵列处理器的GRAPES核心代码优化
被引量:
2
1
作者
王为
张悠慧
姚骏
李艳华
郑纬民
机构
清华
大学
计算机
科学
与技术系
奈良先端科技大学院大学信息科学学院
出处
《计算机学报》
EI
CSCD
北大核心
2013年第10期2053-2061,共9页
基金
日本东京大学VLSI设计与教育中心(VDEC)
Synopsys and Cadence Corporation
+5 种基金
JST ALCA
KAKENHI(Nos.24240005
24650020
and 2370060)
日本JST A-STEP与日本奈良科技大学院大学全球创新创新计划基金(AS232Z02313A)
国家"八六三"高技术研究发展计划项目基金(2013AA01A215)资助~~
文摘
我国气象局研究开发的数值天气预报系统GRAPES作为典型的高性能计算应用,在人民日常生活中有着极其重要的作用,如何提高GRAPES系统性能并控制其功耗以支持因增加系统分辨率而急剧增加的运算量是一个重大课题.该文使用软硬结合的多种方法对GRAPES系统的核心代码进行优化.采用线性阵列流水处理器LAPP实现循环级并行;采用循环切分、数据预取、缓存分区、多路预取等方法来进行加速;采用电源门控等低功耗技术来降低功耗.实验结果表明,优化后的GRAPES核心模块运行时平均IPC可以达到11.3,是面积相同的通用多核处理器的2.3倍;低功耗技术使其功耗仅为通用多核处理器的12%;同时优化后的LAPP集群性能功耗比可以达到相同计算能力Intel Xeon集群的11.7倍.
关键词
计算机系统结构
数值天气预报
赫姆霍兹方程
Stencil计算
Keywords
computer architecture
weather forecast
Helmholtz equation
Stencil computing
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于线性阵列处理器的GRAPES核心代码优化
王为
张悠慧
姚骏
李艳华
郑纬民
《计算机学报》
EI
CSCD
北大核心
2013
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部