-
题名OpenMP数据分布子句自动生成算法
- 1
-
-
作者
黄品丰
赵荣彩
韩林
刘晓娴
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
2013年第3期295-299,共5页
-
基金
核高基重大专项(2009ZX01036-001-001-2)
-
文摘
将OpenMP程序扩展到异构多核结构时,非本地存储访问会导致访存开销增加,影响程序性能。针对该问题,引入带数组划分信息的数据分布子句,对数据在异构多核存储系统的布局进行管理,提出一种基于并行循环识别和数组引用模式分析的算法,实现该类子句的自动生成。实验结果表明,自动生成的OpenMP程序包含数据分布子句,具有较好的数据局部性,可降低访存开销,在异构多核系统上获得明显的性能提升。
-
关键词
异构多核
数据局部性
数据分布子句
Open64编译器
并行循环
数组下标表达式
-
Keywords
heterogeneous multi-core
data locality
data distribution clause
Open64 compiler
parallel loop
array index expression
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名并行重构程序中过程调用的优化技术
- 2
-
-
作者
冯晓兵
张兆庆
-
机构
中国科学院计算技术研究所高性能中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
1999年第12期1424-1429,共6页
-
基金
国家"八六三"高科技计划基金
国家高性能计算基金
-
文摘
过程间分析技术是提高编译器目标码效率的重要技术.在分布式存储的并行系统中,数据分布的好坏对应用程序的性能有重要影响.但是仅做过程内的数据对齐和分布推导难以获得良好的全局数据分布模型,而且会使过程调用的开销难以控制,因而如何处理过程调用,以及数据分布信息在过程调用点的收集与传播对生成高效率的目标码是极其重要的. 文中应用过程调用实例化技术,减小过程调用的开销。
-
关键词
并行重构程序
过程调用
优化
并行编译器
-
Keywords
parallel compiler, data locality, instantiation, data distribution model
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于网络的数据并行计算中分布数组描述研究
- 3
-
-
作者
胡长军
丁文魁
黄其军
向华
许卓群
-
机构
清华大学计算机科学与技术系
北京大学计算机科学技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2002年第4期608-615,共8页
-
基金
国家自然科学基金资助项目(60173004)
国家863高科技发展计划资助项目(863-306-ZT01-02-3)
-
文摘
如何描述分布数组是基于网络数据并行计算的基本问题.从网络并行计算的一般需求出发,讨论了分布数组描述DAD(distributed array descriptor)的内容和结构,具体给出了p-HPF并行编译系统的DAD结构定义.针对分布数据的稀疏存储和紧凑存储模型,给出了数据在Block分布、Cyclic分布和Block_Cyclic(k)分布方式下,全局数组到局部数组转换的计算方法,这些方法已在p-HPF编译器中得到实现并证明了其有效性.最后讨论了分布数据描述的标准化对实现并行计算系统的可移植性和可重用性的意义.
-
关键词
分布数组描述
网络并行计算
HPF语言
并行编译
数据并行计算
-
Keywords
Arrays
Computer networks
data structures
Distributed computer systems
FORTRAN (programming language)
Mathematical models
parallel algorithms
Program compilers
Standardization
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-