期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
OpenMP数据分布子句自动生成算法
1
作者 黄品丰 赵荣彩 +1 位作者 韩林 刘晓娴 《计算机工程》 CAS CSCD 2013年第3期295-299,共5页
将OpenMP程序扩展到异构多核结构时,非本地存储访问会导致访存开销增加,影响程序性能。针对该问题,引入带数组划分信息的数据分布子句,对数据在异构多核存储系统的布局进行管理,提出一种基于并行循环识别和数组引用模式分析的算法,实现... 将OpenMP程序扩展到异构多核结构时,非本地存储访问会导致访存开销增加,影响程序性能。针对该问题,引入带数组划分信息的数据分布子句,对数据在异构多核存储系统的布局进行管理,提出一种基于并行循环识别和数组引用模式分析的算法,实现该类子句的自动生成。实验结果表明,自动生成的OpenMP程序包含数据分布子句,具有较好的数据局部性,可降低访存开销,在异构多核系统上获得明显的性能提升。 展开更多
关键词 异构多核 数据局部性 数据分布子句 Open64编译器 并行循环 数组下标表达式
下载PDF
并行重构程序中过程调用的优化技术
2
作者 冯晓兵 张兆庆 《计算机研究与发展》 EI CSCD 北大核心 1999年第12期1424-1429,共6页
过程间分析技术是提高编译器目标码效率的重要技术.在分布式存储的并行系统中,数据分布的好坏对应用程序的性能有重要影响.但是仅做过程内的数据对齐和分布推导难以获得良好的全局数据分布模型,而且会使过程调用的开销难以控制,因... 过程间分析技术是提高编译器目标码效率的重要技术.在分布式存储的并行系统中,数据分布的好坏对应用程序的性能有重要影响.但是仅做过程内的数据对齐和分布推导难以获得良好的全局数据分布模型,而且会使过程调用的开销难以控制,因而如何处理过程调用,以及数据分布信息在过程调用点的收集与传播对生成高效率的目标码是极其重要的. 文中应用过程调用实例化技术,减小过程调用的开销。 展开更多
关键词 并行重构程序 过程调用 优化 并行编译器
下载PDF
基于网络的数据并行计算中分布数组描述研究
3
作者 胡长军 丁文魁 +2 位作者 黄其军 向华 许卓群 《软件学报》 EI CSCD 北大核心 2002年第4期608-615,共8页
如何描述分布数组是基于网络数据并行计算的基本问题.从网络并行计算的一般需求出发,讨论了分布数组描述DAD(distributed array descriptor)的内容和结构,具体给出了p-HPF并行编译系统的DAD结构定义.针对分布数据的稀疏存储和紧凑存... 如何描述分布数组是基于网络数据并行计算的基本问题.从网络并行计算的一般需求出发,讨论了分布数组描述DAD(distributed array descriptor)的内容和结构,具体给出了p-HPF并行编译系统的DAD结构定义.针对分布数据的稀疏存储和紧凑存储模型,给出了数据在Block分布、Cyclic分布和Block_Cyclic(k)分布方式下,全局数组到局部数组转换的计算方法,这些方法已在p-HPF编译器中得到实现并证明了其有效性.最后讨论了分布数据描述的标准化对实现并行计算系统的可移植性和可重用性的意义. 展开更多
关键词 分布数组描述 网络并行计算 HPF语言 并行编译 数据并行计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部