-
题名面向流处理结构的Barrier同步实现
被引量:1
- 1
-
-
作者
黄万荣
唐玉华
易晓东
-
机构
国防科学技术大学计算机学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第S1期245-250,共6页
-
基金
高性能计算国家重点实验室开放基金项目(201302-01
201402-01)
-
文摘
Barrier同步操作是能够直接影响处理器性能的一类操作.针对流处理器体系结构,提出并实现了2种软件同步机制和1种硬件同步机制,即基于互斥计数器的Barrier同步、基于共享状态寄存器的Lock-free Barrier同步和基于专用硬件管理单元的Barrier同步;在一款流处理器原型系统中测试并分析了在不同负载规模、不同负载分布、典型应用情况下3种同步机制的性能.结果表明,基于专用硬件管理单元的Barrier同步机制性能更优.
-
关键词
barrier同步
流处理器
软件方法
硬件机制
性能评估
-
Keywords
barrier synchronization
stream processors
software approach
hardware scheme
performance evaluation
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
-
-
题名OpenMP并行程序的编译器优化
被引量:13
- 2
-
-
作者
张平
李清宝
赵荣彩
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第24期37-40,共4页
-
基金
国防科研基金资助重点项目
-
文摘
OpemMP标准以其良好的可移植性和易用性被广泛应用于并行程序设计。该文讨论了OpenMP并行程序的编译器优化算法,在编译过程中通过并行区合并和扩展,实现并行区重构,并在并行区中实现了基于跨处理器相关图的barrier同步优化。分析验证表明,这些优化策略减少了并行区和barrier同步的数目,有效地提高了OpenMP程序的并行性能。
-
关键词
跨处理器相关
barrier同步
并行区重构
数据相关图
-
Keywords
Cross-processor dependence
barrier synchronization
Parallel region reconstruction
Data dependence graph
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名共享内存结构并行程序的编译器优化
被引量:1
- 3
-
-
作者
张平
李清宝
赵荣彩
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第1期13-16,共4页
-
基金
国家部委重点科研资助项目
-
文摘
共享内存结构上的程序自动并行化通常实现循环级并行,采用fork-join执行模式,并行性能有待提高。论文结合fork-join和SPMD两种执行模式的优势,在并行化编译过程中通过并行区合并和扩展,实现fork-join和SPMD混合执行模式,并在SPMD并行区中实现了基于跨处理器相关图的barrier同步优化。分析验证表明,这些优化策略减少了并行区和barrier同步的数目,有效地提高了生成并行程序的性能。
-
关键词
跨处理器相关
barrier同步
SPMD并行区
数据相关图
-
Keywords
cross-processor dependence,barrier synchronization,SPMD parallel region,data dependence graph
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-