期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向流处理结构的Barrier同步实现 被引量:1
1
作者 黄万荣 唐玉华 易晓东 《计算机研究与发展》 EI CSCD 北大核心 2014年第S1期245-250,共6页
Barrier同步操作是能够直接影响处理器性能的一类操作.针对流处理器体系结构,提出并实现了2种软件同步机制和1种硬件同步机制,即基于互斥计数器的Barrier同步、基于共享状态寄存器的Lock-free Barrier同步和基于专用硬件管理单元的Barr... Barrier同步操作是能够直接影响处理器性能的一类操作.针对流处理器体系结构,提出并实现了2种软件同步机制和1种硬件同步机制,即基于互斥计数器的Barrier同步、基于共享状态寄存器的Lock-free Barrier同步和基于专用硬件管理单元的Barrier同步;在一款流处理器原型系统中测试并分析了在不同负载规模、不同负载分布、典型应用情况下3种同步机制的性能.结果表明,基于专用硬件管理单元的Barrier同步机制性能更优. 展开更多
关键词 barrier同步 流处理器 软件方法 硬件机制 性能评估
下载PDF
OpenMP并行程序的编译器优化 被引量:13
2
作者 张平 李清宝 赵荣彩 《计算机工程》 EI CAS CSCD 北大核心 2006年第24期37-40,共4页
OpemMP标准以其良好的可移植性和易用性被广泛应用于并行程序设计。该文讨论了OpenMP并行程序的编译器优化算法,在编译过程中通过并行区合并和扩展,实现并行区重构,并在并行区中实现了基于跨处理器相关图的barrier同步优化。分析验证表... OpemMP标准以其良好的可移植性和易用性被广泛应用于并行程序设计。该文讨论了OpenMP并行程序的编译器优化算法,在编译过程中通过并行区合并和扩展,实现并行区重构,并在并行区中实现了基于跨处理器相关图的barrier同步优化。分析验证表明,这些优化策略减少了并行区和barrier同步的数目,有效地提高了OpenMP程序的并行性能。 展开更多
关键词 跨处理器相关 barrier同步 并行区重构 数据相关图
下载PDF
共享内存结构并行程序的编译器优化 被引量:1
3
作者 张平 李清宝 赵荣彩 《计算机工程与应用》 CSCD 北大核心 2006年第1期13-16,共4页
共享内存结构上的程序自动并行化通常实现循环级并行,采用fork-join执行模式,并行性能有待提高。论文结合fork-join和SPMD两种执行模式的优势,在并行化编译过程中通过并行区合并和扩展,实现fork-join和SPMD混合执行模式,并在SPMD并行区... 共享内存结构上的程序自动并行化通常实现循环级并行,采用fork-join执行模式,并行性能有待提高。论文结合fork-join和SPMD两种执行模式的优势,在并行化编译过程中通过并行区合并和扩展,实现fork-join和SPMD混合执行模式,并在SPMD并行区中实现了基于跨处理器相关图的barrier同步优化。分析验证表明,这些优化策略减少了并行区和barrier同步的数目,有效地提高了生成并行程序的性能。 展开更多
关键词 跨处理器相关 barrier同步 SPMD并行区 数据相关图
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部