期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Intel多核与集成众核上CFD程序的OpenMP性能分析
被引量:
2
1
作者
车永刚
张理论
+2 位作者
王勇献
徐传福
程兴华
《计算机科学与探索》
CSCD
北大核心
2015年第10期1153-1162,共10页
多核与众核已成为当前主流的高性能计算体系结构,Open MP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研...
多核与众核已成为当前主流的高性能计算体系结构,Open MP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研究了其在Intel Xeon E5 Sandy Bridge多核处理器和Intel Knights Corner集成众核协处理器上的Open MP性能。重点分析了Open MP库开销、线程负载均衡性、主存访问带宽对性能的影响,发现因Open MP并行引入的冗余计算对并行效率影响很小,但串行计算部分和负载不均衡性对并行效率影响大,主存访问带宽对浮点性能的影响大。还比较了该程序两种体系结构上的性能差异,讨论了性能进一步优化的方向。
展开更多
关键词
多核
集成众核
cfd应用程序
OPEN
MP
性能分析
下载PDF
职称材料
题名
Intel多核与集成众核上CFD程序的OpenMP性能分析
被引量:
2
1
作者
车永刚
张理论
王勇献
徐传福
程兴华
机构
国防科技大学并行与分布处理重点实验室
国防科技大学计算机学院
出处
《计算机科学与探索》
CSCD
北大核心
2015年第10期1153-1162,共10页
基金
国家自然科学基金~~
文摘
多核与众核已成为当前主流的高性能计算体系结构,Open MP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研究了其在Intel Xeon E5 Sandy Bridge多核处理器和Intel Knights Corner集成众核协处理器上的Open MP性能。重点分析了Open MP库开销、线程负载均衡性、主存访问带宽对性能的影响,发现因Open MP并行引入的冗余计算对并行效率影响很小,但串行计算部分和负载不均衡性对并行效率影响大,主存访问带宽对浮点性能的影响大。还比较了该程序两种体系结构上的性能差异,讨论了性能进一步优化的方向。
关键词
多核
集成众核
cfd应用程序
OPEN
MP
性能分析
Keywords
multicore
many integrated core
cfd
application
Open MP
performance analysis
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Intel多核与集成众核上CFD程序的OpenMP性能分析
车永刚
张理论
王勇献
徐传福
程兴华
《计算机科学与探索》
CSCD
北大核心
2015
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部