期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于MIC平台的offload并行方法研究 被引量:5
1
作者 沈铂 张广勇 +2 位作者 吴韶华 卢晓伟 张清 《计算机科学》 CSCD 北大核心 2014年第S1期477-480,共4页
随着并行计算的快速发展,开始出现了专用于并行计算加速的协处理器。通过对新推出的MIC架构协处理器的编程模式研究,描述了MIC平台下的应用模式,研究了不同应用模式各自的特点和适用范围,并深入研究了offload编程模式,提出了基于MIC平台... 随着并行计算的快速发展,开始出现了专用于并行计算加速的协处理器。通过对新推出的MIC架构协处理器的编程模式研究,描述了MIC平台下的应用模式,研究了不同应用模式各自的特点和适用范围,并深入研究了offload编程模式,提出了基于MIC平台offload编程模式的开发策略,为快速、高效地实现MIC并行程序的移植和加速提供了解决思路。 展开更多
关键词 并行计算 MIC offload模式 协处理器
下载PDF
基于Xeon Phi平台的波动方程叠前深度偏移
2
作者 杨祥森 金君 +2 位作者 王鹏 马召贵 亢永敢 《计算机工程与科学》 CSCD 北大核心 2015年第5期907-913,共7页
波动方程叠前深度偏移适用于强横向变速介质,是一种高精度成像方法,但其巨大的计算量阻碍了该技术的应用。Xeon Phi是一种全新的高性能计算设备,为波动方程叠前深度偏移方法的推广应用提供了新的技术支持。以裂步傅里叶算子为例,介绍了... 波动方程叠前深度偏移适用于强横向变速介质,是一种高精度成像方法,但其巨大的计算量阻碍了该技术的应用。Xeon Phi是一种全新的高性能计算设备,为波动方程叠前深度偏移方法的推广应用提供了新的技术支持。以裂步傅里叶算子为例,介绍了面向Xeon Phi平台的偏移算法移植和优化方法,即采用offload模式将计算核函数加载到Xeon Phi设备上,在Xeon Phi协处理器上采用多线程方式,并且调整程序结构,充分利用SIMD矢量引擎提高向量化处理效率。扩展负载动态均衡的并行框架,形成了一套适用于大规模异构系统、基于Xeon Phi平台的波动方程叠前深度偏移软件。实际数据测试表明Xeon Phi平台可以极大地提高地震偏移处理效率,具有良好的可扩展性。 展开更多
关键词 XEON Phi平台 波动方程叠前深度偏移 裂步傅里叶算子 并行框架 offload模式
下载PDF
BCC_AGCM_T106在Intel众核上混合异构编程与优化研究 被引量:4
3
作者 方宝辉 徐金秀 +1 位作者 魏敏 周明忠 《计算机科学与探索》 CSCD 北大核心 2015年第9期1093-1099,共7页
气象数值模式是天气预报和气候预测的基本工具和方法,随着技术的发展,模式分辨率有了大幅的提高,分辨率的提升使得计算量呈指数倍的增大,然而气候气象预报的时效性对并行程序的设计与计算平台的性能都提出了更高的要求。以气候模式T106... 气象数值模式是天气预报和气候预测的基本工具和方法,随着技术的发展,模式分辨率有了大幅的提高,分辨率的提升使得计算量呈指数倍的增大,然而气候气象预报的时效性对并行程序的设计与计算平台的性能都提出了更高的要求。以气候模式T106为研究案例,以Intel&#174;Xeon&#174;Phi TM为实验平台,探索混合异构编程与优化的可行性,实现了CPU端MPI(message passing interface)+MIC(many integrated core)端Open MP的混合异构编程,充分继承原始代码的MPI级并行,节约了开发成本。以两个CPU进程和一块MIC卡为例来测试性能数据,结果显示随着MIC卡上的线程数增多,气候模式T106核心段在MIC上加速明显,但相对于未使用MIC的纯MPI程序加速效果并不明显,这主要是由于T106核心段计算量不足而MIC卡与主机端数据交换较多造成的。 展开更多
关键词 气候模式T106 MIC架构 混合异构编程 offload模式
下载PDF
基于Intel Xeon Phi的激光等离子体粒子模拟研究 被引量:1
4
作者 姚文科 杜云飞 +1 位作者 吴强 杨灿群 《计算机工程与科学》 CSCD 北大核心 2014年第5期809-813,共5页
激光等离子体粒子模拟广泛用于探索极端物质状态下的科学问题。将一种基于粒子云网格方法的三维等离子体粒子模拟程序LARED-P移植到Intel Xeon Phi协处理器上。在移植的过程中,综合运用了Native和Offload两种编程模式:首先运用Native模... 激光等离子体粒子模拟广泛用于探索极端物质状态下的科学问题。将一种基于粒子云网格方法的三维等离子体粒子模拟程序LARED-P移植到Intel Xeon Phi协处理器上。在移植的过程中,综合运用了Native和Offload两种编程模式:首先运用Native模式对LARED-P程序中热点计算任务进行优化研究,通过采用SIMD扩展指令使该计算任务获得了4.61倍的加速;然后运用Offload模式将程序移植到CPU-Intel Xeon Phi异构系统上,并通过使用异步数据传输和双缓冲技术分别提升了程序性能9.8%和21.8%。 展开更多
关键词 LARED-P INTEL XEON PHI Native模式 offload模式 512位SIMD扩展指令 异步数据传输 双缓冲
下载PDF
基于MIC平台的三维瑞雷面波有限差分并行模拟
5
作者 曾瑞庚 熊章强 张大洲 《物探化探计算技术》 CAS CSCD 2017年第5期649-656,共8页
三维地震波动方程有限差分数值模拟,受到计算量大且内存消耗大地制约而计算效率较低,严重影响其发展和应用。目前,一种全新的异构众核协处理器,为三维并行计算提供了一条解决计算效率和数据存储问题的重要途径。基于三维有限差分计算的... 三维地震波动方程有限差分数值模拟,受到计算量大且内存消耗大地制约而计算效率较低,严重影响其发展和应用。目前,一种全新的异构众核协处理器,为三维并行计算提供了一条解决计算效率和数据存储问题的重要途径。基于三维有限差分计算的特点,介绍了面向MIC(Many Integrated Core)平台的三维瑞雷波有限差分并行算法移植和性能优化,采用ofload模式将计算核函数加载到MIC上,在MIC协处理上使用openMP多线程并行方式,并通过循环合并、nocopy数据传输、SIMD向量化和CPU+MIC协同计算方式进行优化。通过模型计算可知:三维数值计算程序在MIC上具有近线性加速比,MIC+CPU协同并行计算的性能可以达到纯CPU节点的4.5倍,大大提高了计算效率。通过对模拟结果与解析解的比较,以及对频散曲线特征的分析,验证了数值模拟的正确性。 展开更多
关键词 MIC平台 瑞雷面波 有限差分 offload模式
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部