基于OpenCL的图形处理器FDTD算法仿真研究被引量：2

FDTD Simulation Using Graphic Processing Units Based on OpenCL

下载PDF

导出

摘要大型电磁仿真计算的时域有限差分(FDTD)仿真计算通常是十分耗时的,通用图形处理器(GPGPU)技术为其提供了一种合适的解决方案。通过分析FDTD算法特征以及Courant稳定性及数值色散稳定条件,阐述其在并行计算方面的优势。OpenCL是一种新的开放的行业标准,可以用来开发在CPUs,GPUs及其它各种平台上通用的程序。通过阐述OpenCL硬件基础,执行环境,实现方法来增进对其概念的掌握。为充分发挥异构处理平台下GPU的计算能力,提出了基于开放运算语言(OpenCL)模型,并且利用图形处理器并行FDTD仿真的实现方法。并与传统CPU计算相比较,验证计算结果的精确性。通过分析不同网格数量的速度提升情况,结果表明基于OpenCL的GPU计算速度与单CPU相比可以提升几十倍。 It usually takes a lot of time to simulate Large-scale electromagnetic with Finite Difference Time Domain(FDTD) method, but now General Purpose Graphics Processing Units(GPGPU) has provided a viable solution to solve this problem. It can be found that FDTD is an inherently data parallel algorithm by analyzing its algorithm characteristics and its courant stability condition and its numerically stable condition. OpenCL is a new open industry standard that can be used to program CPUs, GPUs, and other devices from different vendors. By introducing OpenCL hardware basis, execution environment, realization method, it could make us understand its conception easier. In order to fully exploit the capability of GPU for general—purpose computing under heterogeneous processing platforms, Parallel method for FDTD algorithm was put forward by using GPU based-on Open Computing Language(OpenCL) model. Comparing with the calculation with traditional CPU, its accuracy was verified. By analyzing calculation speed in different sizes of Yee cells, the acceleration based on OpenCL could be come up to tens of times compare to single CPU.

作者龚兴全李康孔凡敏

机构地区山东大学信息科学与工程学院

出处《系统仿真学报》 CAS CSCD 北大核心 2014年第8期1639-1643,1651,共6页 Journal of System Simulation

基金国家自然科学基金(61077043) 国家重点基础研究发展计划(2009CB930503)

关键词图形处理器开放运算语言时域有限差分方法加速比 graphics processing units open computing language finite difference time domain acceleration ratio

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1陈钢,吴百锋.面向OpenCL模型的GPU性能优化[J].计算机辅助设计与图形学学报,2011,23(4):571-581. 被引量：21
2闫玉波,葛宁,郑美艳,葛德彪,田春明.网络并行FDTD方法分析电大目标电磁散射[J].电子学报,2003,31(6):821-824. 被引量：24

二级参考文献24

1吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：227
2孙家旭张林波.网络并行计算与分布式编程环境[M].北京:科学出版社,1996..
3()wens J D, Houston M, Luebke D, et al. GPU computing [J]. Proceedings of the IEEE, 2008, 96(5): 879-899.
4Owens J D, Luebke D, Govindaraju N, et al. A survey of general-purpose computation on graphics hardware [J]. Computer Graphics Forum, 2007, 26(1): 80-113.
5Fatahalian K, Houston M. GPUs:a closer look [J]. ACM Queue, 2008, 6(2): 18 28.
6Jang B, Mistry P, Sehaa D, et al. Data transformations enabling loop vectorization on multithreaded data parallel architectures [C] //Proceedings of the 15th ACM SIGPLAN Symposium on Principles ahd Practice of Parallel Programming. New York: ACM Press, 2010:353-354.
7Liu Y X, Zhang E Z, Shen X P. A cross-input adaptive framework for GPU program optimizations [C] //Proceedings of IEEE International Symposium on Parallel & Distributed Processing. Los Alamitos: IEEE Computer Society Press, 2009, 1-10.
8Ryoo S, Rodrigucs C I, Stone S S, et al. Program optimization space pruning for a multithreaded GPU [C]// Proceedings of the 6th Annual IEEE/ACM International Symposium on Code Generation and Optimization. New York: ACM Press, 2008:195-204.
9Ryoo S, Rodrigues C l, Stone S S, el al. Optimization principles and application performance evaluation of a multithreaded GPU using CUDA [C] //Proceedings of the 13th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming. New York: ACM Press, 2008:73-82.
10Jang 13, Do S, Pien H, etal. Architecture aware optimization targeting multithreaded stream computing[C] //Proceedings of the 2nd Workshop on General Purpose Processing onGraphics Processing Units, New York: ACM Press, 2009: 62-70.

共引文献43

1杨利霞,葛德彪,郑奎松,魏兵.电各向异性介质FDTD并行算法的实现[J].电波科学学报,2004,19(z1):63-65.
2郑奎松,葛德彪,葛宁.三维电磁散射的网络并行FDTD计算和加速比分析[J].电波科学学报,2004,19(6):767-771. 被引量：13
3冯菊,陈星,黄卡玛.MPI环境下FDTD高效率网络并行计算研究[J].淮阴师范学院学报（自然科学版）,2005,4(1):57-61. 被引量：3
4张玉,李斌,梁昌洪.PC集群系统中MPI并行FDTD性能研究[J].电子学报,2005,33(9):1694-1697. 被引量：14
5冯峰,逯贵祯,关亚林.二维FDTD算法的网络并行运算实现[J].北京广播学院学报（自然科学版）,2005,12(2):16-22. 被引量：2
6杨利霞,葛德彪,郑奎松,魏兵.电各向异性介质FDTD并行算法的研究[J].电波科学学报,2006,21(1):43-48. 被引量：9
7葛德彪,杨利霞.各向异性介质FDTD分析及其并行计算[J].系统工程与电子技术,2006,28(4):483-485. 被引量：4
8冯峰,逯贵祯,关亚林.用MPI实现FDTD网络并行电磁散射运算[J].微波学报,2006,22(2):11-16. 被引量：4
9梁丹,冯菊,陈星.高效率FDTD网络并行计算研究[J].四川大学学报（自然科学版）,2006,43(3):549-554. 被引量：7
10杨利霞,葛德彪,魏兵,郑奎松,葛宁.FDTD并行算法研究:电和磁本构参数均为各向异性情形[J].电子学报,2006,34(9):1703-1707. 被引量：3

同被引文献7

1邹华,高新波,吕新荣.层次包围盒与GPU实现相结合的光线投射算法[J].计算机辅助设计与图形学学报,2009,21(2):172-178. 被引量：24
2吕宏,柯熙政.具有轨道角动量光束入射下的单球粒子散射研究[J].物理学报,2009,58(12):8302-8308. 被引量：10
3丁攀峰,蒲继雄.拉盖尔高斯涡旋光束的传输[J].物理学报,2011,60(9):338-342. 被引量：24
4卢贺齐,鲍鹏,冯结青.基于OpenCL的实时KD-Tree与动态场景光线跟踪[J].计算机辅助设计与图形学学报,2013,25(7):963-973. 被引量：8
5谌娟,柯熙政,杨一明.拉盖尔高斯光的衍射和轨道角动量的弥散[J].光学学报,2014,34(4):246-252. 被引量：10
6胡一恭.轨道角动量在无线通信中的应用研究[J].通信技术,2017,50(9):1883-1890. 被引量：3
7李龙,薛皓,冯强.涡旋电磁波的理论与应用研究进展[J].微波学报,2018,34(2):1-12. 被引量：21

引证文献2

1曹小鹏,韩俊刚.可重构的光线追踪处理器架构模型及仿真[J].系统仿真学报,2017,29(2):273-281.
2孙驰,赵恒凯.目标物散射对轨道角动量的影响[J].工业控制计算机,2019,32(7):150-152.

1杜刘革,李康,孔凡敏.基于CUDA的图形处理器FDTD算法仿真研究[J].系统仿真学报,2011,23(4):668-672. 被引量：3
2Intersil的单向内核控制器为Santa Rosa平台GPU供电[J].电子与电脑,2006(11):82-82.
3分布式计算面临挑战[J].中国信息化,2007(24):23-23.
4翁宁龙,刘冉,吴子章.一种改进的LBP特征的人脸识别方法[J].信息通信,2011,24(3):3-4. 被引量：1
5蔡丽萍.基于Web Services的企业应用集成方案设计[J].胜利油田职工大学学报,2008(4):79-80.
6何家荣,田绪红,高月芳.一种图像全局显著区域快速检测算法[J].现代计算机（中旬刊）,2013(4):26-30.
7何炎祥,张军,沈凡凡,江南,李清安,刘子骏.通用图形处理器线程调度优化方法研究综述[J].计算机学报,2016,39(9):1733-1749. 被引量：4
8林茂,董玉敏,邹杰,杨敏,张晋楠.GPGPU编程技术初探[J].电脑编程技巧与维护,2010(2):15-17. 被引量：2
9刘晴.QLogic为IBM提供第五代FC适配器和Virtual Fabric适配器[J].计算机与网络,2013,39(16):52-52.
10刘云华,饶刚毅,罗年猛,朱林.一种精度可控的CAD网格模型及轻量化算法的研究[J].计算机应用研究,2014,31(10):3148-3151. 被引量：5

系统仿真学报

2014年第8期

浏览历史

内容加载中请稍等...

基于OpenCL的图形处理器FDTD算法仿真研究被引量：2

参考文献2

二级参考文献24

共引文献43

同被引文献7

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于OpenCL的图形处理器FDTD算法仿真研究 被引量：2

参考文献2

二级参考文献24

共引文献43

同被引文献7

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于OpenCL的图形处理器FDTD算法仿真研究被引量：2