大规模有限元系统的GPU加速计算研究被引量：11

Solving large finite element system by GPU computation

下载PDF

导出

摘要研究了GPU(Graphics Processing Units)计算应用于有限元方法中的总刚计算和组装、稀疏矩阵与向量乘积运算、线性方程组求解问题,并基于CUDA(Compute Unified Device Architecture)平台利用GTX295GPU进行程序实现和测试。系统总刚采用CSR(Compressed Sparse Row)压缩格式存放于GPU显存中,用单元染色方法实现总刚并行计算组装,用共轭梯度迭代法求解大规模线性方程组。对300万自由度以内的空间桁架和平面问题算例,GPU有限元计算分别获得最高9.5倍和6.5倍的计算加速比,并且加速比随系统自由度的增加而近似线性增加,GFLOP/s峰值也有近10倍的增加。 Some techniques for applying GPU（Graphics Processing Units） computation in FEM（Finite El- ement Method） were investigated in this paper, which include element stiffness matrix parallel calcula- tion and global stiffness matrix assembly method, unstructured sparse matrix-vector multiplication and large-scale linear system solving method. A FEM code was implemented by using CUDA（Compute Uni- fied Device Architecture） platform and tested on nVidia GeForce GPU device. The system stiffness ma- trix was stored in the graphics memory in CSR（Compressed Sparse Row） format,and assembled via element coloring. Conjugate gradient method was used to solve FEM linear system iteratively. For the truss and 2D examples, the GPU-based FEM code gained speedups up to 9. 5x and 6.5x, respectively. It is found that the GPU speedup values are roughly linear with system DOFs（Degree Of Freedoms）,and the peak values of GFLOP/s increase approximately 10 times when comparing with those of CPU＇s.

作者刘小虎胡耀国符伟

机构地区华中科技大学力学系

出处《计算力学学报》 EI CAS CSCD 北大核心 2012年第1期146-152,共7页 Chinese Journal of Computational Mechanics

基金国家自然科学基金(10672066)资助项目

关键词 GPU计算有限元共轭梯度法并行计算 CUDA GPU computation finite element method conjugate gradient method parallel computation CUDA

分类号 TP391.9 [自动化与计算机技术—计算机应用技术] O242.21 [理学—计算数学]

引文网络
相关文献

参考文献15

1史宝军,袁明武,孙树立,陈斌.基于核重构思想的配点型无网格方法的研究——一维问题[J].计算力学学报,2004,21(1):97-103. 被引量：4
2袁明武,孙树立,蔡定正.一种新的墙单元[J].计算结构力学及其应用,1996,13(1):17-24. 被引量：7
3黄鹏,张雄,马上,王汉奎.基于OpenMP的三维显式物质点法并行化研究[J].计算力学学报,2010,27(1):21-27. 被引量：14
4nVidia Corporation. nVidia CUDA Programming Guide 3.0[R]. 2010.
5Bolz J, Farmer I, Grispun E, Schroder P. Sparse ma- trix solvers on the GPU..conjugate gradients and mul- tigrid[J]. ACM Transactions on Graphics, 2003,22 : 917-924.
6Goddeke D. Gpgpu Performance Tuning [R]. Teeh. Rep., University of Dortmund, Germany, http:ff www. mathematik, uni-dortmund, de/ goeddeke/ gpgpu/, 2005.
7Goddeke D, Strzodka R,Turek S, Accelerating double precision FEM simulations with GPUs [A]. Proe. ASIM[C]. 2005.
8Goddeke D, Strzodka R, Turek S. Performance and ac- curacy of hardware-oriented native-, emulated- and mixed precision solvers in FEM simulations[J]. In- ternational Journal of Parallel, Emergent and Dis- tributed Systems, 2007,22 : 221-256.
9Goddeke D, Strzodka R, Mohd-Yusof J, McCormick P,Wobker H,Becker C,Turek S. Using GPUs to Im- prove multigrid solver performance on a Cluster[J]. International Journal of Computational Science and Engineering, 2008,4 : 36-55.
10Taylor Z,Cheng M, Ourselin S. High-speed nonlinear finite element analysis for surgical simulation usinggraphics processing units[J]. IEEE Transactions on Medical Imaging, 2008,27 : 650-663.

二级参考文献36

1陈万吉,李勇东.带旋转自由度的精化非协调平面四边形等参元[J].计算结构力学及其应用,1993,10(1):22-29. 被引量：29
2马上,张雄,邱信明.超高速碰撞问题的三维物质点法[J].爆炸与冲击,2006,26(3):273-278. 被引量：23
3HARLOW F H. The particle-in-cell computing method for fluid dynamics[J]. Methods in Computational Physics, 1963,3 : 319-343.
4BRACKBILL J U, KOTHE D B, RUPPEL H M.FLIP: a low-dissipation, particle-in-cell method for fluid flow[J]. Computer Physics Communications, 1988,48:25-38.
5SULSKY D, CHEN Z, SCHREYER H. A particle method for history-dependent materials[J]. Computer Methods in Applied Mechanics Engineering, 1994, 118:179-196.
6SULSKY D,ZHOU S, SCHREYER H. Application of a particle-in-cell method to solid mechanics [J].Computer Physics Communications, 1995, 87: 236- 252.
7ZHANG X, SZE K Y, MA S. An explicit material point finite element method for hyper-velocity impact [J].International Journal for Numerical Methods in Engineering, 2006,66 : 689-706.
8GUO Y, NAIRN J A. Three-dimensional dynamic fracture analysis using the material point method[J]. Computer Modeling in Engineering and Sciences, 2006,16:141-156.
9SULSKY D, SCHREYER H L. Axisymmetric form of the material point method with applications to upsetting and Taylor impact problems [J]. Computer Methods in Applied Mechanics Engineering, 1996, 139:409-429.
10PARKER S G. A component-based architecture for parallel multi-physics PDE simulation [J]. Future Generation Computer Systems, 2006,22: 204-216.

共引文献22

1曾祥勇,朱爱军,邓安福.Winkler地基上中厚板计算的重构核粒子法[J].重庆大学学报（自然科学版）,2009,32(1):44-49.
2陈树坚,李冬梅,王伟明.一种剪力墙元的力学性能研究[J].中山大学学报（自然科学版）,1998,37(1):22-26.
3董军,邓洪洲,王肇民,杨荣.组合巨型框架结构振动特性研究[J].建筑结构,1998,28(9):18-20. 被引量：11
4王肇民,邓洪洲,董军.高层巨型框架悬挂结构体系抗震性能研究[J].建筑结构学报,1999,20(1):23-30. 被引量：61
5邸元,袁明武.高层建筑结构CAD中剪力墙节点几何归并的点阵表示法和矢量表示法[J].计算机辅助设计与图形学学报,1999,11(6):504-507. 被引量：1
6孙树立,陈璞,袁明武.剪力墙的面外刚度对建筑结构计算结果的影响[J].计算力学学报,1999,16(4):421-427. 被引量：6
7黄吉锋,杨志勇.建筑结构设计软件中的关键技术问题[J].建筑结构,2011,41(11):164-171. 被引量：2
8王宇新,李晓杰.线性装药聚能射流成型过程无网格MPM法数值模拟[J].爆破器材,2013,42(1):14-17. 被引量：1
9王宇新,李晓杰,孙国.无网格MPM法三维爆炸焊接数值模拟[J].计算力学学报,2013,30(1):34-38. 被引量：12
10廉艳平,张帆,刘岩,张雄.物质点法的理论和应用[J].力学进展,2013,43(2):237-264. 被引量：36

同被引文献112

1韩小雷,吴梓楠,杨明灿,季静.基于深度学习的区域RC框架结构震损评估方法研究[J].建筑结构学报,2020,41(S02):27-35. 被引量：7
2蔡永恩,罗纲,刘今朝,李青松,张伯艳,陈厚群.不连续岩体-拱坝系统的动力过程数值模拟方法[J].岩土力学,2004,25(z2):361-365. 被引量：3
3ZHENG Hong1,2 & JIANG Wei2 1 China Three Gorges University,Key Laboratory of Geological Hazards on Three Gorges Reservoir Area,Ministry of Education, Yichang 443002,China,2 State Key Laboratory of Geomechanics and Geotechnical Engineering,Institute of Rock and Soil Mechanics,Chinese Academy of Sciences,Wuhan 430071,China.Discontinuous deformation analysis based on complementary theory[J].Science China(Technological Sciences),2009,52(9):2547-2554. 被引量：15
4陈卫东.求图着色问题的新算法[J].微计算机应用,2004,25(4):391-395. 被引量：11
5刘军,李仲奎.非连续变形分析方法中一些控制参数的设置[J].成都理工大学学报（自然科学版）,2004,31(5):522-526. 被引量：7
6刘君,孔宪京,Shyu Kuokai.DDA与FEM耦合法在分缝重力坝非线性分析中的应用[J].计算力学学报,2004,21(5):585-591. 被引量：10
7吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
8李晓梅,吴建平.Krylov子空间方法及其并行计算[J].计算机科学,2005,32(1):19-20. 被引量：20
9殷小玲.图的所有可能的K着色并行算法[J].池州师专学报,2006,20(3):18-20. 被引量：1
10姜清辉,周创兵,罗先启,郑宏.三维DDA与有限元的耦合分析方法及其应用[J].岩土工程学报,2006,28(8):998-1001. 被引量：14

引证文献11

1张健飞,沈德飞.基于GPU的稀疏线性系统的预条件共轭梯度法[J].计算机应用,2013,33(3):825-829. 被引量：10
2王惠,郭培卿,陈小龙.ANSYS和Abaqus软件GPU加速性能典型算例测试与分析[J].计算机工程与科学,2013,35(11):105-110. 被引量：3
3谢德馨,朱占新,吴东阳,王健.大规模工程涡流场有限元计算的困境与展望[J].中国电机工程学报,2015,35(5):1250-1257. 被引量：14
4朴明伟,张令,徐世锋,杨晶,方吉,兆文忠.快捷货车转向架降低车轮动荷解决方案[J].振动与冲击,2016,35(14):34-40. 被引量：2
5李红豫,滕军,李祚华.钢筋混凝土框架结构非线性静、动力分析的高效计算平台HSNAS(GPU)——Ⅱ验证分析[J].振动与冲击,2016,35(14):54-60. 被引量：2
6林海铭,刘小虎.云环境下的大规模线性有限元并行实现[J].计算力学学报,2017,34(2):197-205. 被引量：1
7刘泉声,蒋亚龙,何军.非连续变形分析的精度改进方法及研究趋势[J].岩土力学,2017,38(6):1746-1761. 被引量：7
8唐任远,吴东阳,谢德馨.单元级别并行有限元法求解工程涡流场的关键问题研究[J].电工技术学报,2014,29(5):1-8. 被引量：7
9李红豫,滕军,李祚华,张璐.图形处理器加速算法在复杂高层结构非线性响应分析中的应用[J].工程力学,2018,35(11):79-85. 被引量：2
10胡斌星,李新国,孙鹏.基于CUDA的有限元矩阵并行装配算法研究[J].计算力学学报,2020,37(3):368-376. 被引量：2

二级引证文献50

1詹梅,董赟达,翟卓蕾,樊晓光,石志鹏,安强.塑性成形快速数值仿真方法的研究进展[J].机械工程学报,2022,58(16):2-20. 被引量：4
2李红豫,李恒,张璐,黄武略.BIM模型与结构分析平台的信息转换关键技术研究[J].建筑结构,2020,50(S01):649-653. 被引量：3
3郑经纬,安雪晖,黄绵松.基于CUDA的大规模稀疏矩阵的PCG算法优化[J].清华大学学报（自然科学版）,2014,54(8):1006-1012. 被引量：4
4谢德馨,朱占新,吴东阳,王健.大规模工程涡流场有限元计算的困境与展望[J].中国电机工程学报,2015,35(5):1250-1257. 被引量：14
5陈尧,赵永华,赵慰,赵莲.GPU加速不完全Cholesky分解预条件共轭梯度法[J].计算机研究与发展,2015,52(4):843-850. 被引量：3
6王飞飞,王海玲,俞海英.基于GPU的三维扩散方程在反应堆计算中的应用[J].核技术,2015,38(4):54-59. 被引量：2
7冯桂宏,于建英,张炳义.感应电机原理的物料输送加热技术[J].电机与控制学报,2015,19(7):45-51. 被引量：1
8林欣达,林穗,姜文超,李东明,王多强.有限元求解器Calculix预处理并行优化方法[J].广东工业大学学报,2015,32(4):138-144. 被引量：1
9黄敏,丁萍,罗海飚.共轭梯度法在GPU及Xeon Phi下的并行优化及比较[J].华南理工大学学报（自然科学版）,2015,43(11):35-46. 被引量：1
10张少杰,杨陈东.求解对称正定线性方程组的正交基变换方法[J].河南科学,2016,34(3):310-314. 被引量：1

1项阳,葛修润.内嵌CAD的面向对象有限元系统的研究与实现[J].计算机应用,2000,20(9):19-21. 被引量：2
2胡宁,张汝清.一种多波前并行处理的有限元算法[J].重庆大学学报（自然科学版）,1991,14(4):16-19.
3岳潇荣,周富照.约束矩阵方程的Hermitian解的共轭梯度迭代算法[J].数学理论与应用,2016,36(4):23-28.
4FU Chao-jiang.Parallel solution for finite element linear systems of equations on workstation cluster[J].通讯和计算机（中英文版）,2009,6(8):59-64.
5刘银虎,缪炳祺.多体动力学仿真软件ADAMS理论基础及其功能分析[J].电子与封装,2005,5(4):25-28. 被引量：26
6谭中富,孙焕纯.多工况作用下空间桁架结构拓扑优化的修正单纯形方法[J].力学学报,1994,26(1):90-98. 被引量：15
7奇异数的计算应用[J].彩票研究,2012(12):74-75.
8王金柱.二重积分近似计算应用的一点改进[J].陕西教育学院学报,1997,0(3):36-78.
9关汝辑.应用AutoLISP处理AutoCAD图形数据[J].专用汽车,2003(5):39-40.
10李占利,孙秀英.一种实现VRML中坐标变换的方法[J].西安科技大学学报,2006,26(2):240-244. 被引量：8

计算力学学报

2012年第1期

浏览历史

内容加载中请稍等...

大规模有限元系统的GPU加速计算研究被引量：11

参考文献15

二级参考文献36

共引文献22

同被引文献112

引证文献11

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

大规模有限元系统的GPU加速计算研究 被引量：11

参考文献15

二级参考文献36

共引文献22

同被引文献112

引证文献11

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

大规模有限元系统的GPU加速计算研究被引量：11