格子Boltzmann方法多GPU并行性能的研究被引量：2

Parallel performance of lattice Boltzmann method with multi-GPUs

导出

摘要基于CUDA和MPI实现了格子Boltzmann方法的多GPU并行计算,利用程序对Tesla K80和Tesla P100的性能进行了测试,结果表明:Tesla P100有着远超Tesla K80的计算性能。单GPU下,P100在计算规模为2563达到最大值2880.0 MLUPS,K80在规模为384~3达到最大值801.6 MLUPS;在多GPU并行时,GPU间通信会带来计算性能的损失,但是P100较K80仍具有较大的提升;测定函数LBCollProp在不同规模下运行时间以及其在程序总运行时间中的占比,由此可以预估程序运行一定时间步的耗时。 Multi-GPU parallel computation of lattice Boltzmann method is implemented by using CUDA and MPI. The computational performances of the LBM program run on Tesla K80 and Tesla P100 were tested. Numerical results show that the computational speed of the LBM program on Tesla P100 is far faster than that ofTesla K80. For single GPU, LBM program run on P100 reaches its maximum 2880.0 MLUPS with 2563 size scale while that of K80 obtains the maximum 801.6 MLUPS with 3843 size scale; For multi-GPUs parallel computation, although the communication between GPUs bring the loss of computational performance, the P100 still has a larger considerable room for improvement than that of K80; the exact execution time of the function LBCollProp and its percentage in total time consumed in the program is obtained at different size scale, thus the consuming time of the total program can be well predicted.

作者张纲王利民葛蔚

机构地区中国科学院过程工程研究所多相复杂系统国家重点实验室中国科学院大学

出处《计算机与应用化学》 CAS 2017年第10期739-748,共10页 Computers and Applied Chemistry

基金国家自然科学基金资助项目(91434113 51776212) 中国科学院前沿科学研究重点计划(QYZDB-SSW-SYS029) 国家重点基础研究发展计划(973)资助项目(2015CB251402)

关键词格子BOLTZMANN方法 TeslaP100 性能 lattice Boltzmann method Tesla P 100 parallel performance

分类号 TP391.9 [自动化与计算机技术—计算机应用技术] TQ015.9 [化学工程]

引文网络
相关文献

参考文献2

1XIONG QinGang,LI Bo,XU Ji,FANG XiaoJian,WANG XiaoWei,WANG LiMin,HE XianFeng,GE Wei.Efficient parallel implementation of the lattice Boltzmann method on large clusters of graphic processing units[J].Chinese Science Bulletin,2012,57(7):707-715. 被引量：6
2张云,王小伟,葛蔚,杨朝合.多松弛时间格子Boltzmann方法在GPU上的实现[J].计算机与应用化学,2011,28(3):265-269. 被引量：4

二级参考文献6

1CHEN FeiGuo,GE Wei,LI JingHai.Molecular dynamics simulation of complex multiphase flow on a computer cluster with GPUs[J].Science China Chemistry,2009,52(3):372-380. 被引量：9
2柴振华,施保昌,郑林.Simulating high Reynolds number flow in two-dimensional lid-driven cavity by multi-relaxation-time lattice Boltzmann method[J].Chinese Physics B,2006,15(8):1855-1863. 被引量：4
3Feiguo Chen Wei Ge Li Guo Xianfeng He Bo Li Jinghai Li Xipeng Li Xiaowei Wang Xiaolong Yuan.Multi-scale HPC system for multi-scale discrete simulation—Development and application of a supercomputer with 1 Petaflops peak performance in single precision[J].Particuology,2009,7(4):332-335. 被引量：19
4李博,李曦鹏,张云,陈飞国,徐骥,王小伟,何险峰,王健,葛蔚,李静海.耦合Nvidia/AMD两类GPU的格子玻尔兹曼模拟[J].科学通报,2009,54(20):3177-3184. 被引量：14
5王健,许明,葛蔚,李静海.单相流动数值模拟的SIMPLE算法在GPU上的实现[J].科学通报,2010,55(20):1979-1986. 被引量：6
6何南忠,王能超,施保昌,郭照立.A unified incompressible lattice BGK model and its application to three-dimensional lid-driven cavity flow[J].Chinese Physics B,2004,13(1):40-46. 被引量：3

共引文献7

1覃章荣,张超英,丘滨,李圆圆,莫刘刘.基于CUDA的格子Boltzmann数值模拟加速实现[J].广西师范大学学报（自然科学版）,2012,30(4):18-24. 被引量：3
2赵海波,徐祖伟,刘昕,史家伟,郑楚光.颗粒凝并动力学MonteCarlo方法的高效GPU并行计算[J].科学通报,2014,59(14):1358-1368. 被引量：3
3GAO Ang,HU YanSu,WANG ZhiJun,MU DeJun,LI JunJie,WANG JinCheng.GPU-accelerated phase field simulation of directional solidification[J].Science China(Technological Sciences),2014,57(6):1191-1197. 被引量：1
4Yanwei Zhang,Yu Bo,Yingchun Wu,Xuecheng Wu,Zhenyu Huang,Junhu Zhou,Kefa Cen.Flow behavior of high-temperature flue gas in the heat transfer chamber of a pilot-scale coal-water slurry combustion furnace[J].Particuology,2014,12(6):114-124.
5朱炼华,郭照立.基于格子Boltzmann方法的多孔介质流动模拟GPU加速[J].计算物理,2015,32(1):20-26. 被引量：9
6李华兵,赫轶男,张乾毅,韦华建,韦国柱.基于CUDA架构的LBM共享内存计算优化[J].桂林电子科技大学学报,2020,40(4):333-337. 被引量：2
7胡涛,向星,葛蔚,王利民.基于多GPU并行格子Boltzmann方法的方管湍流模拟[J].过程工程学报,2022,22(3):318-328. 被引量：1

同被引文献14

1ZHU Zuo-jin,YANG Hong-xing,CHEN Ting-yao.DIRECT NUMERICAL SIMULATION OF TURBULENT FLOW IN A STRAIGHT SQUARE DUCT AT REYNOLDS NUMBER 600[J].Journal of Hydrodynamics,2009,21(5):600-607. 被引量：8
2李雅侠,吴剑华,龚斌,战洪仁.螺旋半圆管夹套内湍流流动与传热的数值模拟[J].过程工程学报,2010,10(4):644-649. 被引量：16
3张云,王小伟,葛蔚,杨朝合.多松弛时间格子Boltzmann方法在GPU上的实现[J].计算机与应用化学,2011,28(3):265-269. 被引量：4
4杨帆,刘连国,王海民,陈二云.垂直转子轴式黏性泵内部流动LBM模拟[J].工程热物理学报,2012,33(1):59-62. 被引量：2
5吴宏,王蛟.基于格子Boltzmann方法的方通道湍流的大涡模拟[J].航空动力学报,2012,27(1):1-8. 被引量：1
6XIONG QinGang,LI Bo,XU Ji,FANG XiaoJian,WANG XiaoWei,WANG LiMin,HE XianFeng,GE Wei.Efficient parallel implementation of the lattice Boltzmann method on large clusters of graphic processing units[J].Chinese Science Bulletin,2012,57(7):707-715. 被引量：6
7杨帆,施徐明,刘连国.二维顶盖驱动半圆腔内流动MRT-LBM研究[J].工程热物理学报,2012,33(4):595-598. 被引量：6
8龚帅,张朝阳,郑平.池沸腾传热的LBM直接数值模拟及加热器热响应[J].工程热物理学报,2019,40(1):135-142. 被引量：5
9吴承优,邱廷省,王利民.稀土浸出过程溶质传递的格子Boltzmann模拟[J].过程工程学报,2014,14(5):730-736. 被引量：6
10郑友取,李国能,胡桂林,张治国,许友生.黏性应力与脉动流强化传热相关性的LBM研究[J].工程热物理学报,2015,36(9):1980-1984. 被引量：2

引证文献2

1白冰,张涛,李汉卿,陈军,师忠卿,张乃峰,陈超,邓磊,车得福.基于不可压LBM的汽液两相流数值研究[J].工程热物理学报,2020,41(8):1952-1959. 被引量：7
2胡涛,向星,葛蔚,王利民.基于多GPU并行格子Boltzmann方法的方管湍流模拟[J].过程工程学报,2022,22(3):318-328. 被引量：1

二级引证文献8

1樊玉光,宋光辉,袁淑霞,刘家豪,雷瑶.气流中液化天然气液滴破碎数值模拟研究[J].石油化工,2021,50(3):224-229. 被引量：2
2韩海燕,贾谦,李娜娜,韩少燕.固体颗粒对发动机缸套-活塞环润滑性能的影响[J].润滑与密封,2021,46(12):30-35. 被引量：3
3佟莹,夏健,陈龙,薛浩天.基于隐式扩散的直接力格式浸没边界格子Boltzmann方法[J].力学学报,2022,54(1):94-105. 被引量：4
4王茜.格子Boltzmann方法在燃料电池两相流中的应用[J].汽车实用技术,2022,47(10):204-207.
5张晟庭,李靖,陈掌星,张涛,吴克柳,冯东,毕剑飞,朱上.基于改进LBM的气液自发渗吸过程中动态润湿效应模拟[J].力学学报,2023,55(2):355-368. 被引量：4
6刘祖锋.基于IB-LBM的水下运动分析[J].科技创新与应用,2023,13(20):26-32. 被引量：1
7高宇航,冯凯,张会臣.基于格子Boltzmann方法的微通道内气液两相流流型和压力降特性研究[J].润滑与密封,2023,48(7):27-33. 被引量：1
8王青芬,孙伟成,沈政昌,陈强,张明,段莉莉.搅拌理论技术在选矿领域的应用及发展[J].有色金属（冶炼部分）,2024(11):76-104. 被引量：1

1李家全.值得注意的“cosθ=cosθ1·cosθ2”[J].数学教学通讯,1983,0(5):39-40.
2刘佳威,许志美,宗原,刘涛.多孔介质通道内非混相驱替过程的格子Boltzmann方法模拟[J].石油化工,2017,46(11):1347-1354. 被引量：2
3胡开南,张宏武,耿少娟.可以恢复Navier-Stokes方程的3阶格子Boltzmann作用力模型[J].航空动力学报,2017,32(8):1943-1949.
4陈达章,袁坤,万军利.乐广高速公路K80滑坡分析与治理[J].铁道建筑,2017,57(9):124-127. 被引量：12
5谷世奎.血小板聚集功能试验在冠心病抗血小板治疗监测中的应用[J].中国医疗设备,2017,32(B04):254-255. 被引量：1
6李国军.试论会计环境[J].全国流通经济,2017(26):86-87.
7谢九冰,杨杉杉,刘若屏,岳向东,王红霞.神经生长因子对原发性闭角型青光眼的视神经保护作用[J].广东医学,2017,38(21):3266-3269. 被引量：10
8徐晨晨,续欣莹,阎高伟,韩晓霞.基于改进分布式极限学习机的电站锅炉NO_x排放预测算法[J].太原理工大学学报,2017,48(6):946-952. 被引量：2
9朱灿敏,肖家平,张弦,张媚,黄天志,胡琴,张细六.左旋多巴对早期帕金森病患者视觉诱发电位的影响[J].神经损伤与功能重建,2017,12(5):410-412. 被引量：4
10鄢焱.比较法视阈下我国大陆地区小额诉讼程序的新图景[J].中国海洋大学学报（社会科学版）,2017(6):90-98. 被引量：3

计算机与应用化学

2017年第10期

浏览历史

内容加载中请稍等...

格子Boltzmann方法多GPU并行性能的研究被引量：2

参考文献2

二级参考文献6

共引文献7

同被引文献14

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

格子Boltzmann方法多GPU并行性能的研究 被引量：2

参考文献2

二级参考文献6

共引文献7

同被引文献14

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

格子Boltzmann方法多GPU并行性能的研究被引量：2