基于GPU的分子动力学模拟并行化及实现被引量：9

Parallel Algorithm and Implementation for Molecular Dynamics Simulation Based on GPU

下载PDF

导出

摘要分子动力学模拟作为获得液体、固体性质的重要计算手段,广泛应用于化学、物理、生物、医药、材料等众多领域。模拟体系的复杂性和精确性的需求,使得计算量巨大,耗费时间长。并行计算是加速大规模分子动力学模拟的重要途径。GPU以几百GFlops甚至上TFlops的运算能力,为分子动力学模拟等的计算密集型应用提供了新的加速方案。提出了一种基于GPU的分子动力学模拟并行算法——oApT-AD,并在OpenCL和CUDA框架下加以实现。性能测试显示,在Tesla C1060显卡上,该算法在OpenCL框架下的实现相对于CPU的串行实现,最高达到120倍加速比。通过对比发现,该算法在CUDA上的性能与OpenCL基本相当。同时,该算法还可以扩展到两块及以上的GPU上,具有良好的可扩展性。 Molecular Dynamics Simulation is an important method for acquiring liquid and solid atoms＇ properties.This method has been widely used in the fields of chemistry,physics,biology,medicine and materials.The complexity and accuracy demand causes enormous workloads.Parallel computing is a feasible way to speedup large-scale molecular dynamics simulation.With hundreds of GFlops or even TFlops performance,GPU can speed up computing-intensive applications.This paper presented a parallel algorithm named oApT-AD,and we implemented it on GPU under OpenCL and CUDA Framework.The experiment results show that the oApT-AD algorithm can achieve 120 speedup on GPU Tesla C1060 under OpenCL Framework,compared to that on CPU.And we also implemented the oApT-AD algorithm on GPU under CUDA Framework.The implement under OpenCL Framework provides almost the same performance as the implement under CUDA Framework.Moreover,our algorithm can be extended to two or more GPUs,with good scala-bility.

作者费辉张云泉王可许亚武

机构地区中国科学院软件研究所并行软件与计算科学实验室中国科学院软件研究所计算机科学国家重点实验室中国科学院研究生院广州大学网络与现代教育技术中心

出处《计算机科学》 CSCD 北大核心 2011年第9期275-278,287,共5页 Computer Science

基金国家863计划项目(2006AA01A125 2009AA01A129 2009AA01A134) 国家重大专项核高基项目(2009ZX01036-001-002)资助

关键词分子动力学 GPU OPENCL CUDA 原子分解法 Molecular dynamics GPU OpenCL CUDA Atom decomposition

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1文玉华,朱如曾,周富信,王崇愚.分子动力学模拟的主要技术[J].力学进展,2003,33(1):65-73. 被引量：132
2陈飞国,葛蔚,李静海.复杂多相流动分子动力学模拟在GPU上的实现[J].中国科学（B辑）,2008,38(12):1120-1128. 被引量：17
3王小伟,郭力,杨章远.近程作用分子动力学模拟的两级并行[J].计算机与应用化学,2003,20(5):639-642. 被引量：5
4吴江涛,刘志刚,赵小明.分子动力学模拟中不同短程作用力计算方法的效率研究[J].西安交通大学学报,2002,36(5):477-481. 被引量：3
5Plimpton S. Fast parallel algorithms for short-range molecular dynamics[J]. Journal of Computational Physics, 1995, 117 ( 1 ) :1-19.
6Allen M P,Tildesley D J. Computer Simulation of Liquids[M]. Oxford:Claredon Press, 1994.
7Allen F, et al. BlueGene: A vision for protein science using a petaflop computer[J]. IBM Systems Journal, 2001,40 (2) : 310- 327.
8Gara A, et aL Overview of the Blue Gene/L System Architecture [J]. IBM Journal of Research and Development, 2005,49(2/3):195-212.
9Phillips C, et al. Sealable Molecular Dynamics with NAMD[J]. J. Comput. Chem. ,2005,26(16):1781-1802.
10HumphreyW, Dalke A, Schulten K. VMD-Visual Molecular Dynamics[J]. J. Molec. Graphics, 1996,14(1) : 33-38.

二级参考文献38

1蔡锡年.分子动力学和物理力学[A].见:中国科学院力学研究所编.力学未来15年[C].北京:科学出版社,1986.100～110.
2冯端等著.金属物理学第一卷:结构与缺陷[M].北京:科学出版社,2000.31～76.
3Alder B J, Wainwright T. Molecular dynamics by electronic computers. In: Prigogine I, eds. Proceeding of International Symposium on Transport Processes in Statistical Mechanics. Brussels: Interscience, New York: Wiley, 1956.97-131.
4Moore G E. Cramming more components onto integrated circuits. Electronics, 1965, 38(8): 114-117.
5NVIDIA. NVIDIA CUDA Compute Unified Device Architecture Programming Guide Version 2.0. 2008.
6Belleman R G, Bedorf J, Zwart S F P. High performance direct gravitational N-body simulations on graphics processing units Ⅱ : An implementation in CUDA. New Astron, 2008, 13(2): 103-112.
7Tolke J. Implementation of a Lattice Boltzmann kernel using the compute unified device architecture developed by nVIDIA. Comput Visual Sci, 2008, DOI: 10.1007/s00791-008-0120-2.
8van Meel J A, Arnold A, Frenkel D, Zwart S F P, Belleman R G. Harvesting graphics power for MD simulations. Mol Simulat, 2008, 34(3): 259-266.
9Anderson J A, Lorenz C D, Travesset A. General purpose molecular dynamics simulations fully implemented on graphics processing units. J Comput Phys, 2008, 227(10): 5342-5359.
10Liem S Y, Brown D, Clarke J H R. Investigation of the homogeneous-shear nonequilibrium-molecular-dynamics method. Phys Rev A, 1992, 45(6): 3706-3713.

共引文献153

1周冬雪.抗盐聚合物乳化机理研究[J].采油工程,2022(1):35-40.
2丁勇杰,周超.分子模拟技术在复合材料研究中的应用[J].玻璃钢／复合材料,2012(S1):297-300. 被引量：1
3SONGXiaoyan.Application of mesoscale modeling optimization to development of advanced materials[J].Progress in Natural Science:Materials International,2004,14(8):656-663.
4谭晓莉,曾新吾,王裴.固体炸药起爆的经典分子动力学研究进展[J].含能材料,2005,13(1):61-68.
5陈明君,李洪珠,李旦.碳纳米管力学行为研究的新进展[J].机械工程学报,2005,41(3):18-24. 被引量：8
6李萌萌,贾建援.微流体流动中的分子模拟技术[J].航空计算技术,2005,35(1):30-33. 被引量：1
7郑立宝,王崇愚.单空位体系多尺度模拟[J].物理学报,2005,54(11):5274-5280. 被引量：2
8杨滨,陆建生.沉积贵金属载体薄膜催化剂的计算机模拟研究[J].云南冶金,2005,34(5):28-31. 被引量：1
9李佳,刘信安.在MPICH集群分布系统下复杂分子动力学的并行计算[J].计算机与应用化学,2005,22(11):963-966. 被引量：2
10刘桂勇,刘军.材料科学中的分子动力学模拟[J].材料导报,2005,19(F11):214-216.

同被引文献65

1王珏,邱流潮.应用基于GPU的SPH方法模拟二维楔形体入水砰击问题[J].计算力学学报,2013,30(S1):174-177. 被引量：3
2吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：227
3白玉川,许栋,王玉琦,张梅亭.二维溃坝波遇障碍物的水流泥沙数值模拟[J].水利学报,2005,36(5):538-543. 被引量：20
4吴飞,吴凡.TIN向规则格网DEM转换的快速算法[J].测绘科学,2005,30(4):76-77. 被引量：8
5柳有权,刘学慧,吴恩华.基于GPU带有复杂边界的三维实时流体模拟[J].软件学报,2006,17(3):568-576. 被引量：54
6李建明,万单领,迟忠先,胡祥培.一种基于GPU加速的细粒度并行粒子群算法[J].哈尔滨工业大学学报,2006,38(12):2162-2166. 被引量：8
7杨明,余欣,姜恺,高文永.水动力学数学模型并行计算技术研究及实现[J].泥沙研究,2007,32(3):1-3. 被引量：8
8马国正,南俊民.双CPU计算服务器MPI并行环境的实现及其在生物大分子动力学模拟中的应用[J].计算机与应用化学,2007,24(8):1092-1094. 被引量：1
9胡泽林.基于质谱的高性能蛋白质非标记定量软件设计与性能优化[D].2009.
10MPI:A Message-Passing Interface Standard[OL].http://www.mpi-forum.org/docs/mpi-11-html/mpi-report.html.

引证文献9

1蔡勇,李光耀,王琥.GPU通用计算平台上中心差分格式显式有限元并行计算[J].计算机研究与发展,2013,50(2):412-419. 被引量：11
2詹科,王靖,袁良,张云泉.基于MPI和CUDA的蛋白质定量软件的设计和分析[J].计算机科学,2013,40(3):36-37.
3王涛.计算生物学中的高性能计算(Ⅰ)—分子动力学[J].计算机工程与科学,2014,36(12):2242-2250. 被引量：1
4韦向远,杨辉华,谢谱模.基于CUDA的并行布谷鸟搜索算法设计与实现[J].计算机科学与探索,2014,8(6):665-673. 被引量：2
5卢立托,李攀峰,马洪浩.基于GPU的不规则三角网向规则格网数字高程模型转换算法优化[J].计算机应用,2015,35(A01):32-34. 被引量：2
6许栋,徐彬,David PAyet,白玉川,及春宁.基于GPU并行计算的浅水波运动数值模拟[J].计算力学学报,2016,33(1):113-120. 被引量：13
7俞伟,宁璐璐,许菲.基于GPU的生物大分子计算平台的构建与优化[J].食品与生物技术学报,2017,36(10):1101-1105.
8祁美玲,杨琼,王苍龙,田园,杨磊.结构材料辐照损伤的分子动力学程序GPU并行化及优化[J].计算物理,2017,34(4):461-467. 被引量：2
9张帅,徐顺,刘倩,金钟.基于GPU的分子动力学模拟Cell Verlet算法实现及其并行性能分析[J].计算机科学,2018,45(10):291-294. 被引量：6

二级引证文献37

1王卫锋,田亮.基于改进量子粒子群的分布式并行计算框架设计[J].计算机测量与控制,2014,22(6):1960-1962. 被引量：1
2王勇献,张理论,车永刚,徐传福,刘巍,程兴华.高阶精度CFD应用在天河2系统上的异构并行模拟与性能优化[J].计算机研究与发展,2015,52(4):833-842. 被引量：5
3韩琪,蔡勇.基于GPU的大规模拓扑优化问题并行计算方法[J].计算机仿真,2015,32(4):221-226. 被引量：5
4程顺超,原玲,姜文超,王多强,李东明.TH-1-GZ环境下Calculix并行机制研究与应用[J].计算机应用与软件,2015,32(9):22-25.
5黄敏,丁萍,罗海飚.共轭梯度法在GPU及Xeon Phi下的并行优化及比较[J].华南理工大学学报（自然科学版）,2015,43(11):35-46. 被引量：1
6侯乐,杨辉华,樊永显,李灵巧,蒋淑洁.基于ILS-CS优化算法的个性化旅游线路研究[J].计算机科学与探索,2016,10(1):142-150. 被引量：12
7蔡勇,李胜.差分进化算法的细粒度并行计算方法及其应用[J].计算机仿真,2016,33(10):249-253. 被引量：1
8刘红,杨策,邢雁辉,张竹绿,崔蒙.高性能计算在中医药领域的应用探讨[J].中国中医药图书情报杂志,2016,40(6):10-12.
9王伟.基于非线性有限元算法的高压电塔寿命预测[J].电子设计工程,2016,24(21):18-20. 被引量：3
10杨洪余,李成明,王小平,姜青山.CPU/GPU异构环境下图像协同并行处理模型[J].集成技术,2017,6(5):8-18. 被引量：6

1焦善飞,何晨,豆育升,唐红.短程力分子模拟在Hadoop上的实现及优化[J].计算机工程与科学,2013,35(2):26-31. 被引量：1
2段红英.Fortran程序CUDA并行化总结[J].物联网技术,2015,5(11):92-93. 被引量：2
3阮利,秦广军,肖利民,祝明发.基于龙芯多核处理器的云计算节点机[J].通信学报,2013,34(12):131-141. 被引量：3
4毕庶本,慕宗昭.新一代TFlps档超级计算机的开发[J].新浪潮,1998(6):53-57.
5肖汉,马歌,周清雷.面向OpenCL架构的Harris角点检测算法[J].计算机科学,2014,41(7):306-309. 被引量：7
6郭阳.GPU在高光谱遥感图像解混领域的应用[J].科技视界,2015(8):150-150.
7熊英,罗琼.基于OpenCL的NDVI算法的并行化实现[J].电脑开发与应用,2013,26(11):77-78. 被引量：2
8刘正华,杨决宽,陈云飞.分子动力学并行算法的优化与应用[J].计算机应用研究,2008,25(3):718-720. 被引量：6
9卞亚涛,赵旭,宋健,刘允才.并行化退火粒子滤波[J].吉林大学学报（工学版）,2013,43(S1):239-243.
10陈国强.基于GPU的图像处理算法研究[J].软件,2014,35(2):135-136. 被引量：14

计算机科学

2011年第9期

浏览历史

内容加载中请稍等...

基于GPU的分子动力学模拟并行化及实现被引量：9

参考文献12

二级参考文献38

共引文献153

同被引文献65

引证文献9

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于GPU的分子动力学模拟并行化及实现 被引量：9

参考文献12

二级参考文献38

共引文献153

同被引文献65

引证文献9

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于GPU的分子动力学模拟并行化及实现被引量：9