期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
前列腺癌辅助诊断GPU并行算法设计 被引量:4
1
作者 苏庆华 付景超 +5 位作者 谷焓 张姗姗 李奕飞 江方舟 白翰林 赵地 《计算机科学》 CSCD 北大核心 2019年第S11期524-527,共4页
在癌症高发的当代,前列腺癌作为男性特有的疾病,其发病率逐年升高。卷积神经网络因其在图像识别领域的强大性能而倍受关注,也非常适用于计算机辅助诊断(Computer Aided Design,CAN)领域。由于神经网络模型中通常包含大量参数,因此训练... 在癌症高发的当代,前列腺癌作为男性特有的疾病,其发病率逐年升高。卷积神经网络因其在图像识别领域的强大性能而倍受关注,也非常适用于计算机辅助诊断(Computer Aided Design,CAN)领域。由于神经网络模型中通常包含大量参数,因此训练一个卷积神经网络十分耗时。如何加快神经网络的训练成为了深度学习领域中一个十分重要的问题。为了解决这个问题,一般采用多GPU并行方案。其中,数据同步在GPU性能均衡的情况下表现更佳。因此,文中借鉴已有的基于数据并行算法对前列腺三维卷积网络进行加速。 展开更多
关键词 卷积网络 深度学习 多gpu并行 数据并行 神经网络
下载PDF
基于多GPU并行格子Boltzmann方法的方管湍流模拟 被引量:1
2
作者 胡涛 向星 +1 位作者 葛蔚 王利民 《过程工程学报》 CAS CSCD 北大核心 2022年第3期318-328,共11页
采用CUDA(Compute Unified Device Architecture)和MPI(Message-Passing-Interface)在超级计算机Mole-8.5E上实现了格子Boltzmann方法(LBM)多GPU并行算法,通过三维顶盖驱动方腔流算例验证了多GPU并行LBM算法的准确性和有效性,利用该并... 采用CUDA(Compute Unified Device Architecture)和MPI(Message-Passing-Interface)在超级计算机Mole-8.5E上实现了格子Boltzmann方法(LBM)多GPU并行算法,通过三维顶盖驱动方腔流算例验证了多GPU并行LBM算法的准确性和有效性,利用该并行算法分别对雷诺数Re_(τ)为300,600,1200下的充分发展的方管湍流进行了大规模模拟。研究发现,当计算网格尺寸小于黏性底层厚度(即Δ^(+)<5)时,在壁面附近的相关传递特性统计误差较小,预测精度满足工程应用范围;Re_(τ)为300,600时,不同网格尺寸Δ^(+)下的模拟结果表明LBM在方管流中心湍流特性统计具有网格弱相关性,Re_(τ)为600时,与DNS(Direct Numerical Simulation)相比,Δ^(+)=1.667,3.750,6.250时平均流向速度的平均误差分别是1.357%,2.994%和4.766%;Re_(τ)分别为300,600和1200时,对应网格尺寸Δ^(+)分别为0.833,1.667和3.333时的方管湍流模拟中,成功捕捉到了二次流特性,预测得到的中心面流向速度、脉动均方根速度等的规律与文献基本吻合,进一步验证了单松弛LBM的可靠性,相关计算结果也为理解高Re_(τ)下的方管湍流特性提供了参考。方管湍流的模拟验证了单松弛LBM多GPU并行算法在超大规模网格计算中的潜力,为进一步实现实际工程流动所需更大规模的数值模拟奠定了基础。 展开更多
关键词 格子BOLTZMANN方法 多gpu并行 方管湍流 计算流体力学 数值模拟
原文传递
简化混合域全波形反演多GPU加速策略 被引量:6
3
作者 桂生 刘洪 张玉洁 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2017年第2期665-677,共13页
全波形反演利用地震记录中的振幅、走时和相位等信息,通过拟合实际地震记录和计算波场来定量提取地下介质的弹性参数,进而为勘探地震成像、速度建模以及大尺度构造演化分析等提供可靠依据.但全波形反演计算量巨大,特别是应用于三维大区... 全波形反演利用地震记录中的振幅、走时和相位等信息,通过拟合实际地震记录和计算波场来定量提取地下介质的弹性参数,进而为勘探地震成像、速度建模以及大尺度构造演化分析等提供可靠依据.但全波形反演计算量巨大,特别是应用于三维大区块叠前数据时,生产成本仍然很高.本文介绍并比较了时间域和频率域的全波形反演方法,综合两者的优点,最终采用混合域的反演算法,并且在此基础上做了进一步的简化以提高计算效率.针对全波形反演方法应用于大规模叠前数据时易陷入局部极小值的问题,我们提出对模型数据进行分割,同时在数个小模型内进行梯度搜索,然后对比各个局域的梯度,最终找出合适的全局下降方向,以克服局部极小的隐患.该方法能够充分利用GPU的硬件特性.在GPU环境下实现本文所提出的简化混合域全波形反演算法.数值计算实例体现出新方法具有良好的计算效率、反演精度和算法可扩展性. 展开更多
关键词 全波形反演 混合域 三维模型 大规模 多gpu并行
下载PDF
基于多GPU的格子Boltzmann法对槽道湍流的直接数值模拟 被引量:3
4
作者 许丁 陈刚 +1 位作者 王娴 李跃明 《应用数学和力学》 CSCD 北大核心 2013年第9期956-964,共9页
采用多GPU并行的格子Boltzmann方法(lattice Boltzmann method,LBM)对充分发展的槽道湍流进行了直接数值模拟.GPU(graphic processing unit)的数据并行单指令多线程(single-instruction multiple-thread,SIMT)特征与LBM完美的并行性相匹... 采用多GPU并行的格子Boltzmann方法(lattice Boltzmann method,LBM)对充分发展的槽道湍流进行了直接数值模拟.GPU(graphic processing unit)的数据并行单指令多线程(single-instruction multiple-thread,SIMT)特征与LBM完美的并行性相匹配,使得LBM求解器在GPU上运行获得了极高的性能,亦使得大规模DNS(direct numerical simulation)在桌面级计算机上进行成为可能.采用8个GPU,网格数目达到6.7×107,全场网格尺寸Δ+=1.41.模拟3×106个时间步长,用时仅24 h.另外,直接模拟结果无论是在平均流速或湍流统计量上均与Moser等的结果吻合得很好,这也证实了二阶精度的格子Boltzmann法直接模拟湍流的能力与有效性. 展开更多
关键词 格子Boltzmann法 多gpu并行 槽道湍流 直接数值模拟(DNS)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部