期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
Study of a GPU-based parallel computing method for the Monte Carlo program 被引量:2
1
作者 罗志飞 邱睿 +3 位作者 李明 武祯 曾志 李君利 《Nuclear Science and Techniques》 SCIE CAS CSCD 2014年第A01期27-30,共4页
关键词 并行计算方法 蒙特卡罗程序 gpu GEANT4 模拟程序 蒙特卡洛方法 并行处理能力 图形处理单元
下载PDF
组合几何Monte Carlo粒子输运支撑软件框架JCOGIN的研发 被引量:6
2
作者 张宝印 李刚 +1 位作者 邓力 莫则尧 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第B12期448-452,共5页
为实现核反应堆pin-by-pin精细Monte Carlo粒子输运模拟,研发了组合几何Monte Carlo粒子输运支撑软件框架JCOGIN以支撑千万个几何体、百亿个粒子的Monte Carlo粒子输运大规模并行计算。JCOGIN框架采用层次式、模块化的体系结构设计了适... 为实现核反应堆pin-by-pin精细Monte Carlo粒子输运模拟,研发了组合几何Monte Carlo粒子输运支撑软件框架JCOGIN以支撑千万个几何体、百亿个粒子的Monte Carlo粒子输运大规模并行计算。JCOGIN框架采用层次式、模块化的体系结构设计了适应现代高性能计算机体系结构特征的数据结构,在此基础上实现了对粒子并行与区域分解相耦合的两级并行计算的支撑。在JCOGIN框架下研发了JMCT程序,并进行性能测试,在2万个处理器核上并行效率达70%;基于区域分解完成了大亚湾全堆芯pin-by-pin模型模拟,几何体数达千万,粒子数达百亿。 展开更多
关键词 JCOGIN框架 组合几何 两级并行计算 monte carlo粒子输运
下载PDF
Libor市场模型的Monte Carlo控制变量加速方法及并行实现
3
作者 梁义娟 徐承龙 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2014年第5期1131-1136,共6页
为了加速定价利率衍生产品的Monte Carlo模拟,对远期测度下Libor市场模型中的漂移项用确定性函数近似,构造了一个与原问题高度相关的控制变量.然后将此控制变量算法移植到多核CPU和GPU的并行计算环境中,极大地提高了计算效率.针对利率... 为了加速定价利率衍生产品的Monte Carlo模拟,对远期测度下Libor市场模型中的漂移项用确定性函数近似,构造了一个与原问题高度相关的控制变量.然后将此控制变量算法移植到多核CPU和GPU的并行计算环境中,极大地提高了计算效率.针对利率上限的数值结果表明选取的控制变量十分有效且稳健,多核CPU具有线性加速效果,GPU相对于单核CPU具有很大的计算优势,控制变量和并行计算结合得到的加速效果大致是两者的乘积.结合控制变量和并行计算的方法可以为其他利率衍生产品如利率下限.互换期权的定价提供有效思路. 展开更多
关键词 Libor市场模型 monte carlo模拟 控制变量 并行计算 gpu
原文传递
虚拟化环境下多GPU并行计算研究 被引量:5
4
作者 闵芳 张志先 张玉洁 《微电子学与计算机》 CSCD 北大核心 2016年第3期69-75,共7页
针对大规模计算任务场景,提出在虚拟化环境下多GPU并行计算的实现方案,使用多线程或流处理的方式实现多GPU并行计算,并分析GPU多层次存储结构、传输等方面内容,采用经典的蒙特卡罗方法这一具有代表性的科学计算实例进行实验验证.
关键词 gpu通用计算 虚拟化 并行计算 蒙特卡罗
下载PDF
GPU加速光电耦合输运蒙卡程序研发及应用
5
作者 武祯 路伟 +3 位作者 鄢书畅 邱睿 张辉 李君利 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2022年第11期1649-1656,1663,共9页
针对辐射剂量学领域人员剂量快速评估的应用需求以及现有通用蒙卡程序计算时间过长的问题,本文开发了基于GPU加速的光电耦合输运蒙卡程序Gadep。根据GPU显卡CUDA编程模型下内存、线程层次结构和执行模型中的硬件层次结构特点,对程序框... 针对辐射剂量学领域人员剂量快速评估的应用需求以及现有通用蒙卡程序计算时间过长的问题,本文开发了基于GPU加速的光电耦合输运蒙卡程序Gadep。根据GPU显卡CUDA编程模型下内存、线程层次结构和执行模型中的硬件层次结构特点,对程序框架、粒子输运、步长抽样、数据结构和截面访问等进行了设计和优化。通过计算ICRP 116号成年男性参考人体素模型器官外照射剂量转换系数,对程序进行了正确性验证,和通用蒙卡程序MCNP5单核计算相比,加速效率在48~300倍。以南京放射源丢失事故人员物理剂量重建为例对该程序进行了实际应用,物理剂量重建计算结果和参考值、临床诊断结果相一致,与通用蒙卡程序MCNP5单核计算相比加速效率达到50倍以上,表明Gadep在事故剂量重建、放射诊断及治疗剂量评估等方面有一定的应用价值。 展开更多
关键词 gpu加速 光电耦合 粒子输运 蒙卡程序 加速效率 体素模型 剂量计算 事故剂量重建
下载PDF
动态网格的DSMC方法在GPU上的并行
6
作者 文敏华 林新华 Simon Chong Wee See 《计算机科学与探索》 CSCD 2013年第5期472-479,共8页
直接模拟蒙特卡罗方法(direct simulation Monte Carlo,DSMC)是稀薄气体动力学领域的重要工具。然而,DSMC方法有两个比较主要的缺点:一是复杂的网格处理;另一个是庞大的计算量。使用动态网格的DSMC方法可以根据流场信息,动态生成自适应... 直接模拟蒙特卡罗方法(direct simulation Monte Carlo,DSMC)是稀薄气体动力学领域的重要工具。然而,DSMC方法有两个比较主要的缺点:一是复杂的网格处理;另一个是庞大的计算量。使用动态网格的DSMC方法可以根据流场信息,动态生成自适应的碰撞网格,能有效解决前一个缺点;针对后一个缺点,使用统一计算架构(compute unified device architecture,CUDA)编写并行程序,将基于动态网格的DSMC方法移植到图形处理器(graphic processing unit,GPU)上以减少计算时间。在并行实现中,GPU负责绝大部分的计算,而CPU只负责初始化、结果输出等少量工作。使用一个二维超音速横掠平板问题作为算例,验证了并行程序的正确性。对于不同规模的算例,在NVIDIA Fermi C2050之上均获得了10倍以上的加速比;对于相同算例,NVIDIA最新发布的Kepler K20上的速度约为FermiC2050上的1.3~1.6倍。 展开更多
关键词 统一计算架构(CUDA) 图形处理器(gpu) 直接模拟蒙特卡罗方法(DSMC) 动态网格DSMC 并行模拟
下载PDF
三维灰体辐射传递系数蒙特卡罗的GPU计算
7
作者 刘硕 朱希安 +1 位作者 王占刚 厉夫兵 《计算机应用研究》 CSCD 北大核心 2019年第11期3357-3360,共4页
为了计算漫反射灰体表面之间的辐射传递系数,建立了三维灰立方体模型,在所建立的三维立体空间内表面选取发射表面,利用蒙特卡罗方法生成发射光线,并对光线进行光线追踪,计算发射表面与其他表面之间的辐射传递系数。针对基于蒙特卡罗法... 为了计算漫反射灰体表面之间的辐射传递系数,建立了三维灰立方体模型,在所建立的三维立体空间内表面选取发射表面,利用蒙特卡罗方法生成发射光线,并对光线进行光线追踪,计算发射表面与其他表面之间的辐射传递系数。针对基于蒙特卡罗法计算三维灰体表面之间辐射传递系数时耗时过长的问题,进行了基于显卡GPU实现蒙特卡罗并行计算的研究。利用统一编程架构CUDA对蒙特卡罗法进行了编程实现,采用CUDA随机数发生算法并行处理了求解辐射传递系数中的光线追踪过程,实现了计算辐射传递系数的并行方案。实验结果表明,相对于CPU串行计算方法,基于CUDA架构的并行蒙特卡罗法求解辐射传递系数可以取得高达80倍的计算加速比。 展开更多
关键词 蒙特卡罗方法 辐射传递系数 并行计算 gpu 三维灰体
下载PDF
基于GPU的最小二乘蒙特卡罗算法期权定价 被引量:3
8
作者 杜伟 傅游 《计算机工程与应用》 CSCD 北大核心 2020年第4期225-229,共5页
期权是以金融产品作为行权品种的交易合约。随着期权交易规模和交易量的迅速增长,期权定价的计算量越来越大,在传统CPU平台上对期权进行定价变得越来越困难。图形处理器(GPU)平台的出现和发展为解决期权定价计算提供了解决方案。在GPU... 期权是以金融产品作为行权品种的交易合约。随着期权交易规模和交易量的迅速增长,期权定价的计算量越来越大,在传统CPU平台上对期权进行定价变得越来越困难。图形处理器(GPU)平台的出现和发展为解决期权定价计算提供了解决方案。在GPU上使用最小二乘蒙特卡罗算法(Least Squares Monte Carlo,LSM)实现了对一维和四维美式期权定价计算:首先利用CURAND库产生大量随机数,然后并行化期权标的价格变化路径,最后对最小二乘法和贴现定价进行并行化。为提高GPU平台上LSM方法的计算效率,对整个过程进行了优化。实际测试结果表明,在CPU+GPU上实现一维和四维美式期权定价相对CPU平台的加速比最高分别达到20.275和47.538,且比其他文献的方法整体性能有较大的提升。 展开更多
关键词 gpu 最小二乘蒙特卡罗算法(LSM) 美式期权定价 并行计算
下载PDF
组合几何蒙特卡罗粒子输运支撑软件框架JCOGIN介绍 被引量:11
9
作者 张宝印 李刚 邓力 《强激光与粒子束》 EI CAS CSCD 北大核心 2013年第1期173-176,共4页
介绍了JCOGIN支撑软件框架层次式、模块化的体系结构及其核心数据结构。这些使得JCO-GIN软件框架能够支撑大规模复杂几何的蒙特卡罗(MC)粒子输运并行计算。同时介绍了在JCOGIN支撑软件框架下研发的JMCT程序,并进行了性能测试,在2万处理... 介绍了JCOGIN支撑软件框架层次式、模块化的体系结构及其核心数据结构。这些使得JCO-GIN软件框架能够支撑大规模复杂几何的蒙特卡罗(MC)粒子输运并行计算。同时介绍了在JCOGIN支撑软件框架下研发的JMCT程序,并进行了性能测试,在2万处理器核上模拟20亿粒子,并行效率达到70%。 展开更多
关键词 JCOGIN 支撑软件框架 蒙特卡罗粒子输运 组合几何 并行计算
下载PDF
粒子输运蒙特卡罗模拟现状概述 被引量:33
10
作者 邓力 李刚 《计算物理》 EI CSCD 北大核心 2010年第6期791-798,共8页
蒙特卡罗(MC)方法发展已有60多年历史,广泛应用于核科学及相关领域.MC方法超强的几何处理能力,使用精密的连续点截面参数,能够模拟各种复杂几何系统内的中子、光子、电子、α粒子、质子及其耦合输运问题.随着计算机的快速发展,通过大规... 蒙特卡罗(MC)方法发展已有60多年历史,广泛应用于核科学及相关领域.MC方法超强的几何处理能力,使用精密的连续点截面参数,能够模拟各种复杂几何系统内的中子、光子、电子、α粒子、质子及其耦合输运问题.随着计算机的快速发展,通过大规模并行计算,MC方法及程序已成为模拟各种粒子输运问题的首选工具. 展开更多
关键词 蒙特卡罗 复杂几何 粒子输运 并行计算 首选工具
下载PDF
基于Geant4的质子输运计算的加速方法研究
11
作者 姚志明 黑东炜 +4 位作者 宋顾周 马继明 韩长材 段宝军 岳志勤 《黑龙江科学》 2015年第8期7-9,共3页
质子在医学、材料科学、辐射成像等领域有着广阔的应用前景,质子输运过程的数值模拟是质子应用理论分析的重要手段。本研究基于Geant4软件编写了蒙卡模拟程序,研究了程序的加速方法。结果表明,次级粒子截断和并行计算可以有效加快程序... 质子在医学、材料科学、辐射成像等领域有着广阔的应用前景,质子输运过程的数值模拟是质子应用理论分析的重要手段。本研究基于Geant4软件编写了蒙卡模拟程序,研究了程序的加速方法。结果表明,次级粒子截断和并行计算可以有效加快程序的运行速度。程序易于扩展,为质子应用的快速模拟奠定了基础。 展开更多
关键词 质子输运 蒙特卡罗 加速方法 次级粒子截断 并行计算
下载PDF
面向天河2A系统的基于蒙特卡罗方法的粒子输运异构协同计算 被引量:3
12
作者 李彪 刘杰 《计算机工程与科学》 CSCD 北大核心 2020年第11期1922-1928,共7页
粒子输运模拟在核科学领域、医疗放射治疗领域中占有重要的地位。基于MC方法设计和开发了面向天河2A系统的粒子输运异构协同算法;基于天河2A系统的异构通信模式BCL和ACL,提出了一种CPU与加速器Matrix2000之间的简单高效的对称通信模式;... 粒子输运模拟在核科学领域、医疗放射治疗领域中占有重要的地位。基于MC方法设计和开发了面向天河2A系统的粒子输运异构协同算法;基于天河2A系统的异构通信模式BCL和ACL,提出了一种CPU与加速器Matrix2000之间的简单高效的对称通信模式;在Matrix2000加速器端,通过OpenMP指令开发程序的线程级并行;优化了原MC程序串行数据收集通信模式,提出了新的二叉树通信模式,极大地减少了通信时间。实现的基于CPU/Matrix2000异构协同计算的并行程序,在天河2A系统上进行测试,大规模测试可以扩展到45万核,相对5万核并行效率保持在22.54%。 展开更多
关键词 粒子输运 异构协同计算 蒙特卡罗方法 OPENMP 国产加速器
下载PDF
并行计算在机动飞行轨迹生成中的应用
13
作者 蒋超 王维嘉 王昊 《兵工自动化》 2020年第8期25-31,36,共8页
针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点... 针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点并行方式各自的优点,对每棵搜索树采用叶子节点并行方法,分别利用Pthread和CUDA对并行通用机动框架进行加速,并以筋斗机动为例对加速效果进行测试。实验结果表明:并行通用机动框架不仅性能优于串行框架,而且可大幅缩短机动解算时间。 展开更多
关键词 并行计算 蒙特卡罗树搜索算法 gpu 众核 通用机动框架
下载PDF
提高单板钴源剂量率MCNP计算效率的模拟研究 被引量:2
14
作者 李磊 李晓燕 +3 位作者 黄玮 蒋树斌 伍晓利 杨桂霞 《核技术》 CAS CSCD 北大核心 2015年第3期18-24,共7页
蒙特卡罗方法是目前准确的吸收剂量率计算方法,但其较长的模拟耗时阻碍了它在工业钴源辐射加工和辐照实验中的应用。模拟耗时、模拟精度以及模拟值与实测值的相对偏差是表征蒙特卡罗计算效率的重要指标。针对8.4 PBq的单板钴源辐照装置... 蒙特卡罗方法是目前准确的吸收剂量率计算方法,但其较长的模拟耗时阻碍了它在工业钴源辐射加工和辐照实验中的应用。模拟耗时、模拟精度以及模拟值与实测值的相对偏差是表征蒙特卡罗计算效率的重要指标。针对8.4 PBq的单板钴源辐照装置,讨论了并行线程数、记数方法、记数栅元尺寸、γ致电子的处理方式和截断能5种参数对蒙特卡罗程序MCNP吸收剂量率计算效率的影响。利用实验测量结合模拟试算的方法,给出了在保证一定精度和相对偏差前提下,使得模拟耗时最少的参数组合,提高了MCNP计算效率。结果如下:超线程模式下的并行计算、*F6记数方法、栅元边长为1 cm、γ输运模式、γ截断能为100 ke V。 展开更多
关键词 单板钴源辐照装置 吸收剂量率 MCNP 计算效率
原文传递
MCNP-4C多粒子输运蒙特卡罗程序的MPI并行化 被引量:2
15
作者 邓力 张文勇 《数值计算与计算机应用》 CSCD 2006年第1期52-59,共8页
三维连续截面多粒子输运蒙特卡罗程序MCNP-4C-经过MPI并行改造,实现了MPI 并行化.采用分段随机数发生器,并行取得了与串行完全一致的结果,500个处理器的计算速度较串行提高了460倍,并行效率达到92%,可计算包括临界在内的多粒子输运问题.
关键词 粒子输运 蒙特卡罗 MPI并行化 分段随机数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部