期刊文献+
共找到413篇文章
< 1 2 21 >
每页显示 20 50 100
基于混合有限元法的油浸式变压器稳态流-热耦合场并行计算方法
1
作者 刘刚 靳立鹏 +2 位作者 胡万君 刘云鹏 武卫革 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期2259-2269,共11页
针对油浸式变压器2维流-热耦合仿真计算效率低的问题,提出了基于混合有限元法的并行计算方法。首先,在Visual Studio 2019中采用C++语言实现无量纲最小二乘有限元法以及迎风有限元法的串行计算方法。然后,基于图形处理器(graphic proces... 针对油浸式变压器2维流-热耦合仿真计算效率低的问题,提出了基于混合有限元法的并行计算方法。首先,在Visual Studio 2019中采用C++语言实现无量纲最小二乘有限元法以及迎风有限元法的串行计算方法。然后,基于图形处理器(graphic processing unit,GPU)实现流体场的并行计算,针对单分区分匝模型对比分析了不同GPU卡在不同网格条件下的并行计算效率,分析结果表明数据规模越大,GPU卡流处理器越多并行效果越好。其次,基于Intel MKL(Intel math kernel library)函数库结合共享存储并行编程(open multi-processing,OpenMP)实现了2维温度场的并行计算,并对比分析了不同网格数量对并行效率的影响。最后,在此基础上提出了根据不同仿真条件的混合并行计算方法,并应用到大型油浸式变压器绕组模型的2维温升热点分析中。结果表明,相较于串行程序,混合有限元并行计算方法的加速比达到了69.5,实验测试结果进一步验证了并行计算结果的准确性,研究成果为大型油浸式变压器流-热耦合问题的快速计算奠定了基础。 展开更多
关键词 变压器绕组 混合有限元 热点 并行计算 加速比
下载PDF
基于改进连续时间动态系统的模拟SAT求解器
2
作者 赵海军 陈华月 崔梦天 《计算机应用研究》 CSCD 北大核心 2024年第1期200-205,共6页
针对布尔可满足性问题的高效求解进行了研究。首先,通过对k-SAT问题和基于耦合常微分方程形式的确定性连续时间动态系统的分析,提出了一种基于时延信息形式的改进连续时间动态系统方程,以保持集中搜索特性;然后,提出了实现该系统方程的... 针对布尔可满足性问题的高效求解进行了研究。首先,通过对k-SAT问题和基于耦合常微分方程形式的确定性连续时间动态系统的分析,提出了一种基于时延信息形式的改进连续时间动态系统方程,以保持集中搜索特性;然后,提出了实现该系统方程的三个主要组件即信号动态电路、辅助变量电路和数字验证电路的模拟设计。在信号动态电路的设计中,设计了一种获得更高性能、更小面积和更低功耗的模拟硬件形式;在提出的辅助变量电路和数字验证电路的模拟硬件设计中,实现了避免梯度下降搜索陷入无解和确定给定问题的解是否已经找到的目标;同时提出了降低面积和功耗的可替代辅助变量电路的两种设计方案。仿真实验结果表明,提出的新的模拟SAT求解器不仅是有效的,而且相比于单一软件算法实现的SAT求解器和其他硬件类SAT求解器具有更高的加速性能和更低的功耗。 展开更多
关键词 布尔可满足性问题 连续时间动态系统 模拟设计 辅助变量 数字验证 加速性能
下载PDF
基于多GPU数值框架的流域地表径流过程数值模拟
3
作者 冯新政 张大伟 +1 位作者 徐海卿 鞠琴 《南水北调与水利科技(中英文)》 CAS CSCD 北大核心 2024年第1期48-55,共8页
与传统概念性水文模型相比,二维水动力模型可提供更丰富的流域地表水力要素信息,但是计算耗时太长的问题限制其推广应用,提升二维水动力模型的计算效率成为当前数字孪生流域建设工作中的关键技术难题之一。采用基于Godunov格式的有限体... 与传统概念性水文模型相比,二维水动力模型可提供更丰富的流域地表水力要素信息,但是计算耗时太长的问题限制其推广应用,提升二维水动力模型的计算效率成为当前数字孪生流域建设工作中的关键技术难题之一。采用基于Godunov格式的有限体积法离散完整二维浅水方程组建立模型,通过消息传递接口(message passing interface,MPI)与统一计算设备架构(compute unified device architecture,CUDA)相结合的技术实现了基于多图形处理器(graphics processing unit,GPU)的高性能加速计算,采用理想算例和真实流域算例验证模型具有较好的数值计算精度,其中,理想算例中洪峰的相对误差为0.011%,真实流域算例中洪峰的相对误差为2.98%。选取宝盖寺流域为研究对象,分析不同单元分辨率下模型的加速效果,结果表明:在5、2、1 m分辨率下,使用8张GPU卡计算获得的加速比分别为1.58、3.92、5.77,单元分辨率越高,即单元数越多,多GPU卡的加速效果越明显。基于多GPU的水动力模型加速潜力巨大,可为数字孪生流域建设提供有力技术支撑。 展开更多
关键词 水动力模型 地表径流 多GPU Godunov格式 加速比
下载PDF
SPEEDUP指标的适用性分析
4
作者 刘德才 王鼎兴 +1 位作者 沈美明 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 1995年第5期52-56,共5页
长期以来,speeduP一直被视为衡量并行处理性能的主要指标之一。不论是并行计算机系统的设计者,还是并行算法的设计者,均非常重视speedup指标。那么,speedup能否像人们想象的那样正确地描述并行处理的性能呢?... 长期以来,speeduP一直被视为衡量并行处理性能的主要指标之一。不论是并行计算机系统的设计者,还是并行算法的设计者,均非常重视speedup指标。那么,speedup能否像人们想象的那样正确地描述并行处理的性能呢?迄今为止,人们对这一问题尚缺乏认识。本文从speedup的定义出发,结合实例,全面分析了speedup度量并行处理的性能所存在的问题以及可能导致的错误,还讨论了speedup的适应条件。 展开更多
关键词 并行处理 性能评价 并行计算机
下载PDF
线云隐私攻击算法的并行加速研究
5
作者 郭宸良 阎少宏 宗晨琪 《计算机工程与科学》 CSCD 北大核心 2024年第4期615-625,共11页
线云定位方法能保护场景隐私,但也存在被隐私攻击算法破解的风险。该攻击算法能从线云恢复近似点云,但其计算效率较低。针对该问题,提出了一种并行优化算法,并对其运行时间和加速比进行了分析。具体来说,分别采用SPMD模式和流水线模式... 线云定位方法能保护场景隐私,但也存在被隐私攻击算法破解的风险。该攻击算法能从线云恢复近似点云,但其计算效率较低。针对该问题,提出了一种并行优化算法,并对其运行时间和加速比进行了分析。具体来说,分别采用SPMD模式和流水线模式实现了CPU多核并行和GPGPU并行。然后,进一步结合数据并行模式实现了异构计算,以达到最高的并行度。实验结果表明,并行优化算法加速比最大为15.11,最小为8.20;相比原算法,并行优化算法的还原点云相对误差控制在原误差的0.4%以内,保证了算法的精度。该研究对线云隐私攻击算法以及其他密度估计问题、不同场景下的线云隐私保护算法等有重要意义和参考价值。 展开更多
关键词 线云隐私安全 异构计算 并行化处理 隐私攻击算法 加速比
下载PDF
面向对象方法在SPEEDUP中的应用
6
作者 陈捷 徐亦方 +2 位作者 沈复 陈志奎 王丙申 《炼油设计》 1997年第5期51-55,共5页
SPEEDUP是目前唯一采用面向方程法进行动态模拟的商品化软件,该软件也可对化工过程进行稳态模拟以及优化分析,是一个非常有前途的软件,但该软件使用起来很不方便,主要原因是输入困难。本文首次采用面向对象的方法在OOME(面向对象... SPEEDUP是目前唯一采用面向方程法进行动态模拟的商品化软件,该软件也可对化工过程进行稳态模拟以及优化分析,是一个非常有前途的软件,但该软件使用起来很不方便,主要原因是输入困难。本文首次采用面向对象的方法在OOME(面向对象建模环境)下,为生成SPEEDUP的输入文件和建立新模型提供了一个很方便的接口,这可以促进SPEEDUP软件在我国的推广使用,为在线优化、控制提供良好的工具。结果表明,采用面向对象方法不仅程序层次清晰,而且复用度可比传统方法提高2-3倍。 展开更多
关键词 面向对象 模拟仿真 speedup 化工过程
下载PDF
Achieving 100% Throughput for Integrated Uni- and Multicast Traffic without Speedup
7
作者 Fulong Yan Qingxu Xiong +1 位作者 Han Xiao Jiacheng Liang 《International Journal of Communications, Network and System Sciences》 2017年第5期35-42,共8页
Along with the unbounded speedup and exponential growth of virtual queues requirement aiming for 100% throughput of multicast scheduling as the size of the high-speed switches scale, the issues of low throughput of mu... Along with the unbounded speedup and exponential growth of virtual queues requirement aiming for 100% throughput of multicast scheduling as the size of the high-speed switches scale, the issues of low throughput of multicast under non-speedup or fixed crosspoint buffer size is addressed. Inspired by the load balance two-stage Birkhoff-von Neumann architecture that can provide 100% throughput for all kinds of unicast traffic, a novel 3-stage architecture, consisting of the first stage for multicast fan-out splitting, the second stage for load balancing, and the last stage for switching (FSLBS) is proposed. And the dedicated multicast fan-out splitting to unicast (M2U) scheduling algorithm is developed for the first stage, while the scheduling algorithms in the last two stages adopt the periodic permutation matrix. FSLBS can achieve 100% throughput for integrated uni- and multicast traffic without speedup employing the dedicated M2U and periodic permutation matrix scheduling algorithm. The operation is theoretically validated adopting the fluid model. 展开更多
关键词 speedup MULTICAST SWITCH Architecture 100% THROUGHPUT
下载PDF
基于粒子滤波的室内机器人定位加速收敛算法 被引量:1
8
作者 徐阳扬 陈明 +1 位作者 赵艳 杨科锋 《电子设计工程》 2023年第14期6-11,共6页
针对现有粒子滤波算法的缺陷,设计了一种改进的粒子滤波算法。该算法通过改善重采样环节,采用随机移动粒子并向目标区域聚集的方案来解决现有算法的粒子退化问题和粒子多样性丢失问题。在正常行走时,它能够通过粒子加速聚集来实现较快... 针对现有粒子滤波算法的缺陷,设计了一种改进的粒子滤波算法。该算法通过改善重采样环节,采用随机移动粒子并向目标区域聚集的方案来解决现有算法的粒子退化问题和粒子多样性丢失问题。在正常行走时,它能够通过粒子加速聚集来实现较快的定位收敛。在面临“机器人劫持”问题时,通过粒子群反向扩散的方式来实现机器人的重定位,表现出了很好的鲁棒性和收敛速度。该算法经过仿真和实验测试,结果与预期相符。 展开更多
关键词 室内定位 移动机器人 粒子滤波 加速收敛
下载PDF
基于向量化的BESO方法灵敏度过滤快速算法 被引量:1
9
作者 包世鹏 宋旭明 唐冕 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2023年第5期1810-1820,共11页
在使用双向渐进式拓扑优化算法(BESO)时,优化结果中常会出现棋盘格和网格依赖的现象。单元灵敏度过滤器是解决此类问题的有效方法,但随着结构规模扩大单元数量增多,计算单元权重因子耗时将十分可观,其原因是计算单元的权重因子数据需进... 在使用双向渐进式拓扑优化算法(BESO)时,优化结果中常会出现棋盘格和网格依赖的现象。单元灵敏度过滤器是解决此类问题的有效方法,但随着结构规模扩大单元数量增多,计算单元权重因子耗时将十分可观,其原因是计算单元的权重因子数据需进行多次循环嵌套,逐一计算单元中心距,串行算法使得计算效率低下。通过结合深度学习训练模型中将数据集进行向量化预处理的思想,对灵敏度过滤计算所需数据进行向量化预处理,并推导了基于向量化的单元灵敏度过滤算法,将逐一的标量运算改进为可并行的矩阵运算。对向量化算法中可能出现的储存空间占用过大的问题,使用稀疏矩阵对储存空间进行优化,提出进一步改进的Sparse算法。通过ABAQUS二次开发实现了改进后的BESO拓扑优化流程,分别使用二维和三维悬臂梁算例进行计算时长验证,结果表明向量化的灵敏度过滤算法的加速比相对于双循环算法最高可达6,Sparse算法的加速比可达8,改进后的算法极大提升了单元权重因子和灵敏度过滤的计算速度。在计算权重因子时,Sparse算法的耗时略高于向量化算法,但在优化总耗时方面,Sparse算法优于向量化算法;当结构规模大单元数过多时,向量化算法可能限于硬件的内存容量无法计算,而Sparse算法则能够正常计算。 展开更多
关键词 向量化 拓扑优化 灵敏度过滤 稀疏矩阵 加速比
下载PDF
涡轮驱动式脉冲射流振动工具研制及特性测试
10
作者 曹权 史怀忠 +4 位作者 杨兆亮 嵇然 徐卫强 尹添石 高飞 《流体机械》 CSCD 北大核心 2023年第3期26-32,41,共8页
为了提升深部硬岩地层钻井的钻速,研制了一种涡轮驱动式脉冲射流振动工具,采用室内试验和现场实验相结合的方法,对盘阀-脉冲射流特性规律、振动载荷以及现场使用情况等进行了研究,确定了盘阀孔数、盘阀孔结构等工具结构参数。研究结果表... 为了提升深部硬岩地层钻井的钻速,研制了一种涡轮驱动式脉冲射流振动工具,采用室内试验和现场实验相结合的方法,对盘阀-脉冲射流特性规律、振动载荷以及现场使用情况等进行了研究,确定了盘阀孔数、盘阀孔结构等工具结构参数。研究结果表明,转子转速与排量呈正相关增长趋势,并在600 r/min时,脉冲频率趋于稳定,且盘阀孔数为3,4,5脉冲发生机构,对应稳定后的脉冲频率为30,40,50 Hz左右;工具压耗和脉动幅值与排量呈正相关趋势,当排量为90 m^(3)/h时,工具所产生的压耗最大为0.62 MPa,最小为0.30 MPa;随盘阀孔数的增加,压耗逐渐增大,振动幅值减小,脉冲频率增大。试制了3孔盘阀式涡轮脉冲振动工具,盘阀孔采用58°圆心角扇形结构设计,其在新蓬321井现场应用试验中应用效果良好,平均机械钻速为15.29 m/h,较邻井钻速提高45.4%。研究结果可为涡轮驱动式脉冲射流振动工具的应用与推广奠定理论基础。 展开更多
关键词 钻井提速 脉冲射流 盘阀 振动冲击
下载PDF
集减振、脉冲和冲击于一体的钻井提速工具设计及仿真 被引量:1
11
作者 刘鹏 《西安石油大学学报(自然科学版)》 CAS 北大核心 2023年第1期120-126,共7页
钻井过程中,为了减少钻柱振动带来的危害,提高破岩效率,节省钻井成本,设计了一种以井下轴向振动作为动力源,同时可实现脉冲射流和轴向冲击的多功能提速工具。其中的减振装置可减少钻柱轴向振动对钻头、钻柱造成的损伤,并作为动力带动中... 钻井过程中,为了减少钻柱振动带来的危害,提高破岩效率,节省钻井成本,设计了一种以井下轴向振动作为动力源,同时可实现脉冲射流和轴向冲击的多功能提速工具。其中的减振装置可减少钻柱轴向振动对钻头、钻柱造成的损伤,并作为动力带动中心轴进行往复运动;中心轴的运动改变了钻井液的过流面积,从而形成了脉冲式射流,加快井底携岩效率,增强水力辅助破岩效果;中心轴带动冲锤给钻头施加周期性的冲击力,实现冲击辅助破岩。通过钻具轴向振动规律的研究,优化工具的结构设计;模拟分析过流面积变化对井底压力的影响,提高脉冲射流压差;建立冲击破岩力学模型,分析不同岩性条件下冲击力与破岩效率的关系,提高冲击破岩效果。该工具结构中易损件极少,结构可靠,满足钻井复杂条件下对工具寿命和强度的要求。 展开更多
关键词 钻柱轴向振动 减振 脉冲射流 冲击 钻井提速工具
下载PDF
并行程序设计课程全过程多途径思政建设方案
12
作者 熊智 蔡玲如 洪秀秀 《高教学刊》 2023年第35期181-184,共4页
并行计算的应用领域越来越广泛,众多计算机类专业都将并行程序设计作为必修课程。依据ACM/IEEE计算课程体系规范,结合国产超级计算机的发展,该文梳理该课程的教学内容和包括思政目标在内的课程目标,进而设计全过程多途径的总体思政方案... 并行计算的应用领域越来越广泛,众多计算机类专业都将并行程序设计作为必修课程。依据ACM/IEEE计算课程体系规范,结合国产超级计算机的发展,该文梳理该课程的教学内容和包括思政目标在内的课程目标,进而设计全过程多途径的总体思政方案。思政元素涵盖所有5个思政目标,且较好地分布在全部5个知识单元中,教学方法和工具均根据各个思政元素的特点量身选择或设计。该文最后论述两个课程思政设计案例供相关课程参考,包括通过引导加速比上限的讨论强调辩证地理解相关规律,以及借助互斥锁的线上实践培养严谨求实的治学态度。 展开更多
关键词 并行程序设计 课程思政 课程目标 加速比 互斥锁
下载PDF
微地形引起的输电线路舞动案例分析 被引量:1
13
作者 董新胜 蔡敏博 +2 位作者 董仲凯 王跃 刘新民 《电工电气》 2023年第9期30-33,37,共5页
输电线路舞动主要由气象、地理、线路结构等因素等造成,其中微地形对风速有重要影响,进而影响到导地线的覆冰及舞动。对处于微地形的某输电线路舞动案例进行了山地风场仿真分析,结果表明附近微地形山丘对该输电线路的风速水平加速比达到... 输电线路舞动主要由气象、地理、线路结构等因素等造成,其中微地形对风速有重要影响,进而影响到导地线的覆冰及舞动。对处于微地形的某输电线路舞动案例进行了山地风场仿真分析,结果表明附近微地形山丘对该输电线路的风速水平加速比达到了1.1,现场勘验发现N5—N6、N6—N7舞动幅值有明显差别,通过对影响舞动的因素分析,表明是由两段档距的大小差异造成的。提出了加装相间间隔棒、增塔缩档的防范措施。 展开更多
关键词 输电线路舞动 微地形 风速 加速比
下载PDF
SM4国密算法的异构可重构计算系统研究
14
作者 王腾腾 柴志雷 《计算机应用研究》 CSCD 北大核心 2023年第9期2826-2831,共6页
随着互联网的数据量呈爆炸式增长,以纯软件方式运行的SM4算法速度慢、CPU占用率高,而基于Verilog/VHDL实现的现场可编程门阵列或专用集成电路存在灵活性差、升级维护困难等问题。为了解决上述问题,提出了一种SM4国密算法的异构可重构计... 随着互联网的数据量呈爆炸式增长,以纯软件方式运行的SM4算法速度慢、CPU占用率高,而基于Verilog/VHDL实现的现场可编程门阵列或专用集成电路存在灵活性差、升级维护困难等问题。为了解决上述问题,提出了一种SM4国密算法的异构可重构计算系统的设计方案,采用高层次综合和异构可重构技术,通过优化数据内存分配与传输、优化循环、矢量化内核以及增加计算单元等方式,设计了SM4算法电子密码本模式和计数器模式的定制计算架构,并将该系统部署在FPGA异构平台。实验结果表明:SM4-ECB和SM4-CTR两种主流工作模式的定制计算架构在Intel Stratix 10 GX2800上,吞吐率分别达到109.48 Gbps和63.73 Gbps,是Intel Xeon E5-2650 V2 CPU上对应模式吞吐率的232.63倍和141.62倍。以此核心模块(包含数据输入、加解密、输出)的整体异构可重构计算系统的性能也分别达到了纯软件方式的4.90倍和3.56倍。该方案不仅实现了针对特定模式进行定制加速,而且可以通过硬件重构灵活支持不同的计算模式,兼顾了系统的灵活性和高效性。 展开更多
关键词 SM4 异构可重构 现场可编程门阵列 国密算法 硬件加速
下载PDF
大规模GNSS网多进程并行解算研究
15
作者 王建伟 程传录 +4 位作者 赵辉 冯在梅 刘晓云 田婕 马润霞 《大地测量与地球动力学》 CSCD 北大核心 2023年第2期148-152,共5页
针对大规模GNSS网常规数据处理时效性差、效率低的问题,基于GAMIT/GLOBK软件,利用进程池技术从多时段与多子网2个维度分别设计共享内存模型数据并行算法,并融合实现大规模GNSS网在时间域和空间域上的时空一体化双层并行解决方案。该方... 针对大规模GNSS网常规数据处理时效性差、效率低的问题,基于GAMIT/GLOBK软件,利用进程池技术从多时段与多子网2个维度分别设计共享内存模型数据并行算法,并融合实现大规模GNSS网在时间域和空间域上的时空一体化双层并行解决方案。该方案可突破软件传统串行处理GNSS数据时效性差、多核计算资源利用率低的限制,在测试环境下最大加速比高达19.39,可充分挖掘计算机算力,大幅提升大规模GNSS网数据处理的时效性。 展开更多
关键词 大规模GNSS网 加速比 进程池 并行计算
下载PDF
一种基于生产者-消费者模型的全波形激光雷达回波波形数据并行处理方法
16
作者 陈瑞强 张瓯 +1 位作者 池晓蘅 涂清松 《中国科技纵横》 2023年第21期21-23,62,共4页
本文介绍一种基于生产者-消费者模型的全波形激光雷达回波波形数据并行处理方法,主要包含一个管理模块和若干个执行模块,通过成对的生产者-消费者管道连接,可以部署在多核心处理器并行执行。建立全波形激光雷达波实验平台,采集回波数据... 本文介绍一种基于生产者-消费者模型的全波形激光雷达回波波形数据并行处理方法,主要包含一个管理模块和若干个执行模块,通过成对的生产者-消费者管道连接,可以部署在多核心处理器并行执行。建立全波形激光雷达波实验平台,采集回波数据集验证并行处理方法的性能。实验结果表明,与串行处理方法相比,当并行处理方法包含两个执行模块时,处理时间加速比为1.8;当并行处理方法包含3个执行模块时,处理时间加速比为2.4。 展开更多
关键词 全波形激光雷达 波形数据 并行处理 生产者-消费者模型 处理时间加速比
下载PDF
基于GPU并行的重力、重力梯度三维正演快速计算及反演策略 被引量:44
17
作者 陈召曦 孟小红 +1 位作者 郭良辉 刘国峰 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2012年第12期4069-4077,共9页
利用NVIDIA CUDA编程平台,实现了基于GPU并行的重力、重力梯度三维快速正演计算方法.采用当前在重力数据约束反演或联合反演中流行的物性模型(密度大小不同、规则排列的长方体单元)作为地下剖分单元,对任意三维复杂模型体均可用很多物... 利用NVIDIA CUDA编程平台,实现了基于GPU并行的重力、重力梯度三维快速正演计算方法.采用当前在重力数据约束反演或联合反演中流行的物性模型(密度大小不同、规则排列的长方体单元)作为地下剖分单元,对任意三维复杂模型体均可用很多物性模型进行组合近似,利用解析方法计算出所有物性模型在计算点的异常值并累加求和,得到整个模型体在某一计算点引起的重力(或重力梯度)值.针对精细的复杂模型体产生的问题,采用GPU并行计算技术,主要包括线程有效索引与优化的并行归约技术进行高效计算.在显卡型号为NVIDIAQuadro 2000相对于单线程CPU程序,重力和重力梯度Uxx、Uxy正演计算可以分别达到60与50倍的加速.本文还讨论了GPU并行计算在两种反演方法中的策略,为快速三维反演技术提供了借鉴. 展开更多
关键词 GPU CUDA 正演计算 重力 重力梯度 加速比
下载PDF
关于并行计算系统中加速比的研究与分析 被引量:19
18
作者 谢超 麦联叨 +1 位作者 都志辉 马群生 《计算机工程与应用》 CSCD 北大核心 2003年第26期66-68,共3页
着眼于并行计算中的加速比,重点讨论了几种通用的并行系统中的加速比模型,并且就它们各自的优点和不足进行了分析和说明,确立了它们之间的内在联系,最后结合并行系统中存在的其他因素,提出了未来加速比模型需要考虑的问题。
关键词 并行处理 加速比 效率 负载
下载PDF
Particle-Mesh Ewald(PME)算法的GPU加速 被引量:5
19
作者 徐骥 葛蔚 +1 位作者 任瑛 李静海 《计算物理》 EI CSCD 北大核心 2010年第4期548-554,共7页
讨论在NVIDIACUDA开发环境下,用GPU加速分子动力学模拟中静电作用的长程受力计算部分.采用Particle-Mesh Ewald(PME)方法,将其分解为参数确定、点电荷网格离散、离散网格的傅立叶变换、静电热能求解与静电力求解5个部分,并分别分析各部... 讨论在NVIDIACUDA开发环境下,用GPU加速分子动力学模拟中静电作用的长程受力计算部分.采用Particle-Mesh Ewald(PME)方法,将其分解为参数确定、点电荷网格离散、离散网格的傅立叶变换、静电热能求解与静电力求解5个部分,并分别分析各部分的GPU实现.此方法已成功用于7个不同大小的生物分子体系的模拟计算,达到了7倍左右的加速.该程序可耦合到现有分子动力学模拟软件中,或作为进一步开发的GPU分子动力学程序的一部分,显著加速传统分子动力学程序. 展开更多
关键词 PME(Particle-Mesh Ewald)加速 GPU(Graphic Processing Unit图形处理单元) CUDA(Compute Unified Device Architecture计算统一设备架构)
下载PDF
大规模问题数据并行性能的分析 被引量:14
20
作者 舒继武 est4.cs.tsinghua.edu.cn +2 位作者 郑纬民 沈美明 汪东升 《软件学报》 EI CSCD 北大核心 2000年第5期628-633,共6页
从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 ... 从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 .最后 ,给出的例子证明了模型的有效性 . 展开更多
关键词 数据并行 并行处理 性能分析 加速比
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部