期刊文献+
共找到417篇文章
< 1 2 21 >
每页显示 20 50 100
面向对象方法在SPEEDUP中的应用
1
作者 陈捷 徐亦方 +2 位作者 沈复 陈志奎 王丙申 《炼油设计》 1997年第5期51-55,共5页
SPEEDUP是目前唯一采用面向方程法进行动态模拟的商品化软件,该软件也可对化工过程进行稳态模拟以及优化分析,是一个非常有前途的软件,但该软件使用起来很不方便,主要原因是输入困难。本文首次采用面向对象的方法在OOME(面向对象... SPEEDUP是目前唯一采用面向方程法进行动态模拟的商品化软件,该软件也可对化工过程进行稳态模拟以及优化分析,是一个非常有前途的软件,但该软件使用起来很不方便,主要原因是输入困难。本文首次采用面向对象的方法在OOME(面向对象建模环境)下,为生成SPEEDUP的输入文件和建立新模型提供了一个很方便的接口,这可以促进SPEEDUP软件在我国的推广使用,为在线优化、控制提供良好的工具。结果表明,采用面向对象方法不仅程序层次清晰,而且复用度可比传统方法提高2-3倍。 展开更多
关键词 面向对象 模拟仿真 speedup 化工过程
下载PDF
SPEEDUP指标的适用性分析
2
作者 刘德才 王鼎兴 +1 位作者 沈美明 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 1995年第5期52-56,共5页
长期以来,speeduP一直被视为衡量并行处理性能的主要指标之一。不论是并行计算机系统的设计者,还是并行算法的设计者,均非常重视speedup指标。那么,speedup能否像人们想象的那样正确地描述并行处理的性能呢?... 长期以来,speeduP一直被视为衡量并行处理性能的主要指标之一。不论是并行计算机系统的设计者,还是并行算法的设计者,均非常重视speedup指标。那么,speedup能否像人们想象的那样正确地描述并行处理的性能呢?迄今为止,人们对这一问题尚缺乏认识。本文从speedup的定义出发,结合实例,全面分析了speedup度量并行处理的性能所存在的问题以及可能导致的错误,还讨论了speedup的适应条件。 展开更多
关键词 并行处理 性能评价 并行计算机
下载PDF
Achieving 100% Throughput for Integrated Uni- and Multicast Traffic without Speedup
3
作者 Fulong Yan Qingxu Xiong +1 位作者 Han Xiao Jiacheng Liang 《International Journal of Communications, Network and System Sciences》 2017年第5期35-42,共8页
Along with the unbounded speedup and exponential growth of virtual queues requirement aiming for 100% throughput of multicast scheduling as the size of the high-speed switches scale, the issues of low throughput of mu... Along with the unbounded speedup and exponential growth of virtual queues requirement aiming for 100% throughput of multicast scheduling as the size of the high-speed switches scale, the issues of low throughput of multicast under non-speedup or fixed crosspoint buffer size is addressed. Inspired by the load balance two-stage Birkhoff-von Neumann architecture that can provide 100% throughput for all kinds of unicast traffic, a novel 3-stage architecture, consisting of the first stage for multicast fan-out splitting, the second stage for load balancing, and the last stage for switching (FSLBS) is proposed. And the dedicated multicast fan-out splitting to unicast (M2U) scheduling algorithm is developed for the first stage, while the scheduling algorithms in the last two stages adopt the periodic permutation matrix. FSLBS can achieve 100% throughput for integrated uni- and multicast traffic without speedup employing the dedicated M2U and periodic permutation matrix scheduling algorithm. The operation is theoretically validated adopting the fluid model. 展开更多
关键词 speedup MULTICAST SWITCH Architecture 100% THROUGHPUT
下载PDF
The Memory-Bounded Speedup Model and Its Impacts in Computing
4
作者 孙贤和 鲁潇阳 《Journal of Computer Science & Technology》 SCIE EI CSCD 2023年第1期64-79,共16页
With the surge of big data applications and the worsening of the memory-wall problem,the memory system,instead of the computing unit,becomes the commonly recognized major concern of computing.However,this“memorycent... With the surge of big data applications and the worsening of the memory-wall problem,the memory system,instead of the computing unit,becomes the commonly recognized major concern of computing.However,this“memorycentric”common understanding has a humble beginning.More than three decades ago,the memory-bounded speedup model is the first model recognizing memory as the bound of computing and provided a general bound of speedup and a computing-memory trade-off formulation.The memory-bounded model was well received even by then.It was immediately introduced in several advanced computer architecture and parallel computing textbooks in the 1990’s as a must-know for scalable computing.These include Prof.Kai Hwang’s book“Scalable Parallel Computing”in which he introduced the memory-bounded speedup model as the Sun-Ni’s Law,parallel with the Amdahl’s Law and the Gustafson’s Law.Through the years,the impacts of this model have grown far beyond parallel processing and into the fundamental of computing.In this article,we revisit the memory-bounded speedup model and discuss its progress and impacts in depth to make a unique contribution to this special issue,to stimulate new solutions for big data applications,and to promote data-centric thinking and rethinking. 展开更多
关键词 memory-bounded speedup scalable computing memory-wall performance modeling and optimization data-centric design
原文传递
Review on the study of entanglement in quantum computation speedup 被引量:35
5
作者 DING ShengChao1,3 & JIN Zhi1,2,1 Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100080,China 2 Academy of Mathematics and Systems Science,Chinese Academy of Sciences,Beijing 100080,China 3 Graduate University of Chinese Academy of Sciences,Beijing 100080,China 《Chinese Science Bulletin》 SCIE EI CAS 2007年第16期2161-2166,共6页
The role the quantum entanglement plays in quantum computation speedup has been widely disputed. Some believe that quantum computation's speedup over classical computation is impossible if entan-glement is absent,... The role the quantum entanglement plays in quantum computation speedup has been widely disputed. Some believe that quantum computation's speedup over classical computation is impossible if entan-glement is absent,while others claim that the presence of entanglement is not a necessary condition for some quantum algorithms. This paper discusses this problem systematically. Simulating quantum computation with classical resources is analyzed and entanglement in known algorithms is reviewed. It is concluded that the presence of entanglement is a necessary but not sufficient condition in the pure state or pseudo-pure state quantum computation speedup. The case with the mixed state remains open. Further work on quantum computation will benefit from the presented results. 展开更多
关键词 量子论 量子纠缠 量子计算 加速 模拟
原文传递
基于混合有限元法的油浸式变压器稳态流-热耦合场并行计算方法 被引量:2
6
作者 刘刚 靳立鹏 +2 位作者 胡万君 刘云鹏 武卫革 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期2259-2269,共11页
针对油浸式变压器2维流-热耦合仿真计算效率低的问题,提出了基于混合有限元法的并行计算方法。首先,在Visual Studio 2019中采用C++语言实现无量纲最小二乘有限元法以及迎风有限元法的串行计算方法。然后,基于图形处理器(graphic proces... 针对油浸式变压器2维流-热耦合仿真计算效率低的问题,提出了基于混合有限元法的并行计算方法。首先,在Visual Studio 2019中采用C++语言实现无量纲最小二乘有限元法以及迎风有限元法的串行计算方法。然后,基于图形处理器(graphic processing unit,GPU)实现流体场的并行计算,针对单分区分匝模型对比分析了不同GPU卡在不同网格条件下的并行计算效率,分析结果表明数据规模越大,GPU卡流处理器越多并行效果越好。其次,基于Intel MKL(Intel math kernel library)函数库结合共享存储并行编程(open multi-processing,OpenMP)实现了2维温度场的并行计算,并对比分析了不同网格数量对并行效率的影响。最后,在此基础上提出了根据不同仿真条件的混合并行计算方法,并应用到大型油浸式变压器绕组模型的2维温升热点分析中。结果表明,相较于串行程序,混合有限元并行计算方法的加速比达到了69.5,实验测试结果进一步验证了并行计算结果的准确性,研究成果为大型油浸式变压器流-热耦合问题的快速计算奠定了基础。 展开更多
关键词 变压器绕组 混合有限元 热点 并行计算 加速比
下载PDF
基于改进连续时间动态系统的模拟SAT求解器 被引量:1
7
作者 赵海军 陈华月 崔梦天 《计算机应用研究》 CSCD 北大核心 2024年第1期200-205,共6页
针对布尔可满足性问题的高效求解进行了研究。首先,通过对k-SAT问题和基于耦合常微分方程形式的确定性连续时间动态系统的分析,提出了一种基于时延信息形式的改进连续时间动态系统方程,以保持集中搜索特性;然后,提出了实现该系统方程的... 针对布尔可满足性问题的高效求解进行了研究。首先,通过对k-SAT问题和基于耦合常微分方程形式的确定性连续时间动态系统的分析,提出了一种基于时延信息形式的改进连续时间动态系统方程,以保持集中搜索特性;然后,提出了实现该系统方程的三个主要组件即信号动态电路、辅助变量电路和数字验证电路的模拟设计。在信号动态电路的设计中,设计了一种获得更高性能、更小面积和更低功耗的模拟硬件形式;在提出的辅助变量电路和数字验证电路的模拟硬件设计中,实现了避免梯度下降搜索陷入无解和确定给定问题的解是否已经找到的目标;同时提出了降低面积和功耗的可替代辅助变量电路的两种设计方案。仿真实验结果表明,提出的新的模拟SAT求解器不仅是有效的,而且相比于单一软件算法实现的SAT求解器和其他硬件类SAT求解器具有更高的加速性能和更低的功耗。 展开更多
关键词 布尔可满足性问题 连续时间动态系统 模拟设计 辅助变量 数字验证 加速性能
下载PDF
A Distributed Ant Colony Optimization Applied in Edge Detection
8
作者 Min Chen 《Journal of Computer and Communications》 2024年第8期161-173,共13页
With the rise of image data and increased complexity of tasks in edge detection, conventional artificial intelligence techniques have been severely impacted. To be able to solve even greater problems of the future, le... With the rise of image data and increased complexity of tasks in edge detection, conventional artificial intelligence techniques have been severely impacted. To be able to solve even greater problems of the future, learning algorithms must maintain high speed and accuracy through economical means. Traditional edge detection approaches cannot detect edges in images in a timely manner due to memory and computational time constraints. In this work, a novel parallelized ant colony optimization technique in a distributed framework provided by the Hadoop/Map-Reduce infrastructure is proposed to improve the edge detection capabilities. Moreover, a filtering technique is applied to reduce the noisy background of images to achieve significant improvement in the accuracy of edge detection. Close examinations of the implementation of the proposed algorithm are discussed and demonstrated through experiments. Results reveal high classification accuracy and significant improvements in speedup, scaleup and sizeup compared to the standard algorithms. 展开更多
关键词 Distributed System Ant Colony Optimization Edge Detection MAPREDUCE speedup
下载PDF
基于多GPU数值框架的流域地表径流过程数值模拟
9
作者 冯新政 张大伟 +1 位作者 徐海卿 鞠琴 《南水北调与水利科技(中英文)》 CAS CSCD 北大核心 2024年第1期48-55,共8页
与传统概念性水文模型相比,二维水动力模型可提供更丰富的流域地表水力要素信息,但是计算耗时太长的问题限制其推广应用,提升二维水动力模型的计算效率成为当前数字孪生流域建设工作中的关键技术难题之一。采用基于Godunov格式的有限体... 与传统概念性水文模型相比,二维水动力模型可提供更丰富的流域地表水力要素信息,但是计算耗时太长的问题限制其推广应用,提升二维水动力模型的计算效率成为当前数字孪生流域建设工作中的关键技术难题之一。采用基于Godunov格式的有限体积法离散完整二维浅水方程组建立模型,通过消息传递接口(message passing interface,MPI)与统一计算设备架构(compute unified device architecture,CUDA)相结合的技术实现了基于多图形处理器(graphics processing unit,GPU)的高性能加速计算,采用理想算例和真实流域算例验证模型具有较好的数值计算精度,其中,理想算例中洪峰的相对误差为0.011%,真实流域算例中洪峰的相对误差为2.98%。选取宝盖寺流域为研究对象,分析不同单元分辨率下模型的加速效果,结果表明:在5、2、1 m分辨率下,使用8张GPU卡计算获得的加速比分别为1.58、3.92、5.77,单元分辨率越高,即单元数越多,多GPU卡的加速效果越明显。基于多GPU的水动力模型加速潜力巨大,可为数字孪生流域建设提供有力技术支撑。 展开更多
关键词 水动力模型 地表径流 多GPU Godunov格式 加速比
下载PDF
并行机器中基于干扰时间的间歇实时任务分区DM调度
10
作者 刘洪标 宋程昊 +3 位作者 王婷煜 姜菁菁 乔磊 杨孟飞 《软件学报》 EI CSCD 北大核心 2024年第11期5306-5318,共13页
间歇实时任务的分区DM(deadline-monotonic)调度是一个经典的研究问题,针对约束截止期间歇任务,提出一种具有更高处理器利用率的多核分区调度算法PDM-FFD(partitioned deadline-monotonic first-fit decrease).在PDM-FFD中,首先将任务... 间歇实时任务的分区DM(deadline-monotonic)调度是一个经典的研究问题,针对约束截止期间歇任务,提出一种具有更高处理器利用率的多核分区调度算法PDM-FFD(partitioned deadline-monotonic first-fit decrease).在PDM-FFD中,首先将任务按照其相对截止期以非递减顺序进行排序,然后采用first-fit策略选择处理器核分配任务,且在各处理器核上采用DM调度策略进行任务调度.最后通过对任务干扰时间的分析,得出一种更为紧凑的可调度性判定方法,并通过该可调度性方法来判定任务的可调度性.证明PDM-FFD的加速因子为3-(3Δ+1)/(m+Δ),时间复杂度为O(n^(2))+O(nm),其中Δ=_(Στj∈τ)C_(j)×u_(j)/D_(max),τ_(j)为任务集τ中的任务,C_(j)为该任务最差执行时间,u_(j)为该任务利用率,D_(max)为τ中的最大相对截止期,n为τ的任务数,m为处理器核数.该加速因子严格小于3-1/m,优于已有多核分区调度算法FBB-FFD.实验表明,PDM-FFD算法在4核处理器上的处理器利用率比其他算法提高了18.5%,且PDM-FFD的性能优势随着处理器核数、任务集利用率和任务数的增加而进一步扩大.由于PDM-FFD算法具有高性能特性,因此该算法可以广泛应用于资源受限的航天器、自动驾驶汽车、工业机器人等典型实时系统中. 展开更多
关键词 间歇实时任务 分区DM(deadline-monotonic)调度 干扰时间 加速因子 资源受限
下载PDF
线云隐私攻击算法的并行加速研究
11
作者 郭宸良 阎少宏 宗晨琪 《计算机工程与科学》 CSCD 北大核心 2024年第4期615-625,共11页
线云定位方法能保护场景隐私,但也存在被隐私攻击算法破解的风险。该攻击算法能从线云恢复近似点云,但其计算效率较低。针对该问题,提出了一种并行优化算法,并对其运行时间和加速比进行了分析。具体来说,分别采用SPMD模式和流水线模式... 线云定位方法能保护场景隐私,但也存在被隐私攻击算法破解的风险。该攻击算法能从线云恢复近似点云,但其计算效率较低。针对该问题,提出了一种并行优化算法,并对其运行时间和加速比进行了分析。具体来说,分别采用SPMD模式和流水线模式实现了CPU多核并行和GPGPU并行。然后,进一步结合数据并行模式实现了异构计算,以达到最高的并行度。实验结果表明,并行优化算法加速比最大为15.11,最小为8.20;相比原算法,并行优化算法的还原点云相对误差控制在原误差的0.4%以内,保证了算法的精度。该研究对线云隐私攻击算法以及其他密度估计问题、不同场景下的线云隐私保护算法等有重要意义和参考价值。 展开更多
关键词 线云隐私安全 异构计算 并行化处理 隐私攻击算法 加速比
下载PDF
一种基于ModelSim的红外图像仿真方法与系统
12
作者 李江辉 《红外技术》 CSCD 北大核心 2024年第7期802-806,共5页
在红外热成像的图像处理算法过程中,传统的算法仿真需要借助Matlab等图形处理工具软件先进行仿真再转化成FPGA处理器中可以运行的算法代码,而Matlab上的运行的语言、实现方式与FPGA硬件上运行的硬件描述语言和实现方式完全不同。导致转... 在红外热成像的图像处理算法过程中,传统的算法仿真需要借助Matlab等图形处理工具软件先进行仿真再转化成FPGA处理器中可以运行的算法代码,而Matlab上的运行的语言、实现方式与FPGA硬件上运行的硬件描述语言和实现方式完全不同。导致转化过程复杂、转化精度损失、开发周期长等。本文提出了一种基于ModelSim仿真工具的红外图像仿真方法与系统,与Matlab等图形处理工具一样,编程写好代码,导入图像仿真后,立即输出图像显示,并能查看中间处理过程中的数据变化情况。并且ModelSim仿真运行的仿真代码可以直接拿到FPGA编译工具中运行,最终部署在硬件板卡上。在工程应用中,转化过程简单,开发效率大大提升。 展开更多
关键词 FPGA MODELSIM 红外热成像 仿真方法 图像处理算法 硬件描述语言 硬件加速
下载PDF
Row Fixation - A Parallel Algorithm for Matrix Computing
13
作者 沈文枫 郁松年 徐炜民 《Advances in Manufacturing》 SCIE CAS 2000年第S1期119-122,共4页
Row fixation is a parallel algorithm based on MPI that can be implemented on high performance computer system. It keeps the characteristics of matrices since row-computations are fixed on different nodes. Therefore t... Row fixation is a parallel algorithm based on MPI that can be implemented on high performance computer system. It keeps the characteristics of matrices since row-computations are fixed on different nodes. Therefore the locality of computation is realized effectively and the acceleration ratio is obtained very well for large scale parallel computations such as solving linear equations using Gaussian reduction method, LU decomposition of matrices and m-th power of matrices. 展开更多
关键词 row fixation MPI SMP augmented matrix speedup ratio
下载PDF
基于GPU并行的重力、重力梯度三维正演快速计算及反演策略 被引量:47
14
作者 陈召曦 孟小红 +1 位作者 郭良辉 刘国峰 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2012年第12期4069-4077,共9页
利用NVIDIA CUDA编程平台,实现了基于GPU并行的重力、重力梯度三维快速正演计算方法.采用当前在重力数据约束反演或联合反演中流行的物性模型(密度大小不同、规则排列的长方体单元)作为地下剖分单元,对任意三维复杂模型体均可用很多物... 利用NVIDIA CUDA编程平台,实现了基于GPU并行的重力、重力梯度三维快速正演计算方法.采用当前在重力数据约束反演或联合反演中流行的物性模型(密度大小不同、规则排列的长方体单元)作为地下剖分单元,对任意三维复杂模型体均可用很多物性模型进行组合近似,利用解析方法计算出所有物性模型在计算点的异常值并累加求和,得到整个模型体在某一计算点引起的重力(或重力梯度)值.针对精细的复杂模型体产生的问题,采用GPU并行计算技术,主要包括线程有效索引与优化的并行归约技术进行高效计算.在显卡型号为NVIDIAQuadro 2000相对于单线程CPU程序,重力和重力梯度Uxx、Uxy正演计算可以分别达到60与50倍的加速.本文还讨论了GPU并行计算在两种反演方法中的策略,为快速三维反演技术提供了借鉴. 展开更多
关键词 GPU CUDA 正演计算 重力 重力梯度 加速比
下载PDF
关于并行计算系统中加速比的研究与分析 被引量:19
15
作者 谢超 麦联叨 +1 位作者 都志辉 马群生 《计算机工程与应用》 CSCD 北大核心 2003年第26期66-68,共3页
着眼于并行计算中的加速比,重点讨论了几种通用的并行系统中的加速比模型,并且就它们各自的优点和不足进行了分析和说明,确立了它们之间的内在联系,最后结合并行系统中存在的其他因素,提出了未来加速比模型需要考虑的问题。
关键词 并行处理 加速比 效率 负载
下载PDF
基于MapReduce的多元线性回归预测模型 被引量:17
16
作者 代亮 许宏科 +2 位作者 陈婷 钱超 梁殿鹏 《计算机应用》 CSCD 北大核心 2014年第7期1862-1866,共5页
针对传统的多元线性回归预测方法处理时间长且受内存限制的特点,对时序样本数据设计了基于MapReduce的并行多元线性回归预测模型。模型由三组MapReduce过程组成,分别求解由历史数据所构成叉积矩阵的特征向量和标准正交特征向量,用来预... 针对传统的多元线性回归预测方法处理时间长且受内存限制的特点,对时序样本数据设计了基于MapReduce的并行多元线性回归预测模型。模型由三组MapReduce过程组成,分别求解由历史数据所构成叉积矩阵的特征向量和标准正交特征向量,用来预测未来参数的特征值和特征向量矩阵和未来时刻回归参数的估计量。设计并实现了实验来验证提出的并行多元线性回归预测模型的有效性。实验结果表明,基于MapReduce的多元线性回归预测模型具有较好的加速比和可扩展性,适合于大规模时序数据的分析和预测。 展开更多
关键词 MAPREDUCE 多元线性回归 预测模型 加速比 可扩展性
下载PDF
大规模问题数据并行性能的分析 被引量:14
17
作者 舒继武 est4.cs.tsinghua.edu.cn +2 位作者 郑纬民 沈美明 汪东升 《软件学报》 EI CSCD 北大核心 2000年第5期628-633,共6页
从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 ... 从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 .最后 ,给出的例子证明了模型的有效性 . 展开更多
关键词 数据并行 并行处理 性能分析 加速比
下载PDF
基于OpenMP的三维显式物质点法并行化研究 被引量:14
18
作者 黄鹏 张雄 +1 位作者 马上 王汉奎 《计算力学学报》 EI CAS CSCD 北大核心 2010年第1期21-27,共7页
基于OpenMP技术开发了三维显式物质点并行程序MPM3DMP。为了避免节点更新阶段的数据竞争,采用区域分解法将背景网格分解为均匀的子域,每个线程负责一个子域的节点变量更新,然后将更新后的节点变量装配到整体。在质点更新阶段采用了循环... 基于OpenMP技术开发了三维显式物质点并行程序MPM3DMP。为了避免节点更新阶段的数据竞争,采用区域分解法将背景网格分解为均匀的子域,每个线程负责一个子域的节点变量更新,然后将更新后的节点变量装配到整体。在质点更新阶段采用了循环分解方法进行并行。针对Taylor杆碰撞的三种计算模型,在双Intel Woodcrest 4核CPU服务器下进行了测试:粗模型在4核下加速比为3.82,在8核下为6.23,中模型在4核下加速比为3.79,在8核下加速比为6.23;细模型在4核下加速比为3.75,8核下加速比为6.26。因此,本文的并行程序具有较好的并行效率和可扩展性。 展开更多
关键词 OPENMP 显式物质点法 区域分解法 循环分解方法 加速比
下载PDF
计算机体系结构模拟器技术和发展 被引量:12
19
作者 许建卫 陈明宇 +4 位作者 杨伟 潘晓雷 郑规 赵健博 孙凝晖 《系统仿真学报》 CAS CSCD 北大核心 2009年第20期6325-6331,共7页
对计算机体系结构模拟器的技术和发展历程进行评述,从速度、精度和灵活性三个方面对领域需求和相关技术做了分类总结,分析了上述三个方面的难点并从模拟器实现和使用两个层面介绍了现有的解决方案;给出了模拟器目前面临的困境及下一步... 对计算机体系结构模拟器的技术和发展历程进行评述,从速度、精度和灵活性三个方面对领域需求和相关技术做了分类总结,分析了上述三个方面的难点并从模拟器实现和使用两个层面介绍了现有的解决方案;给出了模拟器目前面临的困境及下一步发展趋势;对体系结构模拟器的开发和使用给出几点建议。 展开更多
关键词 体系结构 模拟器 加速技术 大规模模拟
下载PDF
城市二维内涝模型的GPU并行方法 被引量:19
20
作者 向小华 陈颖悟 +3 位作者 吴晓玲 李超 王志伟 康爱卿 《河海大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第6期528-533,共6页
针对二维水动力模型应用于城市内涝模拟时,在大尺度区域或精细分辨率情形下运行耗时过长的问题,通过耦合SWMM模型和LISFLOOD-FP模型构建城市内涝模型,采用GPU的并行计算技术加速城市二维内涝模型。以盐城响水县城区的内涝模拟为例,对并... 针对二维水动力模型应用于城市内涝模拟时,在大尺度区域或精细分辨率情形下运行耗时过长的问题,通过耦合SWMM模型和LISFLOOD-FP模型构建城市内涝模型,采用GPU的并行计算技术加速城市二维内涝模型。以盐城响水县城区的内涝模拟为例,对并行模型的效率进行分析,结果表明,基于GPU的并行计算技术可以显著提升模型运行效率,在5 m分辨率下能够8 min内模拟12 h的内涝事件,可用于突发内涝事件下的快速响应;并行模型的加速效果在更高的空间分辨率下表现更明显,在2 m分辨率下取得最高10.86倍的加速比;要最大化发挥GPU计算效率,首先需要单步长有较大的计算量,其次是要尽量减少与GPU的数据频繁传输导致的额外开销。 展开更多
关键词 城市二维内涝模型 GPU加速 CUDA 加速比 网格分辨率
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部