期刊文献+
共找到87篇文章
< 1 2 5 >
每页显示 20 50 100
Parallel Image Processing: Taking Grayscale Conversion Using OpenMP as an Example
1
作者 Bayan AlHumaidan Shahad Alghofaily +2 位作者 Maitha Al Qhahtani Sara Oudah Naya Nagy 《Journal of Computer and Communications》 2024年第2期1-10,共10页
In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularl... In recent years, the widespread adoption of parallel computing, especially in multi-core processors and high-performance computing environments, ushered in a new era of efficiency and speed. This trend was particularly noteworthy in the field of image processing, which witnessed significant advancements. This parallel computing project explored the field of parallel image processing, with a focus on the grayscale conversion of colorful images. Our approach involved integrating OpenMP into our framework for parallelization to execute a critical image processing task: grayscale conversion. By using OpenMP, we strategically enhanced the overall performance of the conversion process by distributing the workload across multiple threads. The primary objectives of our project revolved around optimizing computation time and improving overall efficiency, particularly in the task of grayscale conversion of colorful images. Utilizing OpenMP for concurrent processing across multiple cores significantly reduced execution times through the effective distribution of tasks among these cores. The speedup values for various image sizes highlighted the efficacy of parallel processing, especially for large images. However, a detailed examination revealed a potential decline in parallelization efficiency with an increasing number of cores. This underscored the importance of a carefully optimized parallelization strategy, considering factors like load balancing and minimizing communication overhead. Despite challenges, the overall scalability and efficiency achieved with parallel image processing underscored OpenMP’s effectiveness in accelerating image manipulation tasks. 展开更多
关键词 parallel Computing Image processing openmp parallel Programming High Performance Computing GPU (Graphic processing Unit)
下载PDF
基于OpenMP的分子动力学并行算法的性能分析与优化 被引量:10
2
作者 白明泽 程丽 +1 位作者 豆育升 孙世新 《计算机应用》 CSCD 北大核心 2012年第1期163-166,共4页
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三... 为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。 展开更多
关键词 分子动力学 并行计算 多核中央处理器 openmp 临界区
下载PDF
平面二维非均匀泥沙OpenMP并行计算模型 被引量:2
3
作者 于守兵 《水利水电科技进展》 CSCD 北大核心 2012年第2期11-14,共4页
为实现平面二维非均匀泥沙模型并行计算,采用OpenMP指令对串行源程序进行改造。基于三角形-四边形混合网格的平面二维非均匀泥沙有限体积模型具有显式求解时网格单元相互独立性这种特性,Fortran串行源程序无需进行较大的修改,只要在循... 为实现平面二维非均匀泥沙模型并行计算,采用OpenMP指令对串行源程序进行改造。基于三角形-四边形混合网格的平面二维非均匀泥沙有限体积模型具有显式求解时网格单元相互独立性这种特性,Fortran串行源程序无需进行较大的修改,只要在循环计算和数组整体操作部分嵌入OpenMP循环并行指令和数组并行指令,即可实现并行计算。案例分析结果表明,在并行线程数目等于计算机固有线程数目时,并行加速比达到最大值1.55;OpenMP技术使用线程间共享内存的方式协调并行计算,很适合在多核计算机上运行,且编程简单灵活,将随着计算机硬件性能的提高得到更广泛的应用。 展开更多
关键词 openmp 并行计算 非均匀泥沙模型 有限体积法
下载PDF
基于MPI+OpenMP混合编程模型的并行声纳信号处理技术研究 被引量:4
4
作者 胡银丰 孔强 《舰船电子工程》 2017年第12期130-133,共4页
针对多核分布式共享存储集群的特点,提出了一种基于MPI+OpenMP混合编程模型的声纳信号处理并行计算技术,该模型结合了消息传递和共享存储两者的优点,为现代声纳信号处理中海量数据的实时处理及复杂算法的实时实现提供了解决方案。
关键词 声纳信号处理 并行计算 MPI openmp
下载PDF
基于OpenMP的流化床颗粒堆积过程三维并行数值模拟
5
作者 李斌 姚路 +1 位作者 焦明月 周遵凯 《热力发电》 CAS 北大核心 2016年第1期42-48,共7页
结合离散单元法(DEM)和计算流体力学(CFD)的CFD-DEM被广泛应用于流化床的数值模拟中,但受DEM计算工作量大的限制,难以达到实际流化床的模拟要求,因此开展对DEM并行算法的研究具有重要意义。针对流化床内颗粒运动的特点,基于DEM建立了气... 结合离散单元法(DEM)和计算流体力学(CFD)的CFD-DEM被广泛应用于流化床的数值模拟中,但受DEM计算工作量大的限制,难以达到实际流化床的模拟要求,因此开展对DEM并行算法的研究具有重要意义。针对流化床内颗粒运动的特点,基于DEM建立了气固两相流动中颗粒相的并行化计算模型,在OpenMP并行技术的基础上,实现了颗粒受力计算、颗粒速度和位置更新的并行化。采用Fortran语言开发了DEM并行数值模拟程序,模拟了三维流化床内颗粒堆积的过程,并与串行程序的模拟结果进行了对比。结果表明:基于OpenMP技术并行程序可正确模拟流化床内的颗粒堆积过程,而且具有良好的加速比,能够显著地提高计算效率、缩短计算时间;当计算线程数增加时,加速比随之增加,但增幅相对减少。 展开更多
关键词 流化床 颗粒堆积 离散单元法 计算流体力学 气固两相流 并行计算 openmp 加速比
下载PDF
MPI+OpenMP算法在三维可压缩流场计算中的应用 被引量:1
6
作者 许啸 王学德 谭俊杰 《航空计算技术》 2011年第6期32-36,共5页
在多核CPU集群并行体系结构下,采用MPI+OpenMP的混合并行算法,对可压缩流场进行数值模拟,并在计算时间上与MPI算法进行比较。流场计算的控制方程为Euler方程,空间离散采用Jameson中心差分格式,时间离散采用R-K法,并行模式采用Master/Sl... 在多核CPU集群并行体系结构下,采用MPI+OpenMP的混合并行算法,对可压缩流场进行数值模拟,并在计算时间上与MPI算法进行比较。流场计算的控制方程为Euler方程,空间离散采用Jameson中心差分格式,时间离散采用R-K法,并行模式采用Master/Slave模式。通过对M6机翼和某弹丸采用多种并行方法进行流场的数值模拟,得出MPI+OpenMP混合算法在一定条件下具有高效性的结论。 展开更多
关键词 有限体积法 并行计算 进程 线程 MPI+openmp混合算法
下载PDF
基于OpenMP的非连续变形分析并行计算方法 被引量:9
7
作者 付晓东 盛谦 张勇慧 《岩土力学》 EI CAS CSCD 北大核心 2014年第8期2401-2407,共7页
非连续变形分析(DDA)方法严格满足平衡要求和能量守恒,具有完全的运动学及数值可靠性,但对大规模岩土工程问题的数值模拟耗时太长,尤其是线性方程组求解,并行计算可以很好地解决该问题。首先基于DDA方法的基本理论,阐述了适用于DDA方法... 非连续变形分析(DDA)方法严格满足平衡要求和能量守恒,具有完全的运动学及数值可靠性,但对大规模岩土工程问题的数值模拟耗时太长,尤其是线性方程组求解,并行计算可以很好地解决该问题。首先基于DDA方法的基本理论,阐述了适用于DDA方法中的基于块的行压缩法和基于"试验-误差"迭代格式的非零位置记录;其次,引入块雅可比迭代法并行求解DDA方法的线性方程组,并改进了相应的非零存储方法;最后,基于OpenMP实现了DDA线性方程组求解并行计算,并将其应用于地下洞室群的破坏过程分析,以加速比为并行效率的指标评价,结果表明,该并行计算策略可以极大提高DDA的计算效率,而且适合各种规模的问题。 展开更多
关键词 岩土工程 非连续变形分析 并行计算 块雅可比迭代法 非零存储
下载PDF
基于OpenMP一维CSAMT正演并行计算研究 被引量:2
8
作者 黄浩 欧东新 《矿产与地质》 2017年第1期138-142,共5页
电偶极子场源在水平层状介质中传播的电磁场的数值解是通过求解含有零阶和一阶贝塞尔函数的积分(汉克尔变换)所得,可控源音频大地电磁法(CSAMT)一维正演计算就是计算各个频率的视电阻率,使用传统串行方式对频点逐一计算,速度相对较慢。... 电偶极子场源在水平层状介质中传播的电磁场的数值解是通过求解含有零阶和一阶贝塞尔函数的积分(汉克尔变换)所得,可控源音频大地电磁法(CSAMT)一维正演计算就是计算各个频率的视电阻率,使用传统串行方式对频点逐一计算,速度相对较慢。本文旨在使用Intel Visual Fortran 2013和VS2012软件,编写基于OpenMP的CSAMT一维正演并行计算程序。与一维CSAMT串行程序的对比:相同的计算量下,并行程序运行时间少于串行运行时间,计算量越大并行加速比越明显;验证了并行程序的可行性,为CSAMT多维复杂模型正演计算提供了并行研究基础。 展开更多
关键词 openmp 可控源音频大地电磁法(CSAMT) 一维正演 并行计算程序
下载PDF
基于OpenMP并行简约空间内点法的暂态稳定紧急控制 被引量:2
9
作者 王云 江全元 《电力自动化设备》 EI CSCD 北大核心 2014年第12期83-88,共6页
电力系统暂态稳定紧急控制问题是一类复杂的非线性动态优化问题,计算效率是其实用化瓶颈所在。利用差分化后紧急控制问题自由度很低的特点,应用简约空间内点算法进行求解。算法在C++环境下编程实现,对关键耗时部分多线程并行计算。算例... 电力系统暂态稳定紧急控制问题是一类复杂的非线性动态优化问题,计算效率是其实用化瓶颈所在。利用差分化后紧急控制问题自由度很低的特点,应用简约空间内点算法进行求解。算法在C++环境下编程实现,对关键耗时部分多线程并行计算。算例测试结果表明,所提并行算法是有效的,且与传统内点算法相比,该算法消耗的计算时间和内存更少,能够求解大规模的电力系统紧急控制问题。 展开更多
关键词 电力系统 暂态 稳定性 控制 简约空间内点法 并行计算 OPEN MP
下载PDF
MPI+OpenMP混合编程在三维电磁辐射计算中的应用
10
作者 唐龙 何冰 张武 《微电子学与计算机》 CSCD 北大核心 2014年第8期127-131,共5页
在多核CPU集群环境下,采用MPI+OpenMP混合算法,实现了FDTD算法电磁场点源辐射数值模拟计算,有效解决了传统的FDTD算法在大数据电磁辐射计算中空间和时间上的不足的问题,并运用区域分割、子区域数据通讯、合并嵌套等方法提高程序的并行性... 在多核CPU集群环境下,采用MPI+OpenMP混合算法,实现了FDTD算法电磁场点源辐射数值模拟计算,有效解决了传统的FDTD算法在大数据电磁辐射计算中空间和时间上的不足的问题,并运用区域分割、子区域数据通讯、合并嵌套等方法提高程序的并行性,最后对计算结果进行正确性验证.通过在上海大学高性能集群上与MPI算法进行性能对比,结果表明,利用MPI+OpenMP获得了较高的加速比,并有效地节省计算资源,加快计算速度. 展开更多
关键词 有限时域差分法 MPI+openmp 电磁辐射计算 并行计算
下载PDF
基于OpenMP的并行空间电磁分布计算 被引量:3
11
作者 邴丕浩 钟立俊 +1 位作者 严少虎 邹钊 《电子信息对抗技术》 2015年第2期75-78,共4页
获得空间电磁场场强分布是电磁频谱管理的重要任务之一,研究如何提高其计算性能以适应快速变化的空间电磁环境具有重要的意义。OpenMP(Open Multi Processing)是一种简单快速提高计算效率的方式,它有助于CPU多核资源被充分利用。提出了... 获得空间电磁场场强分布是电磁频谱管理的重要任务之一,研究如何提高其计算性能以适应快速变化的空间电磁环境具有重要的意义。OpenMP(Open Multi Processing)是一种简单快速提高计算效率的方式,它有助于CPU多核资源被充分利用。提出了一种基于Open MP的并行获得空间电磁场场强分布方法,通过合理分析计算过程,设计相应并行方案,使得设计的并行算法适合CPU多核处理方式,并行度高。大量实验结果表明,该并行算法明显提高了计算效率,且具有高可扩展性。 展开更多
关键词 多核 openmp 电磁分布 并行计算 高效 可扩展性
下载PDF
基于OpenMP的中子输运方程特征线法并行计算研究
12
作者 于锐 赵强 《原子能科学技术》 EI CAS CSCD 北大核心 2015年第10期1833-1838,共6页
特征线法是目前求解反应堆中子输运方程的主要计算方法之一。本文开发了基于OpenMP的中子输运方程特征线法并行计算程序,以提高特征线法的计算效率。OpenMP是共享存储体系结构上的一个并行编程模型,采用Fork-Join并行执行方式,适合于SM... 特征线法是目前求解反应堆中子输运方程的主要计算方法之一。本文开发了基于OpenMP的中子输运方程特征线法并行计算程序,以提高特征线法的计算效率。OpenMP是共享存储体系结构上的一个并行编程模型,采用Fork-Join并行执行方式,适合于SMP共享内存多处理系统和多核处理器体系结构。通过相关基准题测试验证,表明所开发的程序在有效增殖因数以及相对中子通量(归一化栅元功率)分布等参数上都能取得良好的精度,且使用OpenMP能取得良好的加速效果,使计算时间显著减少。 展开更多
关键词 中子输运方程 特征线法 openmp 并行计算
下载PDF
A PARALLEL COMPUTATION SCHEME FOR IMPLICIT RUNGE-KUTTA METHODS AND THE ITERATIVELY B-CONVERGENCE OF ITS NEWTON ITERATIVE PROCESS
13
作者 赵双锁 王昌银 《Numerical Mathematics A Journal of Chinese Universities(English Series)》 SCIE 1994年第1期54-66,共13页
In this paper, based on the implicit Runge-Kutta(IRK) methods, we derive a class of parallel scheme that can be implemented on the parallel computers with Ns(N is a positive even number) processors efficiently, and di... In this paper, based on the implicit Runge-Kutta(IRK) methods, we derive a class of parallel scheme that can be implemented on the parallel computers with Ns(N is a positive even number) processors efficiently, and discuss the iteratively B-convergence of the Newton iterative process for solving the algebraic equations of the scheme, secondly we present a strategy providing initial values parallelly for the iterative process. Finally, some numerical results show that our parallel scheme is higher efficient as N is not so large. 展开更多
关键词 IMPLICIT Range-Kutta methods NEWTON ITERATIVE process parallel COMPUTATION iteratively B-CONVERGENCE
下载PDF
用OpenMP实现三维复杂渗流场的并行计算 被引量:7
14
作者 付俊峰 金生 《工程力学》 EI CSCD 北大核心 2009年第12期216-221,共6页
建立了有自由面的三维渗流饱和-非饱和计算模型,该模型包含水头和饱和度两个变量,用二维、三维结果的对比证明了模型的合理性与准确性。通过分析数据执行时的相关性,算法结构的固有串行性及有限元计算的耗时分布,利用OpenMP并行编程接口... 建立了有自由面的三维渗流饱和-非饱和计算模型,该模型包含水头和饱和度两个变量,用二维、三维结果的对比证明了模型的合理性与准确性。通过分析数据执行时的相关性,算法结构的固有串行性及有限元计算的耗时分布,利用OpenMP并行编程接口,实现了渗流求解的并行化。对不同规模的问题进行了并行数值模拟并测定了加速比,通过分析可知加速比与处理器的个数呈线性分布,并且随着问题规模的增加而逐渐提高。 展开更多
关键词 三维渗流 并行计算 openmp 有限元 数值模拟
原文传递
一种中心型有限体积孔隙–裂隙渗流求解方法及其OpenMP并行化 被引量:5
15
作者 王理想 李世海 +1 位作者 马照松 冯春 《岩石力学与工程学报》 EI CAS CSCD 北大核心 2015年第5期865-875,共11页
为高效求解单相孔隙–裂隙渗流问题,发展一种基于任意网格的三维中心型有限体积渗流求解算法,并对其进行OpenMP并行化。该算法将压力置于单元中心处;使用串联弹簧模型在空间域离散;使用显式差分格式在时间域离散;使用动态松弛求解技术,... 为高效求解单相孔隙–裂隙渗流问题,发展一种基于任意网格的三维中心型有限体积渗流求解算法,并对其进行OpenMP并行化。该算法将压力置于单元中心处;使用串联弹簧模型在空间域离散;使用显式差分格式在时间域离散;使用动态松弛求解技术,逐个单元求解。算例研究表明,该算法与有限元相比具有类似的精度,但求解效率更高。OpenMP并行化使得该算法运算速度在CPUi7–3770上可提高至4.0倍,在CPUi7–4770上可提高至4.2倍;两台机器上的并行效率均高达50%以上。 展开更多
关键词 计算数学 三维中心型有限体积法 单相孔隙–裂隙耦合渗流 动态松弛技术 openmp并行 离散裂隙网络
原文传递
Parallel Iterative FEM Solver with Initial Guess for Frequency Domain Electromagnetic Analysis
16
作者 Woochan Lee Woobin Park +2 位作者 Jaeyoung Park Young-Joon Kim Moonseong Kim 《Intelligent Automation & Soft Computing》 SCIE 2023年第5期1585-1602,共18页
The finite element method is a key player in computational electromag-netics for designing RF(Radio Frequency)components such as waveguides.The frequency-domain analysis is fundamental to identify the characteristics ... The finite element method is a key player in computational electromag-netics for designing RF(Radio Frequency)components such as waveguides.The frequency-domain analysis is fundamental to identify the characteristics of the components.For the conventional frequency-domain electromagnetic analysis using FEM(Finite Element Method),the system matrix is complex-numbered as well as indefinite.The iterative solvers can be faster than the direct solver when the solver convergence is guaranteed and done in a few steps.However,such complex-numbered and indefinite systems are hard to exploit the merit of the iterative solver.It is also hard to benefit from matrix factorization techniques due to varying system matrix parts according to frequency.Overall,it is hard to adopt conventional iterative solvers even though the system matrix is sparse.A new parallel iterative FEM solver for frequency domain analysis is implemented for inhomogeneous waveguide structures in this paper.In this implementation,the previous solution of the iterative solver of Matlab(Matrix Laboratory)employ-ing the preconditioner is used for the initial guess for the next step’s solution process.The overlapped parallel stage using Matlab’s Parallel Computing Toolbox is also proposed to alleviate the cold starting,which ruins the convergence of early steps in each parallel stage.Numerical experiments based on waveguide structures have demonstrated the accuracy and efficiency of the proposed scheme. 展开更多
关键词 computational electromagnetics numerical simulation finite element method parallel processing iterative solvers
下载PDF
A GPU-Based Parallel Algorithm for 2D Large Deformation Contact Problems Using the Finite Particle Method 被引量:1
17
作者 Wei Wang Yanfeng Zheng +2 位作者 Jingzhe Tang Chao Yang Yaozhi Luo 《Computer Modeling in Engineering & Sciences》 SCIE EI 2021年第11期595-626,共32页
Large deformation contact problems generally involve highly nonlinear behaviors,which are very time-consuming and may lead to convergence issues.The finite particle method(FPM)effectively separates pure deformation fr... Large deformation contact problems generally involve highly nonlinear behaviors,which are very time-consuming and may lead to convergence issues.The finite particle method(FPM)effectively separates pure deformation from total motion in large deformation problems.In addition,the decoupled procedures of the FPM make it suitable for parallel computing,which may provide an approach to solve time-consuming issues.In this study,a graphics processing unit(GPU)-based parallel algorithm is proposed for two-dimensional large deformation contact problems.The fundamentals of the FPM for planar solids are first briefly introduced,including the equations of motion of particles and the internal forces of quadrilateral elements.Subsequently,a linked-list data structure suitable for parallel processing is built,and parallel global and local search algorithms are presented for contact detection.The contact forces are then derived and directly exerted on particles.The proposed method is implemented with main solution procedures executed in parallel on a GPU.Two verification problems comprising large deformation frictional contacts are presented,and the accuracy of the proposed algorithm is validated.Furthermore,the algorithm’s performance is investigated via a large-scale contact problem,and the maximum speedups of total computational time and contact calculation reach 28.5 and 77.4,respectively,relative to commercial finite element software Abaqus/Explicit running on a single-core central processing unit(CPU).The contact calculation time percentage of the total calculation time is only 18%with the FPM,much smaller than that(50%)with Abaqus/Explicit,demonstrating the efficiency of the proposed method. 展开更多
关键词 Finite particle method graphics processing unit(GPU) parallel computing contact algorithm LARGE
下载PDF
Fast modeling of gravity gradients from topographic surface data using GPU parallel algorithm 被引量:1
18
作者 Xuli Tan Qingbin Wang +2 位作者 Jinkai Feng Yan Huang Ziyan Huang 《Geodesy and Geodynamics》 CSCD 2021年第4期288-297,共10页
The gravity gradient is a secondary derivative of gravity potential,containing more high-frequency information of Earth’s gravity field.Gravity gradient observation data require deducting its prior and intrinsic part... The gravity gradient is a secondary derivative of gravity potential,containing more high-frequency information of Earth’s gravity field.Gravity gradient observation data require deducting its prior and intrinsic parts to obtain more variational information.A model generated from a topographic surface database is more appropriate to represent gradiometric effects derived from near-surface mass,as other kinds of data can hardly reach the spatial resolution requirement.The rectangle prism method,namely an analytic integration of Newtonian potential integrals,is a reliable and commonly used approach to modeling gravity gradient,whereas its computing efficiency is extremely low.A modified rectangle prism method and a graphical processing unit(GPU)parallel algorithm were proposed to speed up the modeling process.The modified method avoided massive redundant computations by deforming formulas according to the symmetries of prisms’integral regions,and the proposed algorithm parallelized this method’s computing process.The parallel algorithm was compared with a conventional serial algorithm using 100 elevation data in two topographic areas(rough and moderate terrain).Modeling differences between the two algorithms were less than 0.1 E,which is attributed to precision differences between single-precision and double-precision float numbers.The parallel algorithm showed computational efficiency approximately 200 times higher than the serial algorithm in experiments,demonstrating its effective speeding up in the modeling process.Further analysis indicates that both the modified method and computational parallelism through GPU contributed to the proposed algorithm’s performances in experiments. 展开更多
关键词 Gravity gradient Topographic surface data Rectangle prism method parallel computation Graphical processing unit(GPU)
下载PDF
Compute Unified Device Architecture Implementation of Euler/Navier-Stokes Solver on Graphics Processing Unit Desktop Platform for 2-D Compressible Flows
19
作者 Zhang Jiale Chen Hongquan 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2016年第5期536-545,共10页
Personal desktop platform with teraflops peak performance of thousands of cores is realized at the price of conventional workstations using the programmable graphics processing units(GPUs).A GPU-based parallel Euler/N... Personal desktop platform with teraflops peak performance of thousands of cores is realized at the price of conventional workstations using the programmable graphics processing units(GPUs).A GPU-based parallel Euler/Navier-Stokes solver is developed for 2-D compressible flows by using NVIDIA′s Compute Unified Device Architecture(CUDA)programming model in CUDA Fortran programming language.The techniques of implementation of CUDA kernels,double-layered thread hierarchy and variety memory hierarchy are presented to form the GPU-based algorithm of Euler/Navier-Stokes equations.The resulting parallel solver is validated by a set of typical test flow cases.The numerical results show that dozens of times speedup relative to a serial CPU implementation can be achieved using a single GPU desktop platform,which demonstrates that a GPU desktop can serve as a costeffective parallel computing platform to accelerate computational fluid dynamics(CFD)simulations substantially. 展开更多
关键词 graphics processing unit(GPU) GPU parallel computing compute unified device architecture(CUDA)Fortran finite volume method(FVM) acceleration
下载PDF
基于图形处理器的水下目标传递函数多频点处理方法
20
作者 钱浩然 王斌 《舰船科学技术》 北大核心 2024年第14期153-157,共5页
为了提高水下目标宽带回波的计算速度,本文提出一种基于图形处理器GPU的散射传递函数多频点快速计算解决方案。相较于传统算法中逐个频率点计算的方式,CUDA快速算法充分利用各频点处目标强度的相对独立性,基于GPU的硬件特点,同时计算宽... 为了提高水下目标宽带回波的计算速度,本文提出一种基于图形处理器GPU的散射传递函数多频点快速计算解决方案。相较于传统算法中逐个频率点计算的方式,CUDA快速算法充分利用各频点处目标强度的相对独立性,基于GPU的硬件特点,同时计算宽带内的散射声场,从而显著提高了计算效率。本文以潜航器模型为算例,对不同网格数量下模型的目标散射传递函数计算速度进行对比分析。仿真结果表明,相较于传统的CPU串行计算,采用CUDA快速算法能够实现超过80的加速比,有效提高了计算速度。 展开更多
关键词 板块元方法 图像处理器 计算统一设备架构 并行计算
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部