期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
无网格法结构拓扑优化模型的GPU并行加速求解及应用
1
作者 唐芳 冯应朗 卢海山 《装备制造技术》 2023年第6期10-15,31,共7页
基于无网格法的连续体结构拓扑优化,具有计算精度高、可消除传统拓扑优化中的数值不稳定性等优势,然而无网格法结构拓扑优化模型的求解存在计算耗时长的问题。为此引入GPU(Graphic processing unit,GPU)并行加速技术,开展无网格法结构... 基于无网格法的连续体结构拓扑优化,具有计算精度高、可消除传统拓扑优化中的数值不稳定性等优势,然而无网格法结构拓扑优化模型的求解存在计算耗时长的问题。为此引入GPU(Graphic processing unit,GPU)并行加速技术,开展无网格法结构拓扑优化模型的GPU并行加速求解及应用研究,以缩短拓扑优化模型的求解耗时。基于交叉节点对思想构建了拓扑迭代中刚度矩阵的GPU并行组装流程,结合CUDA(Compute unified device architecture,CUDA)库函数与预处理共轭梯度法实现了离散方程的GPU并行加速计算,且通过提前计算并存储形函数及其导数值以避免重复计算,建立了无网格法拓扑优化模型的GPU并行加速求解算法。通过二维悬臂梁算例验证了算法的正确性,完成了二维曲形支架、三维支撑平台以及多工况固支梁的拓扑优化设计,并分析了GPU并行算法的加速性能。算例结果表明所提GPU并行加速算法的计算结果正确,且极大地提高了无网格法拓扑优化模型的求解效率。 展开更多
关键词 拓扑优化 无网格法 gpu并行加速 CUDA
下载PDF
基于GPU并行加速的黏声最小二乘逆时偏移及应用 被引量:1
2
作者 张猛 《岩性油气藏》 CSCD 北大核心 2022年第1期148-153,共6页
常规逆时偏移算法(RTM)在浅层成像中容易产生较强的低频噪声,无法消除地球介质的吸收衰减效应。基于广义标准线性固体模型,建立黏声波动方程,在Born正演和梯度计算2个核心算法过程中开展了GPU加速,建立了黏声最小二乘逆时偏移实现流程,... 常规逆时偏移算法(RTM)在浅层成像中容易产生较强的低频噪声,无法消除地球介质的吸收衰减效应。基于广义标准线性固体模型,建立黏声波动方程,在Born正演和梯度计算2个核心算法过程中开展了GPU加速,建立了黏声最小二乘逆时偏移实现流程,并将该方法应用在胜利油田某探区三维资料中,结果显示,计算效率和偏移成像质量都得到了有效提升。并且开展了与常规声波最小二乘逆时偏移的对比和分析工作,结果表明该方法对提升深层储层成像精度,实现真振幅成像,以及岩性油气藏的勘探都具有重要的意义。 展开更多
关键词 gpu并行加速 黏声介质 最小二乘逆时偏移 波动方程
下载PDF
一个基于GPU并行加速的海啸数值模型
3
作者 王宗辰 原野 李宏伟 《海洋通报》 CAS CSCD 北大核心 2020年第2期200-205,共6页
地震海啸通常发生在大洋板块向陆地板块俯冲的区域,距离震源最近的国家和地区往往在震后5~20 min之内就会遭受到海啸袭击。因此,及时的海啸预警和准确的海啸预报结果对于民众和决策者都至关重要。为了提升海啸预警效率,缩短海啸预报时间... 地震海啸通常发生在大洋板块向陆地板块俯冲的区域,距离震源最近的国家和地区往往在震后5~20 min之内就会遭受到海啸袭击。因此,及时的海啸预警和准确的海啸预报结果对于民众和决策者都至关重要。为了提升海啸预警效率,缩短海啸预报时间,本研究对COMCOT海啸数值模型进行了基于图形计算单元GPU的二次并行开发。将原模型中海啸传播计算模块通过CUDA_C语言编写内核函数整体移植到GPU上并行加速,CPU负责模型其他代码的执行。为了减少CPU和GPU之间的数据通信,将吸收边界和变量更新函数一并改写。仅在需要输出的时间节点,GPU向CPU传递结果,其他时间步长,CPU和GPU之间只有指令和少量参数传输,基本可视为零耗时。基于GPU并行加速的COMCOT较串行版本效率提升超过67倍,加速性能显著优于基于CPU共享内存的OpenMP并行版本。交叉使用常水深和真实地形,采用均匀滑移海啸源和有限元海啸源对模型的计算结果进行了较为全面的分析检验,相对误差最大不超过1%,为大范围的越洋海啸实时计算提供了有力工具。 展开更多
关键词 海啸数值模型 COMCOT gpu并行加速 CUDA_C
下载PDF
基于GPU并行加速的多特征融合的超图降维方法
4
作者 洪朝群 陈旭辉 +2 位作者 王晓栋 李士锦 吴克寿 《计算机科学》 CSCD 北大核心 2015年第11期90-93,117,共5页
基于图的学习方法目前广泛用于降低特征维度。然而,对于多特征数据而言,不同特征之间的不同关联性很难结合到单个图中。针对多特征数据提出了新的半监督降维方法。首先,以超图中的超边作为片,使超图应用到片对齐框架中。然后,通过统计... 基于图的学习方法目前广泛用于降低特征维度。然而,对于多特征数据而言,不同特征之间的不同关联性很难结合到单个图中。针对多特征数据提出了新的半监督降维方法。首先,以超图中的超边作为片,使超图应用到片对齐框架中。然后,通过统计片中相邻的特征对的距离计算超边的权重,使得不同特征下的片得到结合。其次,由于欧氏距离和矩阵乘法的计算在拉普拉斯矩阵的构造过程中占用了大部分的时间,因此使用GPU对其进行加速。实验结果表明了所提方法在分类性能和学习速度上的提升效果。 展开更多
关键词 降维 多特征融合 片对齐框架 超图学习 基于gpu并行加速
下载PDF
基于CPU/GPU协同加速叠前逆时偏移方法研究 被引量:2
5
作者 高新成 李春生 《陕西理工学院学报(自然科学版)》 2016年第1期44-49,共6页
为了提高地震资料数据处理的计算效率与成像精度,对于逆时偏移算法,采用一阶速度-应力波动方程,使用交错网络高阶有限差分算法进行求解。利用随机边界条件和PML边界条件进行地震波场正向延拓,既减少波场存储量,又能保证波场数据准确性,... 为了提高地震资料数据处理的计算效率与成像精度,对于逆时偏移算法,采用一阶速度-应力波动方程,使用交错网络高阶有限差分算法进行求解。利用随机边界条件和PML边界条件进行地震波场正向延拓,既减少波场存储量,又能保证波场数据准确性,同时,使用CPU/GPU协同并行计算技术来提高运算效率。实验结果表明,CPU/GPU协同并行加速计算效果明显,叠前逆时偏移算法可对大地层倾角和偏移孔径清晰成像,能够对复杂构造地质体精确成像。 展开更多
关键词 叠前逆时偏移 交错网格 高阶有限差分 随机边界条件 PML边界条件 gpu并行加速
下载PDF
波形板干燥器内液滴模拟的GPU加速研究
6
作者 张迪 黄伟 +1 位作者 罗琦 王侃 《原子能科学技术》 EI CAS CSCD 北大核心 2015年第3期491-496,共6页
基于CUDA C,使用GPU模拟了波形板内大量液滴的二维运动。根据GPU硬件特性,优化了模拟算法。在CPU上实现相同算法,对比了单一液滴直径、不同液滴数量下GPU与CPU的计算时间。结果表明:液滴数量越大,GPU并行加速效果越明显,在液滴数量较大... 基于CUDA C,使用GPU模拟了波形板内大量液滴的二维运动。根据GPU硬件特性,优化了模拟算法。在CPU上实现相同算法,对比了单一液滴直径、不同液滴数量下GPU与CPU的计算时间。结果表明:液滴数量越大,GPU并行加速效果越明显,在液滴数量较大时,得到约60倍的加速。用GPU分析了典型液滴直径分布的情况,得到约30倍的加速。 展开更多
关键词 波形板干燥器 液滴运动模拟 gpu并行加速 CUDA C
下载PDF
一种基于OpenCL的Lukas-Kanade光流并行加速算法 被引量:6
7
作者 吴进 李乔深 +1 位作者 闵育 马思敏 《电讯技术》 北大核心 2018年第8期871-877,共7页
LK(Lukas-Kanade)光流法在运动目标检测和跟踪领域具有广泛应用,但其计算复杂、速度慢,难以适应异构硬件平台。为实现LK光流法在不同平台上的高效运行,设计了一种基于开放式计算语言(OpenCL)的LK光流法并行算法。该算法通过将二维图像... LK(Lukas-Kanade)光流法在运动目标检测和跟踪领域具有广泛应用,但其计算复杂、速度慢,难以适应异构硬件平台。为实现LK光流法在不同平台上的高效运行,设计了一种基于开放式计算语言(OpenCL)的LK光流法并行算法。该算法通过将二维图像上像素点上的稠密计算映射到多线程上实现数据并行,并基于OpenCL平台的共享内存等优化方法减小了主机内存与设备内存数据传输。实验测试表明,该算法相比于多核CPU下的基础OpenCV函数库中的LK算法获得了最高31倍的加速比,同时在速度上与统一计算设备体系结构(CUDA)加速的LK光流法相近。此外,还在多种不同设备下验证了加速算法的平台通用性。 展开更多
关键词 行为识别 目标跟踪 Lukas-Kanade光流法 OpenCL异构计算 gpu并行加速
下载PDF
基于MPS方法的固定半潜式平台波浪爬升数值模拟
8
作者 吴萌萌 王尼娜 万德成 《海洋工程》 CSCD 北大核心 2024年第4期44-56,共13页
在波浪与半潜式平台相互作用的情况下,波浪会沿着平台立柱爬升,并对平台立柱产生砰击作用。在极端情况下,波浪甚至可能砰击至平台下甲板,严重影响平台的安全。因此,对于半潜式平台设计来说,准确预测平台在波浪中的波浪爬升和砰击效应具... 在波浪与半潜式平台相互作用的情况下,波浪会沿着平台立柱爬升,并对平台立柱产生砰击作用。在极端情况下,波浪甚至可能砰击至平台下甲板,严重影响平台的安全。因此,对于半潜式平台设计来说,准确预测平台在波浪中的波浪爬升和砰击效应具有重要意义。采用无网格粒子法求解器MPSGPU-SJTU对波浪作用下的固定半潜式平台问题进行了数值研究,将MPS(moving particle semi-implicit)方法与GPU(graphics processing unit)并行加速技术相结合,并将其应用于规则波作用下的固定半潜式平台波浪爬升与波浪砰击问题的数值模拟。3种不同波高的规则波波浪被应用于半潜式平台数值模拟中,随着波高的增加,平台下甲板更多区域受到了波浪的砰击,同时平台设置的测压点处压力峰值也随之增大。 展开更多
关键词 MPS方法 固定半潜式平台 gpu并行加速技术 波浪爬升 波浪砰击
下载PDF
基于CPU/GPU异构平台的叠前逆时偏移成像系统
9
作者 高新成 石颖 《长江大学学报(自科版)(上旬)》 2016年第12期15-20,共6页
针对目前地震资料偏移成像过程中代码复杂分散、可移植性差和可视化操作弱等问题,结合叠前逆时偏移业务需求,研究了CPU/GPU协同并行计算技术优化叠前逆时偏移成像算法,设计了逆时偏移系统流程与功能,开发了一套基于CPU/GPU异构平台的叠... 针对目前地震资料偏移成像过程中代码复杂分散、可移植性差和可视化操作弱等问题,结合叠前逆时偏移业务需求,研究了CPU/GPU协同并行计算技术优化叠前逆时偏移成像算法,设计了逆时偏移系统流程与功能,开发了一套基于CPU/GPU异构平台的叠前逆时偏移成像系统。利用自设模型和传统模型数据对系统进行测试,测试结果表明系统操作方便可行,运行效果良好,能够有效的对复杂构造地质体精确成像。 展开更多
关键词 逆时偏移 CPU/gpu并行加速 PML边界条件 QT
下载PDF
GPU视频纹理技术在三维电影播放中的应用 被引量:2
10
作者 成效 万旺根 +1 位作者 余小清 徐鸿玮 《计算机工程与设计》 CSCD 北大核心 2010年第18期4020-4023,共4页
研究了三维电影播放应用中的视频纹理技术,分析了该方法的国内外研究现状、难题和挑战,提出了有效地解决方案,并对该方案进行设计。采用DirectShow进行视频数据的调度与管理,Direct3D作为图形渲染API,提取出传统渲染管道下的并行运算部... 研究了三维电影播放应用中的视频纹理技术,分析了该方法的国内外研究现状、难题和挑战,提出了有效地解决方案,并对该方案进行设计。采用DirectShow进行视频数据的调度与管理,Direct3D作为图形渲染API,提取出传统渲染管道下的并行运算部分,利用可编程GPU并行运算的特性对其进行加速渲染,并利用GPU纹理压缩方法解决了显存容量有限的问题。实验结果表明,该设计方法能够有效地提高帧速率,缓解CPU负担,解决实时渲染中的性能瓶颈问题,在实际应用中具有较强的使用价值。 展开更多
关键词 三维电影 DirectShow视频处理 Direct3D图形渲染 gpu并行加速 gpu纹理压缩
下载PDF
基于GPU的分布式全息孔径数字成像技术研究 被引量:1
11
作者 黄家应 杨峰 +1 位作者 朱磊 饶长辉 《半导体光电》 CAS 北大核心 2020年第2期257-263,共7页
分布式全息孔径数字成像技术是利用数字全息记录各子孔径的复振幅信息,通过孔径间相位拼接实现综合成像的一种主动成像技术。在远距离成像中,大气湍流引入的子孔径内高阶相位误差和子孔径间低阶相位误差,以及孔径间的位置失配误差,都会... 分布式全息孔径数字成像技术是利用数字全息记录各子孔径的复振幅信息,通过孔径间相位拼接实现综合成像的一种主动成像技术。在远距离成像中,大气湍流引入的子孔径内高阶相位误差和子孔径间低阶相位误差,以及孔径间的位置失配误差,都会影响成像质量。随机并行梯度下降算法(SPGD)是一种无波前探测优化控制算法,具有可以并行、快速收敛、高效可靠等优点,可用于校正系统孔径内高阶和孔径间低价相位误差。但是SPGD算法需要多次迭代,运算量巨大,难以满足实时性要求。文章基于GPU平台,对高、低阶相位误差校正进行了并行加速处理,运算速度较CPU平台分别提升26.42倍和36.47倍。此外,采用AKZAE算法校正各子孔径间的位置失配误差,完成了各子孔径复振幅的拼接,最终实现了分布式四孔径的综合成像。 展开更多
关键词 分布式孔径 数字全息 随机并行梯度下降算法 gpu并行加速
下载PDF
基于CPU+GPU的大视场物镜成像畸变实时校正 被引量:3
12
作者 李明杰 胡明勇 +2 位作者 张健 曹明坡 王位 《光子学报》 EI CAS CSCD 北大核心 2018年第6期253-260,共8页
针对工业大视场物镜畸变成像的实时校正问题,提出一种校正算法和CPU+GPU并行加速方案.根据光学畸变理论和相机标定技术,建立非球面畸变校正模型.利用棋盘样板计算光学中心和估计畸变系数,设计校正算法.在CPU+GPU并行加速方案基础上,设... 针对工业大视场物镜畸变成像的实时校正问题,提出一种校正算法和CPU+GPU并行加速方案.根据光学畸变理论和相机标定技术,建立非球面畸变校正模型.利用棋盘样板计算光学中心和估计畸变系数,设计校正算法.在CPU+GPU并行加速方案基础上,设计内核自适应维度算法并优化运行程序,结合OPENGL驱动进行实时校正和显示.实验结果表明,本文设计的实时校正系统对高分辨率的畸变成像校正率可以达到98.2%,单帧耗时0.026 s,平均综合加速比为29.1.该系统精度高,可移植性强,简单易行,能够广泛应用于成像畸变的实时校正. 展开更多
关键词 大视场物镜 光学畸变 高分辨率 gpu并行加速 实时校正 OPENGL显示
下载PDF
快速LZD匹配异源DEM空洞修复应用研究
13
作者 李小虎 芦颖 田壮 《计算机工程与应用》 CSCD 北大核心 2023年第23期311-319,共9页
针对待修复数字高程模型存在较大面积不规则空洞,且与辅助模型的尺度特征、位姿存在明显差异时,需要对数据进行预处理、样本训练或进行大量计算,导致修复效率低下以及产生计算误差等问题,提出了一种基于最小高差(least Z-difference,LZD... 针对待修复数字高程模型存在较大面积不规则空洞,且与辅助模型的尺度特征、位姿存在明显差异时,需要对数据进行预处理、样本训练或进行大量计算,导致修复效率低下以及产生计算误差等问题,提出了一种基于最小高差(least Z-difference,LZD)匹配和CPU-GPU并行加速的处理方法。利用Z坐标差值搜索最小距离点,将异步流迭代方式应用于空间转换模型参数的求解中,在简化的计算准则基础上进一步提升运行效率,实现对异源DEM空洞数据与基准数据的快速高精度匹配,同时,使用台阶融合算法填补空缺区域并进行边缘平滑。实验结果表明,该方法修复得到的DEM数据完整度、正确性高,处理过程较CPU多线程平台最高能够达到9.7倍的加速比,为数字高程模型的修复与分析研究提供了有益参考。 展开更多
关键词 最小高差算法 三维表面匹配 gpu并行加速 DEM数据空洞修复
下载PDF
基于OpenCL的FFT算法研究 被引量:2
14
作者 贾格 彭先蓉 左颢睿 《计算机应用与软件》 2017年第3期233-237,283,共6页
快速福利叶变换在图像处理领域,尤其是在图像复原算法中作为常用的计算工具,将时域计算转变为频域计算,在工程应用中有着非常重要的意义。采取多线程分块以及并行的映射方法,可以使FFT算法最大程度并行。针对OpenCL的存储层次特点和算... 快速福利叶变换在图像处理领域,尤其是在图像复原算法中作为常用的计算工具,将时域计算转变为频域计算,在工程应用中有着非常重要的意义。采取多线程分块以及并行的映射方法,可以使FFT算法最大程度并行。针对OpenCL的存储层次特点和算法层次的优化,在AMD GPU平台上取得了明显的加速效果。优化后的算法性能比具有相同处理能力的CPU平台提高了7倍,比具有相同处理能力的CUDA提高了4倍。 展开更多
关键词 傅里叶变换 OPENCL gpu并行加速
下载PDF
面向复杂未知多障碍环境的多无人机分布式在线轨迹规划 被引量:1
15
作者 张学伟 田栢苓 +2 位作者 鲁瀚辰 谌宏鸣 宗群 《中国科学:信息科学》 CSCD 北大核心 2022年第9期1627-1641,共15页
考虑复杂未知多障碍环境对无人机实时轨迹规划性能的影响,提出了基于Tube-MPC和模型预测路径积分(model predictive path integral,MPPI)控制相结合的多无人机分布式实时轨迹规划框架与方法.首先,考虑无人机在多障碍环境下的避碰避障需... 考虑复杂未知多障碍环境对无人机实时轨迹规划性能的影响,提出了基于Tube-MPC和模型预测路径积分(model predictive path integral,MPPI)控制相结合的多无人机分布式实时轨迹规划框架与方法.首先,考虑无人机在多障碍环境下的避碰避障需求,构造代价函数表征轨迹规划过程中的约束条件,将多无人机的轨迹规划问题转化为随机最优控制问题.其次,借鉴Tube-MPC思想,设计并实现了多无人机分布式轨迹规划框架,通过将低频标称控制器与高频辅助控制器串联保证了系统的实时性和鲁棒性.再次,为避免传统方法在求解过程中的维数灾难,提出基于MPPI的多无人机异步轨迹规划方法,该方法通过基于GPU的并行蒙特卡洛(Monte-Carlo)随机前向采样技术,将多无人机随机最优控制问题的求解转化为给定代价函数下对采样轨迹期望的求解,进而获得最优控制序列,其显著特点是求解速度快且避免了基于梯度求解方法对约束条件和代价函数连续性及凸特性的要求.最后,通过Gazebo虚拟仿真平台,在复杂未知多障碍环境下对算法的有效性进行了验证. 展开更多
关键词 未知多障碍环境 多无人机 在线轨迹规划 模型预测路径积分 gpu并行加速
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部