期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
晶硅分子动力学模拟的GPU加速算法优化 被引量:1
1
作者 林琳 祝爱琦 +6 位作者 赵明璨 张帅 叶炎昊 徐骥 韩林 赵荣彩 侯超峰 《计算机工程》 CAS CSCD 北大核心 2023年第4期166-173,共8页
分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待... 分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待等问题,结合Nvidia Tesla V100 GPU硬件体系结构特点,对晶硅MD模拟算法进行设计。通过全局内存的合并访存、循环展开、原子操作等优化方法,利用GPU强大并行计算和浮点运算能力,减少显存访问及算法执行过程中的分支冲突和判断指令,提升算法整体计算性能。测试结果表明,优化后的晶硅MD模拟算法的计算速度相比于优化前提升了1.69~1.97倍,相比于国际上主流的GPU加速MD模拟软件HOOMDblue和LAMMPS分别提升了3.20~3.47倍和17.40~38.04倍,具有较好的模拟加速效果。 展开更多
关键词 分子动力学 图形处理器 合并访存 循环展开 原子操作 性能优化
下载PDF
基于GPU的点云模型快速重建方法
2
作者 吕建新 马礼 +2 位作者 傅颖勋 李阳 马东超 《计算机工程与设计》 北大核心 2023年第11期3440-3446,共7页
利用GPU并行特点,将点云数据分块并行处理,实施多线程并行重建。从有序点云的数据关系入手,设计点云处理平滑在内的数据处理方法。利用GPU对分块数据快速三角化曲面重建,使用拉普拉斯算法对重建后的曲面进行平滑处理。通过对5组不同的... 利用GPU并行特点,将点云数据分块并行处理,实施多线程并行重建。从有序点云的数据关系入手,设计点云处理平滑在内的数据处理方法。利用GPU对分块数据快速三角化曲面重建,使用拉普拉斯算法对重建后的曲面进行平滑处理。通过对5组不同的海量数据进行重构模型实验,与传统的单纯使用CPU重构方式相比,GPU方式将模型重构速率提升了数十倍至上百倍,模型重建速度得到了大幅度的提升,可有效适用于高精度器件装检预判,提高装配质量。 展开更多
关键词 有序点云 点云分块 三角化 多线程 图形处理器并行运算 表面重建 模型平滑
下载PDF
GPU上的查询算子的设计与优化
3
作者 冷芳玲 刘军 +1 位作者 吴莹莹 鲍玉斌 《计算机工程与应用》 CSCD 北大核心 2023年第8期81-88,共8页
选择、连接、投影和聚集等是传统关系型数据库中的基本操作。为了实现关系型数据库在GPU上的查询优化,必须使用相应的GPU算法实现对应的关系算子。借鉴GDB分而治之的分层设计思想将关系代数拆分成算子层和原语层。数据查询处理过程中存... 选择、连接、投影和聚集等是传统关系型数据库中的基本操作。为了实现关系型数据库在GPU上的查询优化,必须使用相应的GPU算法实现对应的关系算子。借鉴GDB分而治之的分层设计思想将关系代数拆分成算子层和原语层。数据查询处理过程中存在着一些难点问题,如数据传输时延、过度使用共享内存、活跃线程数减少和线程之间数据通信产生的通信时延。针对这些问题,基于较新的Pascal架构实现了查询优化算法,在原有的连接、聚集和条件选择算法原理基础上,对相应的算法进行了设计与优化。提高了每个工作线程的工作负载,实现了内核计算与数据传输之间的延迟隐藏,解决了连接操作中的数据倾斜问题。 展开更多
关键词 图形处理器(gpu) Pascal架构 查询算子 原语操作
下载PDF
基于GPU/CPU叠前逆时偏移研究及应用 被引量:14
4
作者 刘文卿 王宇超 +4 位作者 雍学善 王孝 邵喜春 高厚强 刘秋良 《石油地球物理勘探》 EI CSCD 北大核心 2012年第5期712-716,844+676,共5页
本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协... 本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协同系统的计算效率非常高,在实际应用中取得良好的成像效果和时效比。理论模型试算和实际盐丘数据的处理验证了算法的正确性。 展开更多
关键词 逆时偏移 波动方程 成像条件 gpu/CPU协同计算 随机速度边界
下载PDF
梯级水库短期优化调度模型的精细化与GPU并行实现 被引量:13
5
作者 纪昌明 马皓宇 +2 位作者 吴嘉杰 俞洪杰 彭杨 《水利学报》 EI CSCD 北大核心 2019年第5期535-546,共12页
目前制约梯级水库短期优化调度在实际工程中应用的主要瓶颈有:所构建的优化模型存在不合理的简化策略,所选择的求解算法无法保证解的质量以及模型的计算时间远超规定时长。为解决上述问题,本文首先构建精细至水电站各机组工作特性的优... 目前制约梯级水库短期优化调度在实际工程中应用的主要瓶颈有:所构建的优化模型存在不合理的简化策略,所选择的求解算法无法保证解的质量以及模型的计算时间远超规定时长。为解决上述问题,本文首先构建精细至水电站各机组工作特性的优化调度模型,接着通过二重嵌套动态规划(DP)计算给定模拟精度下的高质量解,并针对算法固有的'维数灾'问题,一方面通过数据压缩与数据库技术降低程序的内存占用量,另一方面将GPU并行加速技术首次引入水库调度领域,通过OpenACC实现算法的GPU并行以减少计算时间。最后通过潘口、小漩梯级水库日优化调度的实例研究与对比分析得出:精细模型较传统模型能更好地贴合电站的实际工况,提高梯级系统的发电效益;内存占用缩减策略的引入能有效降低算法的空间复杂度;GPU并行较传统的CPU并行能大幅提升算法的求解速度。由此为短期优化调度的理论发展与算法'维数灾'的处理提供借鉴。 展开更多
关键词 精细化模型 嵌套动态规划 gpu并行 短期优化调度 维数灾
下载PDF
一种在GPU上高精度大型矩阵快速运算的实现 被引量:5
6
作者 苏畅 付忠良 谭雨辰 《计算机应用》 CSCD 北大核心 2009年第4期1177-1179,1192,共4页
设计了一种在图形处理器(GPU)上完成大型矩阵快速运算的方法,主要通过使用Kahan求和公式来确保计算精度,根据GPU特点设计矩阵分块方式和内存分配机制来减少对数据访问频次,以发挥GPU的并行体系结构特性来提高计算速度。实验结果表明此... 设计了一种在图形处理器(GPU)上完成大型矩阵快速运算的方法,主要通过使用Kahan求和公式来确保计算精度,根据GPU特点设计矩阵分块方式和内存分配机制来减少对数据访问频次,以发挥GPU的并行体系结构特性来提高计算速度。实验结果表明此方法能够取得较好的效果,可大大提升大型矩阵乘法的运算速度和精度。 展开更多
关键词 图形处理器 矩阵运算 高精度 并行体系结构
下载PDF
基于交错网格Fourier伪谱微分矩阵算子的地震波场模拟GPU加速方案 被引量:14
7
作者 龙桂华 李小凡 江东辉 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2010年第12期2964-2971,共8页
作为高精度波形反演或逆时偏移的重要组成部分,地震波数值模拟对计算速度和效率提出了更高要求.GPU通用计算技术的产生及其内在数据并行性,为高效地震波数值模拟应用和研究得以有效开展奠定了基础.本文借助交错网格的Fourier伪谱微分矩... 作为高精度波形反演或逆时偏移的重要组成部分,地震波数值模拟对计算速度和效率提出了更高要求.GPU通用计算技术的产生及其内在数据并行性,为高效地震波数值模拟应用和研究得以有效开展奠定了基础.本文借助交错网格的Fourier伪谱微分矩阵算子和GPU上高效矩阵乘法,实现了复杂介质中地震波模拟的高效算法.数值试验表明,优化后的GPU计算相比CPU单核计算在大规模二维地震波场计算中获得至少100x以上的加速比.这对我们快速分析目标反射层在地震剖面中同相轴位置,制定优化采集方案具有重要意义. 展开更多
关键词 伪谱微分矩阵算子 gpu通用计算 地震波高效正演模拟
下载PDF
Retinex图像增强算法的GPU实现 被引量:1
8
作者 陈云善 盛磊 +1 位作者 李一芒 高世杰 《仪器仪表学报》 EI CAS CSCD 北大核心 2015年第S01期189-193,共5页
针对Retinex图像增强算法中的计算密集性问题,提出了基于图形处理器GPU平台的单尺度Retinex(SSR)算法的并行加速方案.首先,简要介绍了SSR算法的基本原理;其次,根据SSR算法的并行性,利用计算统一设备架构(CUDA)软硬件体系架构,实现了SSR... 针对Retinex图像增强算法中的计算密集性问题,提出了基于图形处理器GPU平台的单尺度Retinex(SSR)算法的并行加速方案.首先,简要介绍了SSR算法的基本原理;其次,根据SSR算法的并行性,利用计算统一设备架构(CUDA)软硬件体系架构,实现了SSR算法向GPU上的移植;结果表明,经过并行优化的SSR算法可到达较高的执行效率,并随着图像分辨率的增大加速比显著提高,最大加速比达到近90倍,具有实际应用价值. 展开更多
关键词 图像增强 RETINEX 并行运算 图形处理器 计算统一设备架构
下载PDF
GPU编程模型中存储体冲突的研究 被引量:2
9
作者 原建伟 李爱国 李文宇 《河北工业科技》 CAS 2013年第1期39-41,46,共4页
GPU并行计算模型中使用共享内存是提高并行计算效率的重要途径,由于进程访问导致的存储体冲突,却会成倍地降低执行效率。经过分析存储体冲突产生的原因,提出了对算法的修改来解决存储体冲突的原则与方法,并通过对聚类算法的实施进行验证。
关键词 图形处理器 共享内存 并发存储访问 存储体冲突 矩阵运算
下载PDF
基于GPU计算平台实现三维输出道方式的共反射面元(3D-CRS-OIS)叠加 被引量:5
10
作者 倪瑶 杨锴 《石油地球物理勘探》 EI CSCD 北大核心 2013年第1期49-57,5,共9页
输出道方式的共反射面元叠加(CRS-OIS)是对传统CRS叠加成像方法的重要改进。本文将3D-CRS-OIS方法应用于GPU计算平台,利用GPU大规模线程级并行计算架构,实现了基于GPU/CPU计算平台的稳健算法。该算法利用GPU存储带宽高、多寄存器和多处... 输出道方式的共反射面元叠加(CRS-OIS)是对传统CRS叠加成像方法的重要改进。本文将3D-CRS-OIS方法应用于GPU计算平台,利用GPU大规模线程级并行计算架构,实现了基于GPU/CPU计算平台的稳健算法。该算法利用GPU存储带宽高、多寄存器和多处理器的结构特点,将3D-CRS-OIS的主要计算负荷——属性搜索转移至GPU端执行,从而大幅度提高了计算效率。理论与实际数据试算表明,基于GPU/CPU平台可以显著提高加速比,进一步拓展了3D-CRS-OIS算法的应用价值。 展开更多
关键词 3D-CRS-OIS 属性参数搜索 图形处理器(gpu) 统一成像理论 叠加算子
下载PDF
基于异构系统的多级并行稀疏张量向量乘算法
11
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 CPU-gpu 异构并行计算 多级并行 稀疏张量 张量运算
下载PDF
基于GPU加速的几何纹理合成方法 被引量:1
12
作者 桂彦 王培玉 +1 位作者 李峰 刘杨 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2016年第6期638-646,共9页
提出了一种基于GPU加速的几何纹理合成方法,以解决几何纹理合成过程中高计算量、高存储占用和高耗时等问题.首先,对样本几何纹理数据进行子块划分,并根据子块在样本中的位置关系设计可重用样本顶点数据的数据结构,优化存储以降低内存的... 提出了一种基于GPU加速的几何纹理合成方法,以解决几何纹理合成过程中高计算量、高存储占用和高耗时等问题.首先,对样本几何纹理数据进行子块划分,并根据子块在样本中的位置关系设计可重用样本顶点数据的数据结构,优化存储以降低内存的占用率;然后,采用GPU多线程并发技术设计并行加速算法,将串行的几何纹理合成过程并行化,从而实现快速生成任意尺寸的新的几何纹理.实验结果表明,该算法不仅占用存储较少,而且在保证合成质量的同时极大地降低了几何纹理的合成耗时. 展开更多
关键词 纹理合成 几何纹理合成 虚拟现实 gpu加速 并行运算
下载PDF
基于GPU的视频序列中运动目标轮廓提取 被引量:3
13
作者 金汉均 曾婷 《电子测量技术》 2016年第11期85-88,共4页
传统的高斯混合建模算法对阴影的抑制效果差,且存在噪声干扰和对光照突变比较敏感的问题。采用了一种改进的高斯混合建模方法进行运动目标轮廓提取。该方法利用Canny边缘图像对噪声和光照适应性强的特点,将传统高斯混合模型与Canny边缘... 传统的高斯混合建模算法对阴影的抑制效果差,且存在噪声干扰和对光照突变比较敏感的问题。采用了一种改进的高斯混合建模方法进行运动目标轮廓提取。该方法利用Canny边缘图像对噪声和光照适应性强的特点,将传统高斯混合模型与Canny边缘检测相结合来提取目标轮廓。但是,该方法复杂度高且计算量大,不满足视频分析实时性的需求,因此,运用GPU强大计算能力和并行处理的优势,基于CUDA平台设计并实现了该运动目标轮廓提取算法。实验结果表明,该算法增强了对噪声和光照的适应性,且有效抑制了图像中的阴影,在保证效果的前提下能够更快速地提取视频序列中的运动目标轮廓。 展开更多
关键词 高斯混合模型 CANNY算子 轮廓提取 gpu
下载PDF
基于GPU的密文分组随机链接加密模式的研究
14
作者 吴伟民 李坚锐 林志毅 《计算机工程与科学》 CSCD 北大核心 2015年第1期36-41,共6页
大部分传统的分组加密模式不能有效应用于GPU上。分析传统加密工作模式,结合GPU并行计算的要求提出一种满足GPU执行要求的、高效的、安全的分组加密模式——密文分组随机链接加密模式(RCBC)。该模式不但执行效率高,并且增加了破解难度... 大部分传统的分组加密模式不能有效应用于GPU上。分析传统加密工作模式,结合GPU并行计算的要求提出一种满足GPU执行要求的、高效的、安全的分组加密模式——密文分组随机链接加密模式(RCBC)。该模式不但执行效率高,并且增加了破解难度。实验结果表明,在CPU_GPU上采用RCBC的密码算法在处理数据时,呈现出高效的处理能力。 展开更多
关键词 gpu 数据加密 工作模式
下载PDF
基于GPU并行的遥感影像边缘检测算法 被引量:4
15
作者 陶伟东 黄昊 +2 位作者 苑振宇 杨柳 王结臣 《地理与地理信息科学》 CSCD 北大核心 2013年第1期8-11,16,共5页
针对数字图像处理领域中单个像元之间相互独立的特性,采用图形处理单元(GPU)的CUDA可编程模型,从粗粒度和细粒度双层并行结构出发,结合对Block和Thread的合理调度,对边缘检测Roberts梯度算子进行了算法的并行化设计和实现。实验结果表明... 针对数字图像处理领域中单个像元之间相互独立的特性,采用图形处理单元(GPU)的CUDA可编程模型,从粗粒度和细粒度双层并行结构出发,结合对Block和Thread的合理调度,对边缘检测Roberts梯度算子进行了算法的并行化设计和实现。实验结果表明,该算法充分利用了GPU强大的浮点并行计算能力,运行效率明显优于常规的边缘检测算法,对高分辨率遥感影像并行处理技术发展提供了有益借鉴。 展开更多
关键词 图形处理器 边缘检测 ROBERTS算子 并行化
下载PDF
基于GPU的GNSS信号跟踪设计与实现 被引量:2
16
作者 张尧 唐小妹 +1 位作者 陈华明 孙广富 《全球定位系统》 2014年第5期59-63,共5页
软件接收机在数据后处理、算法设计与分析等方面发挥着重要的作用。由于传统的软件接收机均是由CPU处理器实现,处理效率低下。图像处理单元是高度并行化的处理器,将导航信号处理中并行程度高且对时间要求最为严格的跟踪环节与GPU的并行... 软件接收机在数据后处理、算法设计与分析等方面发挥着重要的作用。由于传统的软件接收机均是由CPU处理器实现,处理效率低下。图像处理单元是高度并行化的处理器,将导航信号处理中并行程度高且对时间要求最为严格的跟踪环节与GPU的并行处理结构有机结合,能大大提升程序的效率。本文解决了采用GPU实现信号跟踪的关键技术,给出了相关的设计方案,并实现。试验结果表明:采用GPU实现信号的跟踪,其效率提升了112.5倍。 展开更多
关键词 跟踪 并行运算
下载PDF
基于GPU并行三角化的点云模型快速重建方法 被引量:2
17
作者 宣伟 花向红 +1 位作者 邹进贵 杨剑 《测绘通报》 CSCD 北大核心 2018年第A01期36-42,51,共8页
如何基于点云数据进行三维模型的快速重建已经成为研究的热点问题之一。本文首先介绍了Delaunay三角化的相关理论基础,总结了3种Delaunay三角网构建方法及各自优缺点;其次,提出GPU点云数据快速三角化方法,从分治法构建点云Delaunay三角... 如何基于点云数据进行三维模型的快速重建已经成为研究的热点问题之一。本文首先介绍了Delaunay三角化的相关理论基础,总结了3种Delaunay三角网构建方法及各自优缺点;其次,提出GPU点云数据快速三角化方法,从分治法构建点云Delaunay三角网入手,提出并行自适应点云数据分块方法,将点云划分为若干个数据子集,并构建空间二叉树结构,在此基础上,实现并行三角化操作,并根据建立的二叉树结构,完成了子集三角网的合并,得到最终的点云Delaunay三角格网模型;最后,分别对7种不同密度的大规模点云数据进行了模型重建试验,相比于传统CPU方法,本文GPU方法能够将模型重建效率提高数十倍甚至上百倍,大大提高了模型重建的速度。 展开更多
关键词 DELAUNAY三角化 点云自适应分块 gpu并行运算 三角网合并
下载PDF
基于OpenGL的GPU命令处理器设计方法研究 被引量:1
18
作者 刘晖 田泽 +1 位作者 张骏 马城城 《航空计算技术》 2020年第3期105-108,共4页
命令处理器是GPU中的可编程染色器,它将接收到的图形命令发送到3D引擎进行处理并绘制出图像。命令处理器是GPU数据处理的来源,其对图形命令的解析方式、处理速率与数据吞吐量直接决定了图形处理器3D引擎性能的发挥。在分析OpenGL图形绘... 命令处理器是GPU中的可编程染色器,它将接收到的图形命令发送到3D引擎进行处理并绘制出图像。命令处理器是GPU数据处理的来源,其对图形命令的解析方式、处理速率与数据吞吐量直接决定了图形处理器3D引擎性能的发挥。在分析OpenGL图形绘制命令的基础上,提出了一种适用于OpenGL的图形命令处理器架构,并设计相应的运行管理方法及性能监控策略,既保证了命令处理运行的正确性,提高图形命令运行的时效性,又为命令处理器的升级与优化指明了方向。 展开更多
关键词 图形处理器 OPENGL 命令处理器 运行管理 性能监控
下载PDF
基于GPU的稀疏矩阵存储格式优化研究 被引量:5
19
作者 杨世伟 蒋国平 +1 位作者 宋玉蓉 涂潇 《计算机工程》 CAS CSCD 北大核心 2019年第9期23-31,39,共10页
稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性。为此,提出一种改进的BRCP存储格式。采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提... 稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性。为此,提出一种改进的BRCP存储格式。采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提高SpMV在GPU平台上的并行性,并设计基于快速分段求和算法的GPU内核函数,保证计算结果的确定性及其在不同GPU平台上的再现性。实验结果表明,BRCP存储格式具有较高的计算效率,相比BRC存储格式可减少并行环境中的SpMV计算误差,并提高PageRank排序的准确率。 展开更多
关键词 稀疏矩阵向量乘 计算统一设备架构 图形处理器 存储格式 浮点运算
下载PDF
Canny算子检测焊缝的GPU并行加速研究 被引量:2
20
作者 白东阳 刘健 +1 位作者 王晓曼 景文博 《长春理工大学学报(自然科学版)》 2018年第5期93-96,110,共5页
提出了一种基于GPU并行加速的Canny算子检测焊缝边缘的方法。焊缝边缘是焊缝图像的最主要特征,选用Canny算子可以得到较为准确的焊缝信息,然而Canny算法执行速度较慢,无法完成快速实时的检测,这极大地限制了其实用性。在前人使用Canny... 提出了一种基于GPU并行加速的Canny算子检测焊缝边缘的方法。焊缝边缘是焊缝图像的最主要特征,选用Canny算子可以得到较为准确的焊缝信息,然而Canny算法执行速度较慢,无法完成快速实时的检测,这极大地限制了其实用性。在前人使用Canny算子检测焊缝的基础上进行更深的优化和改进,首先对Canny算子检测算法进行并行化改造,再使用GPU+CPU并行化处理,在不影响边缘检测效果的前提下速度得以加快,一幅1280×960的图像边缘检测时间可以缩短到10ms以内,极大地提高了算法的实用性,为焊缝图像后续处理奠定基础。 展开更多
关键词 焊缝边缘检测 CANNY算子 gpu加速
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部