期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于移动GPU的芯片封装缺陷检测技术
1
作者 陈阳 陈庆奎 《计算机与数字工程》 2024年第6期1650-1657,共8页
为确保芯片料带生产品质符合要求,生产厂商需要进行芯片封装缺陷检测。随着生产效率的不断提升,生产场景中亟需一种对原有生产线改造成本低且高效的多路生产线检测方法。因此对基于移动GPU平台的缺陷检测技术进行研究,利用GPU中大量并... 为确保芯片料带生产品质符合要求,生产厂商需要进行芯片封装缺陷检测。随着生产效率的不断提升,生产场景中亟需一种对原有生产线改造成本低且高效的多路生产线检测方法。因此对基于移动GPU平台的缺陷检测技术进行研究,利用GPU中大量并行线程,以图像粒度的并行方式执行检测计算以提高多路生产线检测效率。每个线程利用图像处理方法进行特征分析,对图像中不同区域进行相应的缺陷检测。实验结果表明,在50条生产线,每张采集图像包含10个待测区域的检测场景下,相比CPU检测方法获得15.02倍的加速比。 展开更多
关键词 芯片封装缺陷检测 移动gpu 检测效率 多路生产线检测 特征分析
下载PDF
基于脉冲神经网络与移动GPU计算的图像分类算法研究与实现 被引量:6
2
作者 徐频捷 王诲喆 +2 位作者 李策 唐丹 赵地 《计算机工程与科学》 CSCD 北大核心 2020年第3期397-403,共7页
计算机视觉旨在通过计算机模拟人的视觉系统,让计算机学会“看”,是人工智能、神经科学研究的一个热点。作为计算机视觉的经典任务,图像分类吸引了越来越多的研究,尤其是基于神经网络的算法在各种分类任务上表现优异。然而,传统浅层人... 计算机视觉旨在通过计算机模拟人的视觉系统,让计算机学会“看”,是人工智能、神经科学研究的一个热点。作为计算机视觉的经典任务,图像分类吸引了越来越多的研究,尤其是基于神经网络的算法在各种分类任务上表现优异。然而,传统浅层人工神经网络特征学习能力不强、生物可解释性不足,而深层神经网络存在过拟合、高功耗的缺点,因此在低功耗环境下具有生物可解释性的图像分类算法研究仍然是一个具有挑战性的任务。为了解决上述问题,结合脉冲神经网络,设计并实现了一种基于Jetson TK1和脉冲神经网络的图像分类算法。研究的主要创新点有:(1)设计了深度脉冲卷积神经网络算法,用于图像分类;(2)实现了基于CUDA改进的脉冲神经网络模型,并部署在Jetson TK1开发环境上。 展开更多
关键词 图像分类 脉冲神经网络 移动gpu计算
下载PDF
CNN卷积计算在移动GPU上的加速研究 被引量:5
3
作者 王湘新 时洋 文梅 《计算机工程与科学》 CSCD 北大核心 2018年第1期34-39,共6页
卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解... 卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上。最终选择使用OpenCL通用编程框架将前向过程中最耗时的卷积操作利用矩阵乘来完成,并转移到GPU上进行。在此基础之上还针对手机GPU做了一些优化。最终,实验结果显示我们成功地将前向过程的时间降低到了原来时间的一半。 展开更多
关键词 CNN 手机 移动gpu 快速算法 OPENCL
下载PDF
基于移动多核GPU的并行二维DCT变换实现方法 被引量:2
4
作者 龚若皓 杨斌 《成都信息工程学院学报》 2015年第1期22-26,共5页
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处... 传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径。基于最新的ARM Cortex-A15内嵌GPU Mali-T604及Open CL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输入数据量足够大的条件下能够达到近20倍的加速比。 展开更多
关键词 计算机应用技术 异构计算 二维DCT变换 移动多核gpu GPgpu OPENCL 并行化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部