期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于移动GPU的芯片封装缺陷检测技术
1
作者
陈阳
陈庆奎
《计算机与数字工程》
2024年第6期1650-1657,共8页
为确保芯片料带生产品质符合要求,生产厂商需要进行芯片封装缺陷检测。随着生产效率的不断提升,生产场景中亟需一种对原有生产线改造成本低且高效的多路生产线检测方法。因此对基于移动GPU平台的缺陷检测技术进行研究,利用GPU中大量并...
为确保芯片料带生产品质符合要求,生产厂商需要进行芯片封装缺陷检测。随着生产效率的不断提升,生产场景中亟需一种对原有生产线改造成本低且高效的多路生产线检测方法。因此对基于移动GPU平台的缺陷检测技术进行研究,利用GPU中大量并行线程,以图像粒度的并行方式执行检测计算以提高多路生产线检测效率。每个线程利用图像处理方法进行特征分析,对图像中不同区域进行相应的缺陷检测。实验结果表明,在50条生产线,每张采集图像包含10个待测区域的检测场景下,相比CPU检测方法获得15.02倍的加速比。
展开更多
关键词
芯片封装缺陷检测
移动gpu
检测效率
多路生产线检测
特征分析
下载PDF
职称材料
基于脉冲神经网络与移动GPU计算的图像分类算法研究与实现
被引量:
6
2
作者
徐频捷
王诲喆
+2 位作者
李策
唐丹
赵地
《计算机工程与科学》
CSCD
北大核心
2020年第3期397-403,共7页
计算机视觉旨在通过计算机模拟人的视觉系统,让计算机学会“看”,是人工智能、神经科学研究的一个热点。作为计算机视觉的经典任务,图像分类吸引了越来越多的研究,尤其是基于神经网络的算法在各种分类任务上表现优异。然而,传统浅层人...
计算机视觉旨在通过计算机模拟人的视觉系统,让计算机学会“看”,是人工智能、神经科学研究的一个热点。作为计算机视觉的经典任务,图像分类吸引了越来越多的研究,尤其是基于神经网络的算法在各种分类任务上表现优异。然而,传统浅层人工神经网络特征学习能力不强、生物可解释性不足,而深层神经网络存在过拟合、高功耗的缺点,因此在低功耗环境下具有生物可解释性的图像分类算法研究仍然是一个具有挑战性的任务。为了解决上述问题,结合脉冲神经网络,设计并实现了一种基于Jetson TK1和脉冲神经网络的图像分类算法。研究的主要创新点有:(1)设计了深度脉冲卷积神经网络算法,用于图像分类;(2)实现了基于CUDA改进的脉冲神经网络模型,并部署在Jetson TK1开发环境上。
展开更多
关键词
图像分类
脉冲神经网络
移动gpu
计算
下载PDF
职称材料
CNN卷积计算在移动GPU上的加速研究
被引量:
5
3
作者
王湘新
时洋
文梅
《计算机工程与科学》
CSCD
北大核心
2018年第1期34-39,共6页
卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解...
卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上。最终选择使用OpenCL通用编程框架将前向过程中最耗时的卷积操作利用矩阵乘来完成,并转移到GPU上进行。在此基础之上还针对手机GPU做了一些优化。最终,实验结果显示我们成功地将前向过程的时间降低到了原来时间的一半。
展开更多
关键词
CNN
手机
移动gpu
快速算法
OPENCL
下载PDF
职称材料
基于移动多核GPU的并行二维DCT变换实现方法
被引量:
2
4
作者
龚若皓
杨斌
《成都信息工程学院学报》
2015年第1期22-26,共5页
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处...
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径。基于最新的ARM Cortex-A15内嵌GPU Mali-T604及Open CL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输入数据量足够大的条件下能够达到近20倍的加速比。
展开更多
关键词
计算机应用技术
异构计算
二维DCT变换
移动
多核
gpu
GP
gpu
OPENCL
并行化
下载PDF
职称材料
题名
基于移动GPU的芯片封装缺陷检测技术
1
作者
陈阳
陈庆奎
机构
上海理工大学光电信息与计算机工程学院
出处
《计算机与数字工程》
2024年第6期1650-1657,共8页
基金
国家自然科学基金项目(编号:61572325,60970012)
高等学校博士学科点专项科研博导基金项目(编号:20113120110008)
+3 种基金
上海重点科技攻关基金项目(编号:19DZ1208903)
上海市工程中心建设基金项目(编号:14511107902,16DZ1203603)
上海市一流学科建设基金项目(编号:XTKX2012)
沪江基金研究基地专项基金项目(编号:C14001)资助。
文摘
为确保芯片料带生产品质符合要求,生产厂商需要进行芯片封装缺陷检测。随着生产效率的不断提升,生产场景中亟需一种对原有生产线改造成本低且高效的多路生产线检测方法。因此对基于移动GPU平台的缺陷检测技术进行研究,利用GPU中大量并行线程,以图像粒度的并行方式执行检测计算以提高多路生产线检测效率。每个线程利用图像处理方法进行特征分析,对图像中不同区域进行相应的缺陷检测。实验结果表明,在50条生产线,每张采集图像包含10个待测区域的检测场景下,相比CPU检测方法获得15.02倍的加速比。
关键词
芯片封装缺陷检测
移动gpu
检测效率
多路生产线检测
特征分析
Keywords
detect defects of chip packages
mobile
gpu
detection efficiency
multiple production lines
feature analysis
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于脉冲神经网络与移动GPU计算的图像分类算法研究与实现
被引量:
6
2
作者
徐频捷
王诲喆
李策
唐丹
赵地
机构
中国科学院计算技术研究所
中国科学院大学
中国矿业大学(北京)机电与信息工程学院
出处
《计算机工程与科学》
CSCD
北大核心
2020年第3期397-403,共7页
基金
国家自然科学基金(61420106013)
国家重点研究发展计划(2018ZX10723203)
+1 种基金
北京市自然科学基金(4161004)
北京市科技项目(Z161100000216143,Z171100000117001)。
文摘
计算机视觉旨在通过计算机模拟人的视觉系统,让计算机学会“看”,是人工智能、神经科学研究的一个热点。作为计算机视觉的经典任务,图像分类吸引了越来越多的研究,尤其是基于神经网络的算法在各种分类任务上表现优异。然而,传统浅层人工神经网络特征学习能力不强、生物可解释性不足,而深层神经网络存在过拟合、高功耗的缺点,因此在低功耗环境下具有生物可解释性的图像分类算法研究仍然是一个具有挑战性的任务。为了解决上述问题,结合脉冲神经网络,设计并实现了一种基于Jetson TK1和脉冲神经网络的图像分类算法。研究的主要创新点有:(1)设计了深度脉冲卷积神经网络算法,用于图像分类;(2)实现了基于CUDA改进的脉冲神经网络模型,并部署在Jetson TK1开发环境上。
关键词
图像分类
脉冲神经网络
移动gpu
计算
Keywords
image classification
spiking neural network
mobile
gpu
computing
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
CNN卷积计算在移动GPU上的加速研究
被引量:
5
3
作者
王湘新
时洋
文梅
机构
武警湖南省消防总队信息中心
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2018年第1期34-39,共6页
基金
国家自然科学基金(61272145)
文摘
卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上。最终选择使用OpenCL通用编程框架将前向过程中最耗时的卷积操作利用矩阵乘来完成,并转移到GPU上进行。在此基础之上还针对手机GPU做了一些优化。最终,实验结果显示我们成功地将前向过程的时间降低到了原来时间的一半。
关键词
CNN
手机
移动gpu
快速算法
OPENCL
Keywords
CNN
mobile phone
mobile
gpu
fast algorithm
OpenCL
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于移动多核GPU的并行二维DCT变换实现方法
被引量:
2
4
作者
龚若皓
杨斌
机构
西南交通大学信息科学与技术学院
出处
《成都信息工程学院学报》
2015年第1期22-26,共5页
文摘
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径。基于最新的ARM Cortex-A15内嵌GPU Mali-T604及Open CL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输入数据量足够大的条件下能够达到近20倍的加速比。
关键词
计算机应用技术
异构计算
二维DCT变换
移动
多核
gpu
GP
gpu
OPENCL
并行化
Keywords
computer applications technology
heterogeneous computing
2D-DCT
mobile multicore
gpu
GP
gpu
OpenCL
parallelization
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于移动GPU的芯片封装缺陷检测技术
陈阳
陈庆奎
《计算机与数字工程》
2024
0
下载PDF
职称材料
2
基于脉冲神经网络与移动GPU计算的图像分类算法研究与实现
徐频捷
王诲喆
李策
唐丹
赵地
《计算机工程与科学》
CSCD
北大核心
2020
6
下载PDF
职称材料
3
CNN卷积计算在移动GPU上的加速研究
王湘新
时洋
文梅
《计算机工程与科学》
CSCD
北大核心
2018
5
下载PDF
职称材料
4
基于移动多核GPU的并行二维DCT变换实现方法
龚若皓
杨斌
《成都信息工程学院学报》
2015
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部