基于卷积神经网络图像识别算法的加速实现方法被引量：14

Accelerated Implementation Method of Image Recognition Algorithm Based on Convolutional Neural Network

下载PDF

导出

摘要针对当前卷积神经网络算法日趋复杂,基于通用处理器的软件实现方案运算性能难以满足实际应用实时性要求,而基于GPU的实现方案则存在高能耗、无法应用于嵌入式系统等问题,本文提出了一种使用高层次综合(HLS)实现的基于FPGA卷积神经网络加速器设计方案,采用SDSoC开发环境,在实现所需性能的同时节省了大量开发时间,实验结果表明,在输入图像为64*64*3情况下,本文提出的软硬件协同设计方案识别速度达到1. 86ms,相比CPU实现方案的识别速度266ms,加速比可达143,节约了88倍功耗。 In view of the increasing complexity of current convolutional neural network algorithms,the computational performance of software implementation CPU-based is difficult to meet the real-time requirements of practical applications,while the GPU-based implementation schemes have high energy consumption and can not be applied to embedded systems. An FPGA-based convolutional neural network accelerator design is realized by using high-level synthesis( HLS) implementation,and the SDSoC development environment is used to reduce a lot of development time while the required performance is achieved. The experimental results show that the input image is scale of 64* 64* 3,and the recognition speed of the software and hardware co-design scheme proposed reaches 1. 86 ms and the acceleration ratio can reach 143 by saving 88 times power consumption,which is compared with the recognition speed of 266 ms of the CPU implementation scheme.

作者秦东辉周辉赵雄波柳柱 Qin Donghui;Zhou Hui;Zhao Xiongbo;Liu Zhu(Beijing Aerospace Automatic Control Institute,Beijing 100854,China;National Aerospace Intelligence Control Technology Laboratory,Beijing 100854,China)

机构地区北京航天自动控制研究所宇航智能控制技术国家级重点实验室

出处《航天控制》 CSCD 北大核心 2019年第1期21-26,共6页 Aerospace Control

关键词卷积神经网络 FPGA 硬件加速 SDSoC Convolutional neutral network Field programmable gate array Hardware acceleration SDSoC

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1余子健,马德,严晓浪,沈君成.基于FPGA的卷积神经网络加速器[J].计算机工程,2017,43(1):109-114. 被引量：36
2吴将,朱志宇.基于FPGA实现的SIRF模块级流水线设计[J].航天控制,2014,32(4):19-23. 被引量：1
3方睿,刘加贺,薛志辉,杨广文.卷积神经网络的FPGA并行加速方案设计[J].计算机工程与应用,2015,51(8):32-36. 被引量：27
4王昆,周骅.深度学习中的卷积神经网络系统设计及硬件实现[J].电子技术应用,2018,44(5):56-59. 被引量：7

二级参考文献25

1胡士强,敬忠良.粒子滤波算法综述[J].控制与决策,2005,20(4):361-365. 被引量：293
2白岚,凌秀琴.数据流图在信息处理中的应用[J].光电技术应用,2005,20(6):64-67. 被引量：6
3LeCun Y,Bottou L,Bengio Y,et al.Gradient-based learningapplied to document recognition[J].Proceedings ofthe IEEE,1998,86(11):2278-2324.
4Simard P Y,Steinkraus D,Platt J C.Best practices forconvolutional neural networks applied to visual documentanalysis[C]//Proceedings of the 7th InternationalConference on Document Analysis and Recognition,2003:958-962.
5Chellapilla K,Puri S,Simard P.High performance convolutionalneural networks for document processing[C]//10th International Workshop on Frontiers in HandwritingRecognition,2006.
6Chellapilla K,Shilman M,Simard P.Optimally combininga cascade of classifiers[C]//Electronic Imaging,2006:207-214.
7Garcia C,Delakis M.Convolutional face finder:a neuralarchitecture for fast and robust face detection[J].IEEETransactions on Pattern Analysis and Machine Intelligence,2004,26(11):1408-1423.
8Frome A,Cheung G,Abdulkader A,et al.Large-scale privacyprotection in google street view[C]//IEEE InternationalConference on Computer Vision,2009:2373-2380.
9Bouvrie J.Notes on convolutional neural networks[Z].2006.
10Sankaradas M,Jakkula V,Cadambi S,et al.A massivelyparallel coprocessor for convolutional neural networks[C]//20th IEEE International Conference on Application-specificSystems,Architectures and Processors,2009:53-60.

共引文献58

1程换新,郭占广,刘文翰,张志浩.基于胶囊神经网络的交通标志识别研究[J].电子测量技术,2020(11):112-116. 被引量：3
2陈龙,曹力.一种Zynq SoC片内硬件加速的二维傅里叶变换[J].单片机与嵌入式系统应用,2018,18(2):36-40. 被引量：5
3杨维科,贺光辉,景乃锋.基于Rocket-Chip开源处理器的CNN加速模块的设计及实现[J].微电子学与计算机,2018,35(4):17-21. 被引量：6
4曾珍珍.一种计算机视觉算法的图像处理技术[J].信息技术,2018,42(4):74-78. 被引量：8
5王昆,周骅.深度学习中的卷积神经网络系统设计及硬件实现[J].电子技术应用,2018,44(5):56-59. 被引量：7
6肖皓,祝永新,汪宁,田犁,汪辉.面向卷积神经网络的FPGA硬件加速器设计[J].工业控制计算机,2018,31(6):99-101. 被引量：2
7杨景明,杜韦江,吴绍坤,李良,魏立新.基于FPGA的BP神经网络硬件实现及改进[J].计算机工程与设计,2018,39(6):1733-1737. 被引量：6
8王开宇,生梦林,韩睿,李伯轩,刘晨阳,申人升.卷积神经网络的FPGA实现及优化[J].实验室科学,2018,21(4):79-84. 被引量：2
9张庭略.基于硬件的神经网络加速[J].通讯世界,2018,0(8):77-79. 被引量：1
10屈家丽,贺光辉,王国兴.语音识别中卷积神经网络的FPGA实现[J].微电子学与计算机,2018,35(9):37-41. 被引量：6

同被引文献124

1华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：8
2赵凤展,杨仁刚.基于短时傅里叶变换的电压暂降扰动检测[J].中国电机工程学报,2007,27(10):28-34. 被引量：127
3林雪原,陈玉林.GPS/DR组合系统的一种数据处理技术[J].武汉大学学报（信息科学版）,2007,32(6):520-522. 被引量：3
4余本国.BP神经网络局限性及其改进的研究[J].山西农业大学学报（自然科学版）,2009,29(1):89-93. 被引量：21
5白帆,孙宁.基于BP神经网络的舰船组合导航算法研究[J].舰船电子工程,2013,33(2):50-51. 被引量：3
6刘伟,陈鸿昶,黄瑞阳.基于Tree-based CNN的关系抽取[J].中文信息学报,2018,32(11):34-40. 被引量：10
7高薇,曾健民.基于卷积神经网络算法的图像识别应用研究[J].西安文理学院学报（自然科学版）,2019,22(1):10-14. 被引量：8
8陶欧,张燕玲,陈茜,王耘,乔延江.基于灰度共生矩阵的中药饮片横切面图像纹理特征参数的提取[J].世界科学技术-中医药现代化,2014,16(12):2531-2537. 被引量：14
9陶欧,林兆洲,张宪宝,王耘,乔延江.基于饮片切面图像纹理特征参数的中药辨识模型研究[J].世界科学技术-中医药现代化,2014,16(12):2558-2562. 被引量：20
10江燕,王敬东.图像处理在平面零件分拣控制中的应用[J].电气传动,2015,45(2):76-80. 被引量：5

引证文献14

1裴悦琨,谷宇,连明月.基于FPGA的快速樱桃缺陷检测与识别系统设计[J].食品与机械,2020,36(8):129-134. 被引量：4
2刘姜,郭景武,付子峰,刘春堂,李龙云.基于卷积神经网络的电力杆塔图像智能识别算法研究[J].自动化应用,2020(9):52-53. 被引量：3
3莫建麟,王玉晶.面向嵌入式的卷积神经网络图像分类算法[J].黑龙江工业学院学报（综合版）,2020,20(10):56-59. 被引量：3
4粟炜,宗容,张强,奎皓然,杨宏波,王威廉.先心病心音CNN分类算法的硬件加速[J].计算机工程与设计,2021,42(6):1599-1605. 被引量：1
5文化,张田剑南.基于人工智能的嵌入式图像识别信息采集系统[J].信息技术,2021,45(7):114-118. 被引量：7
6刘加峰,高子啸,段元民,李海云,石宏理.基于深度学习的中药材饮片图像识别[J].北京生物医学工程,2021,40(6):605-608. 被引量：7
7彭泽武,蔡雄,杨秋勇,苏华权.基于FPGA的深度卷积神经网络优化压缩算法研究[J].计算技术与自动化,2021,40(4):74-78. 被引量：2
8王伟丽,杨瑞峰,郭晨霞,秦浩.卷积神经网络在舵机异常检测中的应用[J].航天控制,2021,39(6):49-53. 被引量：1
9赵乐宁,李杰,冯凯强,魏晓凯.GPS失锁时的RBF神经网络辅助组合导航算法[J].航天控制,2022,40(3):37-43. 被引量：3
10林朋雨,郭杰.基于FPGA的卷积神经网络加速优化方法[J].计算机仿真,2022,39(7):371-374. 被引量：2

二级引证文献35

1牟怦善.天津工业全面上水平要增强四个意识[J].企业之友,2000(2):7-8.
2闫文虎,陈宏利,姚宗强,孙浩航,詹云腾.电力基建安全违章行为智能识别系统的设计与实现[J].自动化与仪器仪表,2021(3):135-138. 被引量：1
3李佳琪,杨超宇.基于深度学习的工业工件字符识别[J].黑龙江工业学院学报（综合版）,2021,21(4):86-91.
4肖连军,张鸿恺.基于状态机的充电桩控制系统设计[J].黑龙江工业学院学报（综合版）,2021,21(5):74-82.
5李晨曦,娄根,李慧姝,方武.面向电力场景作业机器人的目标检测方法研究[J].现代计算机,2021,27(18):109-112. 被引量：1
6胡晨熙,范红,林威,于淑雨,杨天择.基于单幅图像超分辨率重建的在线考勤系统[J].电子技术与软件工程,2022(2):169-172.
7刘芬香.基于人工智能的嵌入式图像识别信息采集系统的应用[J].IT经理世界,2021,24(11):27-28.
8许彩芳.基于SDSoC散列函数改进的互联网信息安全技术研究[J].曲靖师范学院学报,2022,41(6):38-42.
9曾凌霄,刘子豪,严志鹏,赵堃,刘浩.多通道次品虾自动剔除系统构建及关键控制参数优化[J].食品与机械,2022,38(11):105-110.
10邹倩倩,杨瑞峰,郭晨霞.一种基于二维卷积神经网络的舵机故障检测方法[J].航天控制,2022,40(6):80-85. 被引量：1

1童志波,原彤彤,苏新彦.基于System Generator的光场重聚焦算法的设计与实现[J].国外电子测量技术,2019,38(2):70-75.
2张灏.数字信号处理系统的硬件加速设计[J].科学技术创新,2018(31):76-77.
3张开来.高校教学软件研究:现状、问题及解决方案[J].科学与信息化,2019,0(1):125-125.
4涂碧波.软硬件协同:我国计算机安全体系结构获突破[J].前沿科学,2018,12(4):87-91.
5李文武,孙书为,郭阳.基于梯度的H.265/HEVC帧内预测硬件加速算法研究[J].计算机工程与科学,2019,41(4):575-582. 被引量：8
6杨流,方方,唐瑞,高严,隋清圣.基于ZYNQ的人脸检测实现[J].计算机产品与流通,2019,0(2):108-108. 被引量：1
7王丹.油田开采工程中的电气技术应用[J].中国设备工程,2019(7):219-221.
8廖小飞,沈立,喻之斌,陈海波.编译技术走向:从通用处理器到专用加速器[J].前沿科学,2018,12(4):76-81.
9李琪,张欣,张平康,张航.基于Spark框架的CFSFDP改进算法[J].电子科技,2019,32(5):38-43. 被引量：3
10徐炳杰,陈建乐.党旗飘在工地上中国移动浙江公司舟山分公司党委党建融入生产实践[J].通信企业管理,2019(2):25-27.

航天控制

2019年第1期

浏览历史

内容加载中请稍等...

基于卷积神经网络图像识别算法的加速实现方法被引量：14

参考文献4

二级参考文献25

共引文献58

同被引文献124

引证文献14

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络图像识别算法的加速实现方法 被引量：14

参考文献4

二级参考文献25

共引文献58

同被引文献124

引证文献14

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络图像识别算法的加速实现方法被引量：14