面向嵌入式的卷积神经网络硬件加速器设计被引量：4

Design of Hardware Accelerator for Embedded Convolutional Neural Network

下载PDF

导出

摘要近年来,随着神经网络模型越来越复杂,针对卷积神经网络推理计算所需内存空间过大,限制其在嵌入式设备上部署的问题,提出一种动态多精度定点数据量化硬件结构,使用定点数代替训练后推理过程中的浮点数执行卷积运算。结果表明,采用16位动态定点量化和并行卷积运算硬件架构,与静态量化策略相比,数据准确率高达97.96%,硬件单元的面积仅为13740门,且内存占用量和带宽需求减半。相比Cortex M4使用浮点数据做卷积运算,该硬件加速单元性能提升了90%以上。 In recent years,neural network models become more and more complex.Aiming at the large memory space required for convolutional neural network inference calculations,which limits its deployment on embedded devices,a dynamic multi-precision fixed-point data quantization hardware structure is proposed.It uses fixed-point data instead of floating-point data during neural network inference to perform convolutional operations.The results show that compared with the static quantization strategy,using a 16 bit fixed-point dynamic quantization and parallel convolutional operation hardware architecture,data accuracy is up to 97.96%.The hardware unit area is only 13740 gates,and the memory footprint and bandwidth requirement are reduced 50%.In addition,compared with Cortex M4,which performs convolutional operations using floating-point data,the embedded system SoC performance is improved more than 90%.

作者唐蕊焦继业徐华昊 TANG Rui;JIAO Jiye;XU Huahao(School of Computer Science&Technology,Xi’an University of Posts&Telecommunications,Xi’an 710121,China)

机构地区西安邮电大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2021年第4期252-257,共6页 Computer Engineering and Applications

基金国家自然科学基金(61874087)。

关键词卷积神经网络嵌入式设备动态多精度定点数据量化并行卷积运算硬件架构 convolutional neural network embedded devices dynamic multi-precision fixed-point data quantization parallel convolutional operation hardware architecture

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献12

1张亚倩.卷积神经网络研究综述[J].信息通信,2018,31(11):27-29. 被引量：11
2赵彤,乔庐峰,陈庆华.一种基于FPGA的CNN加速器设计[J].通信技术,2019,52(5):1242-1248. 被引量：6
3蔡瑞初,钟椿荣,余洋,陈炳丰,卢冶,陈瑶.面向“边缘”应用的卷积神经网络量化与压缩方法[J].计算机应用,2018,38(9):2449-2454. 被引量：18
4翟社平,邱程,杨媛媛,李婧,江婷婷.基于FPGA的卷积神经网络加速器设计与实现[J].微电子学与计算机,2019,36(8):83-86. 被引量：9
5邓天传,胡振波.一种超低功耗的RISC-V处理器流水线结构[J].电子技术应用,2019,45(6):50-53. 被引量：9
6曾成龙,刘强.面向嵌入式FPGA的高性能卷积神经网络加速器设计[J].计算机辅助设计与图形学学报,2019,31(9):1645-1652. 被引量：10
7张榜,来金梅.一种基于FPGA的卷积神经网络加速器的设计与实现[J].复旦学报（自然科学版）,2018,57(2):236-242. 被引量：15
8董夙慧.计算机中定点数与浮点数表示范围大小的研究[J].中国西部科技,2011,10(22):38-38. 被引量：5
9李嘉辉,蔡述庭,陈学松,熊晓明.基于FPGA的卷积神经网络的实现[J].自动化与信息工程,2018,39(1):32-37. 被引量：7
10陈莉君,李卓.基于深度神经压缩的YOLO加速研究[J].现代计算机,2019,25(11):3-7. 被引量：2

二级参考文献29

1曾国荪.改善神经网络反向传播算法的训练时间[J].小型微型计算机系统,1996,17(11):69-72. 被引量：2
2计算机组成原理与系统结构[M].国防工业出版社,2006-08-01.
3白中英.计算机组成原理[M].科学出版社,2000-11-01.
4吴晓红.反馈神经网络的一种反向传播算法[J].系统工程与电子技术,1999,21(9):65-67. 被引量：4
5董夙慧.计算机中定点数与浮点数表示范围大小的研究[J].中国西部科技,2011,10(22):38-38. 被引量：5
6郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(2):175-184. 被引量：147
7刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014,31(7):1921-1930. 被引量：291
8樊雅琴,王炳皓,王伟,唐烨伟.深度学习国内研究综述[J].中国远程教育,2015(6):27-33. 被引量：88
9刘琦,黄咨,陈璐艳,胡福乔.基于GPU的卷积检测模型加速[J].计算机应用与软件,2016,33(5):226-230. 被引量：4
10李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：556

共引文献130

1李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104. 被引量：1
2Peng Liu,Wei Jiang,Xiaohui Wang,Hongmin Li,Hongjian Sun.Research and application of artificial intelligence service platform for the power field[J].Global Energy Interconnection,2020,3(2):175-185. 被引量：3
3王军.浮点数的指数和尾数的研究[J].电脑编程技巧与维护,2012(24):6-6. 被引量：1
4张绕,张建勋,代煜,尚翰,李叶丹.基于FPGA的机器人正逆运动学算法实现[J].南开大学学报（自然科学版）,2018,51(6):18-23. 被引量：1
5陈书敏.浮点数的整除与取余[J].福建电脑,2017,33(8):42-43.
6任卫欣.基于FPGA的硬件加速系统[J].电子制作,2018,26(23):73-76. 被引量：1
7汪成龙,陈均泳,陈国壮,姚启晨,钟智威.基于深度学习的马铃薯机械损伤检测方法应用研究[J].电子测量技术,2018,41(20):118-122. 被引量：1
8王昆,周骅.基于深度学习的实时识别硬件系统框架设计[J].电子技术应用,2018,44(10):11-14. 被引量：3
9曾凡婧,雷鸣.基于卷积神经网络的花卉识别研究[J].电脑知识与技术,2019,15(4Z):185-188. 被引量：1
10向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿.基于细粒度数据流架构的稀疏神经网络全连接层加速[J].计算机研究与发展,2019,56(6):1192-1204. 被引量：11

同被引文献46

1任源,潘俊,刘京京,何燕冬,何进.人工智能芯片的研究进展[J].微纳电子与智能制造,2019,1(2):20-34. 被引量：10
2尹首一.人工智能芯片概述[J].微纳电子与智能制造,2019,1(2):7-11. 被引量：16
3施乐平,杨征宇,马宪民,汤元会.ARM嵌入式系统综述[J].中国测试,2012,38(S1):14-16. 被引量：15
4刘晓芳,刘会金,陈允平.人工智能技术在电能质量分析中的应用[J].电工技术杂志,2004,26(12):66-70. 被引量：9
5张利敏,丁坚勇.嵌入式技术及其在电力系统中的应用[J].继电器,2002,30(3):43-46. 被引量：19
6宋琦,牟晓光.嵌入式图像处理系统设计[J].信息技术与信息化,2015(3):184-186. 被引量：5
7张晓蕾.嵌入式技术及其在电力系统中的应用[J].信息系统工程,2016,29(2):42-42. 被引量：4
8衡思坤,张自伟,周光宇,王清华,朱立位,白宇,刘清瑞.变电站作业安全管控系统研究[J].江苏电机工程,2016,35(2):31-33. 被引量：9
9彭向阳,吴功平,金亮,王柯,王锐,宋晖.架空输电线路智能机器人全自主巡检技术及应用[J].南方电网技术,2017,11(4):14-22. 被引量：22
10周俊宇,赵艳明.卷积神经网络在图像分类和目标检测应用综述[J].计算机工程与应用,2017,53(13):34-41. 被引量：134

引证文献4

1沙文馨.一款新型智能垃圾桶的设计研究[J].计算机产品与流通,2020,9(7):83-83. 被引量：4
2李聪,毛剑琳,李大焱,马昭,罗楦皓.一种面向轻量型卷积神经网络的嵌入式图像识别系统[J].自动化与仪器仪表,2021(1):152-155. 被引量：6
3周胤宇,王波,朱丹蕾,马富齐,罗鹏,王红霞.基于AI芯片的电力边缘智能终端:结构框架及其应用场景[J].电力信息与通信技术,2021,19(9):77-85. 被引量：6
4周理,赵祉乔,潘国腾,铁俊波,赵王.基于RISC-V的图卷积神经网络加速器设计[J].计算机工程与科学,2023,45(12):2113-2120.

二级引证文献16

1陈艳丽,刘静,杨树蔚,邢静,刘叶楠,任郁苗,闫克丁.小型PCB焊接图像采集系统设计[J].国外电子测量技术,2022,41(4):106-111. 被引量：2
2汪小芬,赵杨.智能创造—GS新型环保垃圾桶设计研究[J].电子制作,2020,28(22):33-35.
3蔡梦玲,赵杨.智能环保垃圾桶的营销策略探析[J].时代经贸,2020(30):31-33. 被引量：1
4千月欣,王永忠,李佳骏,徐天羿.基于深度学习的机场能见度预测研究[J].云南民族大学学报（自然科学版）,2021,30(6):615-620. 被引量：4
5刘浩,赵伟,温克欢,何恒靖,李世松,黄松岭.低压配电台区模组化智能融合终端构建方案与实现[J].电测与仪表,2022,59(1):168-175. 被引量：17
6左露洁,张幔,狄雨洋,肖权珈,刘冬阳,李硕.易分宝——智慧城市自动分类垃圾桶系统设计[J].资源信息与工程,2022,37(1):117-120. 被引量：1
7吕汝金,苏庚辰,徐永博.一种智能分类垃圾桶的设计研究[J].机械设计与制造,2022(7):232-234. 被引量：5
8徐微,李彤,李守智.基于卷积神经网络的教室灯光识别算法研究[J].电子设计工程,2022,30(17):28-31.
9曹朋军,傅哲.图像处理算法在电力设备智能化改造中的应用[J].电力设备管理,2022(18):106-108.
10伍攀峰,吴宝林,王允森,朱其星,王明贺,郭清源,杨宁,徐明道.一种星载图像智能处理装置设计与实现[J].空间控制技术与应用,2022,48(5):78-85. 被引量：1

1张英,韦闽峰,王世会,陶磊岩,曹健,张兴.飞行器强化学习多模在轨控制[J].西安电子科技大学学报,2020,47(2):75-82. 被引量：1
2成玉荣,陈湘军,杜晨浩,胡海洋.基于改进YOLO的公路路网视频并发检测及应用[J].实验室研究与探索,2020,39(10):50-55. 被引量：3
3冯艳清,李德生,熊爱金.基于定点DSP的自然对数运算快速算法[J].电脑知识与技术,2019,15(11):294-295.
4黄家明,陈寰,史庆杰,陈海宝.基于FPGA的红外目标识别神经网络加速器设计[J].飞控与探测,2020,3(6):66-75. 被引量：2
5周绍景,王毅,余雯,孙土土.基于物联网技术的边缘计算研究[J].价值工程,2020,39(36):195-196.
6郭迎钢,李宗春,何华,张冠宇,冯其强,杨浩.变形监测网稳定点选取的平方型Msplit相似变换法[J].测绘学报,2020,49(11):1419-1429. 被引量：3
7陈真诚,魏子宁,严波文,张悦.一种活体多通道生理生化检测仪的设计[J].现代电子技术,2021,44(4):27-31.
8姚良,渠聚鑫,姚晓光,李鸿斌.复合材料各向异性摩擦特性测试实验装置改进设计[J].实验技术与管理,2020,37(11):131-134.
9冷令,吴伟斌,张伟杰,罗安生.基于改进PSO算法的多温室物联网群控终端变量协调控制研究[J].中国农机化学报,2021,42(1):179-185. 被引量：3
10王昌世.通过计算分度函数及反函数实现热电偶高精度测温[J].电子产品世界,2021,28(2):69-71. 被引量：2

计算机工程与应用

2021年第4期

浏览历史

内容加载中请稍等...

面向嵌入式的卷积神经网络硬件加速器设计被引量：4

参考文献12

二级参考文献29

共引文献130

同被引文献46

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

面向嵌入式的卷积神经网络硬件加速器设计 被引量：4

参考文献12

二级参考文献29

共引文献130

同被引文献46

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

面向嵌入式的卷积神经网络硬件加速器设计被引量：4