轻量化神经网络加速器的设计与实现被引量：8

Design and Implementation of Accelerator for Lightweight Neural Network

下载PDF

导出

摘要针对以MobileNet为代表的轻量化卷积网络,基于现场可编程门阵列平台设计网络加速器。通过优化DW、PW轻量化模块并实现常用的卷积、ReLU等功能模块,满足神经网络加速器低功耗、低时延的要求,同时基于指令设计使加速器支持MobileNet及各类变种。利用上位机配置YoloV3 tiny(不含轻量模块)指令和YoloV3&MobileNet(含轻量模块)指令进行目标检测,实验结果表明,该网络加速器具有较快的推断速度,用于YoloV3tiny结构时达到85frame/s,用于YoloV3&MobileNet结构时达到62frame/s。 This paper designs a network accelerator based on the Field Programmable Gate Array(FPGA)platform for the lightweight convolutional network represented by MobileNet.By optimizing DW and PW lightweight modules and implementing commonly used convolution,ReLU and other functional modules,the neural network accelerator meets the requirements of low power consumption and low latency.At the same time,based on instruction-based design technology,the neural network accelerator supports MobileNet and its various variants.By configuring the target detection experiment of YoloV3 tiny(without lightweight modules)instructions and YoloV3&MobileNet(including lightweight modules)instructions on the host computer,the neural network accelerator can reach a faster inference speed.It reaches 85 frame/s for the YoloV3 tiny structure,reaches 62 frame/s for YoloV3&MobileNet structure.

作者黄瑞金光浩李磊姜文超宋庆增 HUANG Rui;JIN Guanghao;LI Lei;JIANG Wenchao;SONG Qingzeng(School of Computer Science and Technology,Tianjin Polytechnic University,Tianjin 300387,China;Faulty of Computer,Guangdong University of Technology,Guangzhou 510006,China)

机构地区天津工业大学计算机科学与技术学院广东工业大学计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第9期185-190,196,共7页 Computer Engineering

基金广东省自然科学基金(2018A030313061) 广东省科技计划项目(2017B010124001,201902020016,2019B010139001)。

关键词硬件加速模型压缩轻量化神经网络现场可编程门阵列并行计算 hardware acceleration model compression lightweight neural network Field Programmable Gate Array(FPGA) parallel computing

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1崔小乐,陈红英,崔小欣,张兴.一种软硬件协同设计工具原型及其设计描述方法[J].微电子学与计算机,2007,24(6):28-30. 被引量：4
2卢冶,陈瑶,李涛,蔡瑞初,宫晓利.面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J].计算机研究与发展,2018,55(3):551-562. 被引量：47
3李欣瑶,刘飞阳,文鹏程,李鹏.卷积神经网络的软硬件协同加速技术[J].航空兵器,2021,28(3):99-104. 被引量：6

二级参考文献13

1崔小乐,张兴,闵俊,崔小欣,胡建军.Wright语言的实时扩展[J].微电子学与计算机,2006,23(3):11-15. 被引量：1
2崔小乐,陈红英,崔小欣,张兴.一种软硬件协同设计工具原型及其设计描述方法[J].微电子学与计算机,2007,24(6):28-30. 被引量：4
3Daniel D Gajski,Frank Vahid,Sanjuv Narayan,et al.Specification and Design of Embedded Systems[M].边计年,吴为民,译.北京:机械工业出版社,2005
4Jim Davies,Steve Schneider.A brief history of timed CSP[J].Theoretical Computer Science,1995,138 (1):243～271
5Ahmet Feyzi Ates,Murat Bilgic,Senro Saito,et al.Using timed CSP for specification verification and simulation of multimedia synchronization[J].IEEE Journal on Selected Areas in Communications,1996,14(1):126～137
6马久跃,余子濠,包云岗,孙凝晖.体系结构内可编程数据平面方法[J].计算机研究与发展,2017,54(1):123-133. 被引量：2
7施巍松,孙辉,曹杰,张权,刘伟.边缘计算:万物互联时代新型计算模型[J].计算机研究与发展,2017,54(5):907-924. 被引量：499
8夏辉,于佳,秦尧,程相国,陈仁海,潘振宽.嵌入式领域ECC专用指令处理器的研究[J].计算机学报,2017,40(5):1092-1108. 被引量：6
9周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1726
10卢冶,陈瑶,李涛,蔡瑞初,宫晓利.面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J].计算机研究与发展,2018,55(3):551-562. 被引量：47

共引文献51

1丁祥海,王志会.边缘计算在计算机科学方向的进展研究[J].信息与管理研究,2019,0(6):73-83.
2刘雷,刘大卫,王晓光,陈俊男,刘东兴.无人机集群与反无人机集群发展现状及展望[J].航空学报,2022,43(S01):4-20. 被引量：35
3张舰.父亲(外一首)[J].岁月,2000(7):60-60.
4邓向武,齐龙,马旭,蒋郁,陈学深,刘海云,陈伟烽.基于多特征融合和深度置信网络的稻田苗期杂草识别[J].农业工程学报,2018,34(14):165-172. 被引量：51
5张庭略.基于硬件的神经网络加速[J].通讯世界,2018,0(8):77-79. 被引量：1
6任卫欣.基于FPGA的硬件加速系统[J].电子制作,2018,26(23):73-76. 被引量：1
7宋铁.基于卷积神经网络的GFW加速调度算法[J].软件,2019,40(3):217-221.
8袁柳,李皓,李勐,涂吉.基于PCIe高速通信接口的图像处理系统设计[J].科学技术与工程,2019,19(22):235-240. 被引量：6
9陈辰,柴志雷,夏珺.基于Zynq7000 FPGA异构平台的YOLOv2加速器设计与实现[J].计算机科学与探索,2019,13(10):1677-1693. 被引量：20
10张立立,王力.新一代人工智能交通信号控制器架构研究[J].重庆交通大学学报（自然科学版）,2019,38(11):6-13. 被引量：9

同被引文献57

1卫建华,刘润利,许佳豪,尚晓峰.基于PYNQ框架的人体目标跟踪系统[J].国外电子测量技术,2021,40(12):89-95. 被引量：8
2余小龙,胡学奎.GPS RTK技术的优缺点及发展前景[J].测绘通报,2007(10):39-41. 被引量：108
3何中翔,杨世洪.基于CameraLink的实时显示技术研究[J].现代显示,2008(10):31-35. 被引量：7
4姜义.光电编码器的原理与应用[J].传感器世界,2010,16(2):16-19. 被引量：43
5沈鸽,王美娇,嵇晓强.基于CameraLink的视频图像采集与传输系统[J].微计算机信息,2011,27(8):99-100. 被引量：17
6王瑞峰,马学霞,王彦快.RFID技术的定位改进算法在铁路隧道人员定位中的应用[J].铁道学报,2012,34(10):68-71. 被引量：25
7张志佳,李文强,张丹,钟玲.基于颜色与形状特征的交通标志检测方法[J].计算机技术与发展,2015,25(7):174-178. 被引量：11
8卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：551
9赵昕,祁蒙.基于CameraLink标准的多路红外图像采集处理系统[J].激光与红外,2016,46(7):862-865. 被引量：5
10彭丽宇,王登阳,张俊生.朔黄铁路综合检测列车定位同步技术研究[J].铁道建筑,2017,57(2):129-132. 被引量：6

引证文献8

1蒋翼浓,张世义.交通标志识别技术综述[J].汽车工程师,2021(8):15-18. 被引量：2
2王伟,穆洪云.基于ANSYS液压缸缸筒的模态分析和轻量化设计[J].液压气动与密封,2022,42(7):15-19. 被引量：3
3焦禹铭,吴凯,郭风祥,王昭,宋庆增.基于专用卷积神经网络加速器的编译器设计与实现[J].计算机应用,2022,42(S01):208-214. 被引量：1
4缪丹丹,张鹏,张鑫宇,崔敏.基于ZYNQ平台的通用卷积加速器设计[J].国外电子测量技术,2022,41(11):72-77. 被引量：4
5孙小坚,林瑞全,方子卿,马驰.基于FPGA加速的低功耗的MobileNetV2 网络识别系统[J].计算机测量与控制,2023,31(5):221-227. 被引量：2
6毕江海.基于目标识别的轨旁设备定测装置研究[J].铁道建筑技术,2023(6):126-129.
7陈逸,刘博生,徐永祺,武继刚.混合精度频域卷积神经网络FPGA加速器设计[J].计算机工程,2023,49(12):1-9.
8方子卿,林瑞全,孙小坚.基于FPGA的CNN分类器设计[J].电气开关,2024,62(1):64-68.

二级引证文献12

1刘丽景.基于深度学习的交通标志识别研究[J].单片机与嵌入式系统应用,2021,21(11):14-17.
2郭朦,陈紫强,邓鑫,梁晨.基于YOLOv5l和ViT的交通标志检测识别方法[J].科学技术与工程,2022,22(27):12038-12044. 被引量：5
3刘尚,吴晗,郭霄霞,王凤娟.基于技术冲突矩阵与ANSYS Workbench结合的X型驳接爪轻量化设计[J].齐齐哈尔大学学报（自然科学版）,2022,38(6):11-16.
4赵小芳,窦全胜,姜云霄.动态模糊逻辑程序设计语言编译器的实现[J].吉林大学学报（信息科学版）,2023,41(3):503-511.
5戴伟杰,王衍学,李昕鸣,王祎颜.面向FPGA部署的改进YOLO铝片表面缺陷检测系统[J].电子测量与仪器学报,2023,37(9):160-167. 被引量：1
6肖雪丽,冷颖雄,谢洁芳,邓茵,周彦吉.基于端到端模型的档案电子化系统设计[J].机电工程技术,2024,53(1):176-179. 被引量：1
7陈思浩,吴黎明,彭克锦,许志杰.基于ZYNQ平台的卷积神经网络加速器设计与实现[J].自动化与信息工程,2024,45(1):30-34. 被引量：1
8柴浩,白付维,周康,张婷婷,刘国军,姚平喜.双作用多级钛/铝复合液压缸的轻量化设计及校核[J].液压气动与密封,2024,44(5):116-121. 被引量：1
9李宁,肖昊.基于FPGA的稀疏卷积神经网络加速器设计[J].电子测量技术,2024,47(5):1-8.
10胡金波,常泓,潘智勇,仝继钢,李旭东.一种机载医疗供氧设备的设计与实现[J].液压气动与密封,2024,44(6):80-84.

1丁文锐,刘春蕾,李越,张宝昌.二值卷积神经网络综述[J].航空学报,2021,42(6):181-195. 被引量：5
2张江永,徐智勇,张建林,许涛.基于敏感度的YOLO网络集成剪枝算法[J].计算机工程,2021,47(9):59-68. 被引量：3
3张有波,郭威,周悦,徐高飞,李广伟,孙洪鸣.基于多粒度剪枝的水下遗迹实时目标检测[J].激光与光电子学进展,2021,58(14):278-287. 被引量：7
4刘逢丁,曹杰,王营博,闫雷.激光雷达距离像的实时边缘检测[J].光学技术,2021,47(4):404-409. 被引量：3
5龚成,卢冶,代素蓉,刘方鑫,陈新伟,李涛.一种超低损失的深度神经网络量化压缩方法[J].软件学报,2021,32(8):2391-2407. 被引量：5
6王阳,丁召,宋家勇,赵广文,边历峰,杨晨.基于改进U-Net的量子点STM图像分割[J].原子与分子物理学报,2021,38(4):87-92. 被引量：1

计算机工程

2021年第9期

浏览历史

内容加载中请稍等...

轻量化神经网络加速器的设计与实现被引量：8

参考文献3

二级参考文献13

共引文献51

同被引文献57

引证文献8

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

轻量化神经网络加速器的设计与实现 被引量：8

参考文献3

二级参考文献13

共引文献51

同被引文献57

引证文献8

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

轻量化神经网络加速器的设计与实现被引量：8