面向卷积神经网络加速器吞吐量优化的FPGA自动化设计方法被引量：8

Throughput-oriented Automatic Design of FPGA Accelerator for Convolutional Neural Networks

下载PDF

导出

摘要针对卷积神经网络FPGA加速器的资源分配与频率设置欠佳导致吞吐量受限的问题,提出一种面向吞吐量优化的自动化设计方法.首先将加速器的设计分为并行策略和频率设计,提出总体设计流程;然后将设计空间探索建模为线段分割问题,采用遗传算法及贪心算法求解;最后根据求解出的并行策略完成加速器的结构设计,根据求解出的预期运行频率对加速器的布局布线优化,使实际频率可以达到预期.对AlexNet及VGG-16模型在目标器件AlteraDE5a-Net的设计实验结果表明,文中方法能有效地提升资源使用效率并给出合理频率设置;相比于其他卷积神经网络FPGA加速器设计方法,该方法可提升AlexNet和VGG-16的吞吐量82.95%和66.19%. The throughput of FPGA accelerator for convolutional neural network(CNN)is determined by parallel strategies and frequency.A throughput-oriented automatic design method is proposed in this paper.Firstly,an automatic design flow is proposed for the parallel strategy and the frequency of the accelerator.Then the design space exploration is formulated as a segment partition problem and is solved by a genetic and greedy algorithm.Finally,the FPGA accelerator design is implemented with the explored parallel strategy.The frequency of the accelerator is considered at the placement and routing stage to meet the design expectation.Two typical CNN models AlexNet and VGG-16 were implemented on the Altera DE5a-Net board by using the proposed method.The experimental results demonstrated that,the throughputs of AlexNet and VGG-16 could be improved by 82.95%and 66.19%respectively,in comparison with the state-of-the-art FPGA accelerators.

作者陆维娜胡瑜叶靖李晓维 Lu Weina;Hu Yu;Ye Jing;Li Xiaowei(State Key Laboratory of Computer Architecture,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190;University of Chinese Academy of Sciences,Beijing 100190)

机构地区中国科学院计算技术研究所计算机体系结构国家重点实验室中国科学院大学

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2018年第11期2164-2173,共10页 Journal of Computer-Aided Design & Computer Graphics

基金国家自然科学基金(61274030 61521092 61532017 61376043 61704174)

关键词 FPGA 卷积神经网络加速器吞吐量自动化并行设计 FPGA convolutional neural network accelerator throughput automatic parallel design

分类号 TP338.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献43

1李园,高家祺,马小霞,夏加高.基于FPGA图像处理的研究现状与热点分析[J].电子技术（上海）,2021,50(7):1-3. 被引量：5
2周欣,吴瑛.核Fisher判别分析在数字信号分类中的应用[J].北京邮电大学学报,2011,34(1):35-39. 被引量：19
3胡锦涛,李路,姚如贵,高岩.基于FPGA的面积有效FFT实现技术研究[J].电子设计工程,2016,24(8):94-97. 被引量：4
4李俊华,白鹤举.基于Hybrid样本的学习过程一致收敛速度的界[J].河北大学学报（自然科学版）,2016,36(2):113-116. 被引量：2
5李鸣,张鸿.基于卷积神经网络迭代优化的图像分类算法[J].计算机工程与设计,2017,38(1):198-202. 被引量：18
6彭顺正,坎杂,李景彬.矮化密植枣园收获作业视觉导航路径提取[J].农业工程学报,2017,33(9):45-52. 被引量：41
7张慧,王坤峰,王飞跃.深度学习在目标视觉检测中的应用进展与展望[J].自动化学报,2017,43(8):1289-1305. 被引量：245
8陈江昀.一种基于深度学习的新型小目标检测方法[J].计算机应用与软件,2017,34(10):227-231. 被引量：14
9唐贤伦,刘庆,张娜,周家林.混合PSO优化卷积神经网络结构和参数[J].电子科技大学学报,2018,47(2):230-234. 被引量：10
10白琮,黄玲,陈佳楠,潘翔,陈胜勇.面向大规模图像分类的深度卷积神经网络优化[J].软件学报,2018,29(4):1029-1038. 被引量：63

引证文献8

1高宗斌,崔永杰,李凯.基于T-YOLO-LITE树干检测的模型部署方法[J].计算机应用与软件,2021,38(2):132-139. 被引量：3
2刘杰,葛一凡,田明,马力强.基于ZYNQ的可重构卷积神经网络加速器[J].电子学报,2021,49(4):729-735. 被引量：10
3梁修壮,倪伟.FPGA加速器深度卷积神经网络优化计算方法[J].计算机仿真,2022,39(5):314-318. 被引量：2
4林朋雨,郭杰.基于FPGA的卷积神经网络加速优化方法[J].计算机仿真,2022,39(7):371-374. 被引量：3
5王蕊,张旭,韩宇迪,王开宇.基于FPGA的数字识别装置设计与仿真[J].工业和信息化教育,2022(10):85-89. 被引量：2
6吴雯丽,陈治铭,莫梓健,赵元睿,齐轩.基于FPGA卷积神经网络的人脸识别系统[J].物联网技术,2023,13(2):3-6. 被引量：3
7黄沛昱,赵强,李煜龙.基于FPGA的卷积神经网络硬件加速器设计[J].计算机应用与软件,2023,40(3):38-44. 被引量：3
8龚宇,王丽萍,王佑,刘伟强.近似计算新范式在深度学习加速系统中的应用及研究进展[J].电子与信息学报,2023,45(9):3098-3108.

二级引证文献26

1程宏,张春磊,翁婷,徐昆昆,陈俊.基于深度学习的纸芯塞有无检测系统设计与实现[J].中国造纸,2022,41(S01):68-73.
2杜忠文,李庚霖,蒋菡,褚江恒,伍俊.基于次级缓存的SDRAM调度策略的研究[J].电子测量技术,2023,46(14):37-42. 被引量：1
3袁海英,曾智勇,成君鹏.面向灵活并行度的稀疏卷积神经网络加速器[J].电子学报,2022,50(8):1811-1818. 被引量：2
4HOU Yupeng,ZHANG Lei,WANG Yuanquan,ZHAO Xiaosong,FENG Guoce,ZHANG Yirui.Field rapid detection method of wind turbine blade fixing bolt defects based on FPGA[J].Optoelectronics Letters,2022,18(9):541-546.
5郭联金.多感知水果抓取及分拣控制系统的设计[J].包装与食品机械,2022,40(6):89-94. 被引量：5
6刘晛,吴瑞琦,高尚尚,刘泽浩,刘海波,孔祥晔,王庆,郭乃宏,周锋,王如刚.基于ZYNQ的通用型卷积神经网络设计与实现[J].电子器件,2023,46(1):121-125. 被引量：2
7黄赟,张帆,郭威,陈立,羊光.一种基于数据标准差的卷积神经网络量化方法[J].电子学报,2023,51(3):639-647. 被引量：2
8王鑫,张铭.基于申威众核架构的分组卷积计算加速与优化[J].计算机应用研究,2023,40(6):1745-1749. 被引量：1
9王莹,王晶,高岚,吕旭,张伟功.一种注意力机制优化方法及硬件加速设计[J].电子学报,2023,51(4):1021-1029. 被引量：1
10芮梓轩,汪海兵,曾芳玲,徐煦.生成式GPS欺骗干扰算法设计与软件无线电的实现[J].无线电工程,2023,53(7):1652-1659. 被引量：2

1陈绍东.基于二次约束及用户组选择的双向中继网络[J].西南师范大学学报（自然科学版）,2018,43(1):25-30. 被引量：1
2叶仕通,万智萍,柯建波,刘少江,倪伟传.基于协作频谱感知和干扰约束的认知异构网络[J].华东师范大学学报（自然科学版）,2017(6):76-84. 被引量：1
3罗霞,赵爽,卢玉丹.城轨地铁车辆Tc车继电器柜布线优化[J].技术与市场,2018,25(8):7-9.
4林森,张杰.警察院校体能课程设置的学生主观体验研究[J].体育科技文献通报,2018,26(5):30-32.
5何剑,张广兴,谢高岗.基于多关联模型的软件定义高密WLAN EDCA机制的吞吐量优化[J].高技术通讯,2018,28(1):15-21. 被引量：3
6李丹丹,姚淑珍,王颖,王森章,谭火彬.基于半监督集成学习的多核设计空间探索[J].北京航空航天大学学报,2018,44(4):792-801.
7贺达廷.城轨电气屏柜布线优化工艺研究[J].技术与市场,2018,25(8):73-74. 被引量：2
8申正,黄剑辉,叶骞.基于改进遗传算法的射电望远镜主动面布线优化[J].中南大学学报（自然科学版）,2018,49(6):1387-1392. 被引量：4
9尹文芹,施韶华,刘音华,李孝辉.基于FPGA实现TDC的布局布线优化方法研究[J].时间频率学报,2018,41(1):27-36. 被引量：5
10任少峰,周俊,张修玉,李玉能,邓涛,蒲恒强.基于BP神经网络模型的爆破对邻近管道振动预测研究[J].矿业研究与开发,2018,38(9):104-108. 被引量：3

计算机辅助设计与图形学学报

2018年第11期

浏览历史

内容加载中请稍等...

面向卷积神经网络加速器吞吐量优化的FPGA自动化设计方法被引量：8

同被引文献43

引证文献8

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

面向卷积神经网络加速器吞吐量优化的FPGA自动化设计方法 被引量：8

同被引文献43

引证文献8

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

面向卷积神经网络加速器吞吐量优化的FPGA自动化设计方法被引量：8