基于FPGA的卷积神经网络加速器研究与设计被引量：2

下载PDF

导出

摘要本文针对Yolo v2目标检测卷积神经网络实现了基于Xilinx Virtex Ultrasale+VCU118的硬件加速,整体采用MCU+FPGA的异构计算架构,MCU采用ArmCortex-M3软核IP布局布线到FPGA开发板中。软件上完成了MCU读取大位宽RAM数据以及中断控制系统的设计,硬件上完成了Yolo v2网络前向传播模型中的卷积、ReLU非线性激活、最大池化等核心模块的设计。PE(Processing Engine)阵列借鉴了eyeriss阵列架构中的行固定流思想,通过精心设计阵列输入数据的格式,将多维卷积拆分成一维卷积,实现多输入特征图、多通道、多卷积核的通用性卷积计算,且利用Chisel3语言实现了一种高度参数化的卷积计算电路生成器,具有计算位宽可调、PE阵列规模可调、PE单元内部存储可调的特点。

作者夏春秋陈世淼

机构地区深圳市唯特视科技有限公司

出处《电子技术与软件工程》 2022年第20期170-177,共8页 ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING

基金基于中国科学院上海微系统与信息技术研究所委托深圳市唯特视科技有限公司开发项目的研究成果,项目名称为红外黑白图像彩色还原技术,项目编号为6142804190408。

关键词卷积神经网络 FPGA Yolo v2 Eyeriss

分类号 TN791 [电子电信—电路与系统] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：616

二级参考文献28

1BENGIO Y, DELALLEAU O. On the expressive power of deep archi- tectures[ C ]//Proc of the 14th International Conference on Discovery Science. Berlin : Springer-Verlag, 2011 : 18 - 36.
2BENGIO Y. Leaming deep architectures for AI[ J]. Foundations and Trends in Machine Learning ,2009,2 ( 1 ) : 1-127.
3HINTON G,OSINDERO S,TEH Y. A fast learning algorithm for deep belief nets [ J ]. Neural Computation ,2006,18 (7) : 1527-1554.
4BENGIO Y, LAMBLIN P, POPOVICI D, et al. Greedy layer-wise training of deep networks [ C ]//Proc of the 12th Annual Conference on Neural Information Processing System. 2006:153-160.
5LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning ap- plied to document recognition[ J]. Proceedings of the iEEE, 1998, 86( 11 ) :2278-2324.
6VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[ C ]//Proc of the 25th International Conference on Machine Learning. New York: ACM Press ,2008 : 1096-1103.
7VINCENT P, LAROCHELLE H, LAJOIE I, et aL Stacked denoising autoencoders:learning useftd representations in a deep network with a local denoising criterion [ J ]. Journal of Machine Learning Re- search ,2010,11 ( 12 ) :3371-3408.
8YU Dong, DENG Li. Deep convex net: a scalable architecture for speech pattern classification [ C]//Proc of the 12th Annual Confe-rence of International Speech Comunication Association. 2011 : 2285- 2288.
9POON H, DOMINGOS P. Sum-product networks:a new deep architec- ture[ C ]//Proc of IEEE Intemational Conference on Computer Vi- sion. 2011:689-690.
10BENGIO Y,LECUN Y. Scaling learning algorithms towards AI[ M]// BOTTOU L,CHAPELLE O, DeCOSTE D,et al. Large-Scale Kernel Machines. Cambridge: MIT Press ,2007:321-358.

共引文献615

1吴秀平,赵咏梅,凌静思.幼儿游戏深度学习行为的支持体系建构[J].教育科学论坛,2024(2):63-66.
2高嵩.深度学习在机场能见度预测中的应用[J].计算机产品与流通,2020,0(4):260-260. 被引量：2
3张永玲.以深度学习为核心的小学数学有效教学策略研究[J].理科爱好者（教育教学版）,2019,0(5):248-249. 被引量：2
4周帆,陈晓蝶,钟婷,吴劲.面向金融科技的深度学习技术综述[J].计算机科学,2022,49(S02):20-36. 被引量：3
5李灿强,夏志方,丁邡.基于人工智能技术的“数字政府”研究[J].中国经贸导刊,2019(5Z):138-139. 被引量：6
6彭婉,田良臣.信息技术支持下促进深度学习的教学研究——基于语文课程的研究[J].汉字文化,2022(15):159-161. 被引量：1
7杨灿.高职《深度学习》课程教学的实施[J].办公自动化,2021,26(16):37-38. 被引量：1
8苑方.基于深度学习的典型神经网络对比分析[J].中国科技纵横,2018,0(19):9-10.
9赵丹琪.人工智能生成物的著作权认定问题研究[J].楚天法治,2018(30):124-127.
10庄宝玲,陈文列.偶发分枝杆菌的超微结构初步观察[J].福建医药杂志,2000,22(1):181-182. 被引量：2

同被引文献6

1张新钰,高洪波,赵建辉,周沫.基于深度学习的自动驾驶技术综述[J].清华大学学报（自然科学版）,2018,58(4):438-444. 被引量：116
2周聖元,杜子东,陈云霁.稀疏神经网络加速器设计[J].高技术通讯,2019,29(3):222-231. 被引量：5
3左艳,黄钢,聂生东.深度学习在医学影像智能处理中的应用与挑战[J].中国图象图形学报,2021,26(2):305-315. 被引量：18
4张萌,张经纬,李国庆,吴瑞霞,曾晓洋.面向深度神经网络加速芯片的高效硬件优化策略[J].电子与信息学报,2021,43(6):1510-1517. 被引量：4
5刘腾达,朱君文,张一闻.FPGA加速深度学习综述[J].计算机科学与探索,2021,15(11):2093-2104. 被引量：11
6刘华,陶冠男,杨文清.卷积神经网络并行化设计及FPGA实现[J].制造业自动化,2022,44(11):147-154. 被引量：3

引证文献2

1张立国,黄文汉,金梅.FPGA实现卷积神经网络加速器[J].高技术通讯,2023,33(10):1060-1067.
2闫家均,熊兴中,黄见,周义卓,邵子扬.基于拟神经突触的概率计算神经网络加速器[J].电子设计工程,2024,32(12):10-16.

1Guangwen Xu,Ying Zheng.Editorial Preface[J].Carbon Resources Conversion,2018,1(1):1-1.
2黄霞,张冰洋.基于DE1-SoC的模块化数字系统实验箱的研制[J].电子制作,2023,31(1):86-88. 被引量：1
3Neha Verma,Dheeraj Malhotra,tinder Singh.Big data analytics for retail industry using MapReduce-Apriori framework[J].Journal of Management Analytics,2020,7(3):424-442. 被引量：1
4丁琮琮,黄陆平.宽带日志上传自动化设计与实践[J].广播电视网络,2023,30(2):100-102. 被引量：1
5杜玉远,闫爱云.基于FPGA的视频编码系统设计与实现[J].集成电路应用,2022,39(12):1-3.
6肖俊杰,董诚卓,高峰,詹伟强,程学武,杨国韬,林兆祥.中高层大气激光雷达智能化运行系统的实现[J].计算机与数字工程,2022,50(11):2386-2392.
7李林,刘永芳.基于FPGA的物联网环境监测数据传输系统设计与实现[J].自动化与仪器仪表,2022(11):156-160. 被引量：5
8Peter Woodgate,Isabel Coppa,Suelynn Choy,Stuart Phinn,Lesley Arnold,Matt Duckham.The Australian approach to geospatial capabilities;positioning,earth observation,infrastructure and analytics:issues,trends and perspectives[J].Geo-Spatial Information Science,2017,20(2):109-125. 被引量：1
9刘晨.图像清晰化系统设计与实现[J].喀什大学学报,2022,43(6):71-74. 被引量：1
10Azra Nazir,Roohie Naaz Mir,Shaima Qureshi.Exploring compression and parallelization techniques for distribution of deep neural networks over Edge-Fog continuum-a review[J].International Journal of Intelligent Computing and Cybernetics,2020,13(3):331-364.

电子技术与软件工程

2022年第20期

浏览历史

内容加载中请稍等...

基于FPGA的卷积神经网络加速器研究与设计被引量：2

参考文献1

二级参考文献28

共引文献615

同被引文献6

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络加速器研究与设计 被引量：2

参考文献1

二级参考文献28

共引文献615

同被引文献6

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络加速器研究与设计被引量：2