期刊文献+

基于FPGA的卷积神经网络加速器研究与设计 被引量:2

下载PDF
导出
摘要 本文针对Yolo v2目标检测卷积神经网络实现了基于Xilinx Virtex Ultrasale+VCU118的硬件加速,整体采用MCU+FPGA的异构计算架构,MCU采用ArmCortex-M3软核IP布局布线到FPGA开发板中。软件上完成了MCU读取大位宽RAM数据以及中断控制系统的设计,硬件上完成了Yolo v2网络前向传播模型中的卷积、ReLU非线性激活、最大池化等核心模块的设计。PE(Processing Engine)阵列借鉴了eyeriss阵列架构中的行固定流思想,通过精心设计阵列输入数据的格式,将多维卷积拆分成一维卷积,实现多输入特征图、多通道、多卷积核的通用性卷积计算,且利用Chisel3语言实现了一种高度参数化的卷积计算电路生成器,具有计算位宽可调、PE阵列规模可调、PE单元内部存储可调的特点。
出处 《电子技术与软件工程》 2022年第20期170-177,共8页 ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
基金 基于中国科学院上海微系统与信息技术研究所委托深圳市唯特视科技有限公司开发项目的研究成果,项目名称为红外黑白图像彩色还原技术,项目编号为6142804190408。
  • 相关文献

参考文献1

二级参考文献28

  • 1BENGIO Y, DELALLEAU O. On the expressive power of deep archi- tectures[ C ]//Proc of the 14th International Conference on Discovery Science. Berlin : Springer-Verlag, 2011 : 18 - 36.
  • 2BENGIO Y. Leaming deep architectures for AI[ J]. Foundations and Trends in Machine Learning ,2009,2 ( 1 ) : 1-127.
  • 3HINTON G,OSINDERO S,TEH Y. A fast learning algorithm for deep belief nets [ J ]. Neural Computation ,2006,18 (7) : 1527-1554.
  • 4BENGIO Y, LAMBLIN P, POPOVICI D, et al. Greedy layer-wise training of deep networks [ C ]//Proc of the 12th Annual Conference on Neural Information Processing System. 2006:153-160.
  • 5LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning ap- plied to document recognition[ J]. Proceedings of the iEEE, 1998, 86( 11 ) :2278-2324.
  • 6VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[ C ]//Proc of the 25th International Conference on Machine Learning. New York: ACM Press ,2008 : 1096-1103.
  • 7VINCENT P, LAROCHELLE H, LAJOIE I, et aL Stacked denoising autoencoders:learning useftd representations in a deep network with a local denoising criterion [ J ]. Journal of Machine Learning Re- search ,2010,11 ( 12 ) :3371-3408.
  • 8YU Dong, DENG Li. Deep convex net: a scalable architecture for speech pattern classification [ C]//Proc of the 12th Annual Confe-rence of International Speech Comunication Association. 2011 : 2285- 2288.
  • 9POON H, DOMINGOS P. Sum-product networks:a new deep architec- ture[ C ]//Proc of IEEE Intemational Conference on Computer Vi- sion. 2011:689-690.
  • 10BENGIO Y,LECUN Y. Scaling learning algorithms towards AI[ M]// BOTTOU L,CHAPELLE O, DeCOSTE D,et al. Large-Scale Kernel Machines. Cambridge: MIT Press ,2007:321-358.

共引文献615

同被引文献6

引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部