-
题名基于FPGA的卷积神经网络加速器
被引量:36
- 1
-
-
作者
余子健
马德
严晓浪
沈君成
-
机构
浙江大学电气工程学院
杭州电子科技大学电子信息学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第1期109-114,119,共7页
-
基金
国家"863"计划项目"CMC系列芯片的设计
开发与制造"(2012AA041701)
-
文摘
现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求。为此,设计一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在粗粒度并行层面对卷积运算单元进行并行化加速,并使用流水线实现完整单层运算过程,使单个时钟周期能够完成20次乘累加,从而提升运算效率。针对MNIST手写数字字符识别的实验结果表明,在75 MHz的工作频率下,该加速器可使FPGA峰值运算速度达到0.676 GMAC/s,相较通用CPU平台实现4倍加速,而功耗仅为其2.68%。
-
关键词
卷积神经网络
现场可编程门阵列
加速器
流水线
并行化
-
Keywords
accelerator
pipeline
parallelization
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于FPGA的脉冲神经网络加速器设计
被引量:3
- 2
-
-
作者
沈阳靖
沈君成
叶俊
马琪
-
机构
杭州电子科技大学微电子CAD研究所
浙江大学超大规模集成电路研究所
杭州士兰微电子股份有限公司
-
出处
《电子科技》
2017年第10期89-92,96,共5页
-
基金
国家自然科学青年基金(61404041)
-
文摘
脉冲神经网络是一种基于离散神经脉冲原理进行信息处理的人工神经网络,文中提出了一种基于FPGA的灵活可配的脉冲神经网络加速器架构,能够支持神经网络拓扑结构、连接权值的灵活配置。该设计首先在算法层对LIF神经元模型进行公式分解和浮点转定点两个层次的优化,并在硬件实现中采用时分复用技术将硬件中实现的8个物理神经元复用为256个逻辑神经元。神经元模电压计算采用三级流水线架构,以提高神经元数据处理效率。通过采用Xilinx XC6SLX45 FPGA实现整个神经网络加速器,工作频率可达50 MHz,并基于该加速器构建手写数字识别网络架构,实验结果表明,采用MNIST数据集作为测试样例,该网络架构准确率可达93%。
-
关键词
脉冲神经网络
LIF模型
时分复用
分类
-
Keywords
spiking neuron network
LIF model
time - multiplexing technology
classification.
-
分类号
TN912.11
[电子电信—通信与信息系统]
TP183
[自动化与计算机技术—控制理论与控制工程]
-