-
题名基于FPGA的卷积神经网络并行加速结构设计
被引量:9
- 1
-
-
作者
刘志成
祝永新
汪辉
田犁
封松林
-
机构
中国科学院上海高等研究院cmos图像传感器实验室
中国科学院大学
-
出处
《微电子学与计算机》
CSCD
北大核心
2018年第10期80-84,共5页
-
基金
国家重点研发计划项目(2017YFA0206104)
上海市科学技术委员会科研计划项目(16511108701)
张江管委会公共服务平台项目(2016-14)
-
文摘
本文根据卷积神经网络特点,提出了一种基于FPGA的流水线并行加速方案,设计优化了卷积模块电路、激活模块电路以及下采样模块电路,从而构建了卷积神经网络运算的FPGA基本单元.在网络结构和处理数据相同的情况下,50MHz频率的FPGA计算效率为CPU的8倍、GPU的近5倍,而功耗则只占GPU的27.8%.
-
关键词
卷积神经网络
FPGA
卷积模块
激活模块
下采样模块
-
Keywords
convolutional neural network
FPGA
convolution module
activation module
down samoling module
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于FPGA的卷积神经网络卷积层并行加速结构设计
被引量:6
- 2
-
-
作者
陈煌
祝永新
田犁
汪辉
封松林
-
机构
中国科学院上海高等研究院cmos图像传感器实验室
中国科学院大学
上海科技大学信息科技与技术学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2018年第10期85-88,共4页
-
基金
国家重点研发计划(2017YFA206104)
上海市科学技术委员会科研计划项目(16511108701)
张江管委会公共服务平台项目(2016-14)
-
文摘
随着近年来硬件的飞速发展,深度学习又一次成为了研究的热门领域,其中卷积神经网络在多个方面显示了突出的表现.卷积层是卷积神经网络中最重要的组成部分,具有大量乘加计算.针对该特点,提出了流水线式的FPGA卷积层并行加速模块.该电路可以在一个周期内获得一个计算结果.在相同结构和数据集的情况下,FPGA的计算效率分别是CPU,GPU的近7倍和5倍,而功耗只有GPU的28.87%.
-
关键词
卷积神经网络
FPGA
卷积层
-
Keywords
convolutional neural network
FPGA
convolution layer
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-