-
题名基于数据局部相似性的卷积神经网络加速器
- 1
-
-
作者
蔡元鹏
孙文浩
陈松
-
机构
中国科学技术大学微电子学院
-
出处
《微电子学与计算机》
2024年第4期104-111,共8页
-
基金
国家重点研发计划(2019YFB2204800)
国家自然科学基金(61931008)。
-
文摘
为提高卷积神经网络的处理速度,使用零梯度近似处理的卷积方法(梯度卷积)来提高数据的复用率,减少计算量。以卷积核为单位对数据进行梯度计算,针对不同网络的不同层次采用灵活的梯度阈值计算策略,以合理复用相邻窗口的卷积结果。将其中关键的梯度处理模块和卷积计算部分在现场可编程门阵列(Field-Programmable Gate Array,FPGA)上进行实现,与脉动阵列相结合以提高资源利用率,并针对负载不均衡的问题设计出适合梯度卷积的数据流。基于YOLOv3模型和Pascal VOC数据集的目标检测实验中,在付出较小精度损失的前提下,软件端减少约23.2%的计算量,结合硬件加速比约为17.8%。
-
关键词
加速器
数据局部相似性
卷积神经网络
梯度卷积
现场可编程门阵列
-
Keywords
accelerator
local similarity of data
convolutional neural network
grad convolution
field-programmable gate array(FPGA)
-
分类号
TN492
[电子电信—微电子学与固体电子学]
-