-
题名基于ZCU102 DSP的CNN卷积运算加速方法
被引量:1
- 1
-
-
作者
苗鑫
周欢欢
陆栋洵
-
机构
沐曦集成电路(南京)有限公司
-
出处
《自动化技术与应用》
2022年第12期64-67,共4页
-
文摘
本文提出设计了一种在ZCU102平台上加速卷积神经网络(CNN)卷积运算的方法,使用1个DSP IP实现卷积操作中1个int8类型或者unit8类型输入特征图像数据和2个int8类型卷积核参数的乘法运算。卷积运算是卷积神经网络的基本操作,提高卷积运算并行度可使卷积运算速率提升一倍。8-bit卷积神经网络量化技术是设计实现的基础,减少了处理器(PS)数据传输带宽需求。ZCU102 MPSoC的可编程逻辑(PL)资源较少,充分利用DSP IP资源可降低逻辑资源需求,提升逻辑资源利用率,增加SoC系统设计灵活性。
-
关键词
zcu102
DSP
IP
人工智能
卷积神经网络
8-bit量化
-
Keywords
zcu102
DSP IP
AI
CNN
8-bit Quantization
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于AXI4 CDMA的CNN卷积加速器设计
- 2
-
-
作者
苗鑫
陆栋洵
周欢欢
-
机构
沐曦集成电路(南京)有限公司
-
出处
《电子技术(上海)》
2022年第8期7-9,共3页
-
文摘
阐述一种CNN卷积加速器的设计,该加速器基于Xilinx ZCU102 MP SoC开发套件,使用3路AXI4CDMA进行数据传输。DDR数据读写效率影响CNN卷积运算效率,使用CDMA可以提高数据读写效率,减少CPU参与。AMBA AXI4接口协议具有高性能、大吞吐量、低延迟的特点,可以提升总线数据传输带宽。AXI4 CDMA IP核支持不同数据宽度和Burst长度配置,以适配不同系统AXI4总线接口,增加灵活性。SoC FPGA集成了片上ARM处理子系统PS和可编程逻辑单元部分PL,实现PS和PL数据高效交互。
-
关键词
人工智能
卷积神经网络
卷积运算
zcu102
AXI4
CDMA
IP
-
Keywords
AI
CNN
Convolution
zcu102
AXI4 CDMA IP
-
分类号
TN791
[电子电信—电路与系统]
TP183
[自动化与计算机技术—控制理论与控制工程]
TP333
[自动化与计算机技术—计算机系统结构]
TP391.41
[自动化与计算机技术—计算机应用技术]
-