期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于ZCU102 DSP的CNN卷积运算加速方法 被引量:1
1
作者 苗鑫 周欢欢 陆栋洵 《自动化技术与应用》 2022年第12期64-67,共4页
本文提出设计了一种在ZCU102平台上加速卷积神经网络(CNN)卷积运算的方法,使用1个DSP IP实现卷积操作中1个int8类型或者unit8类型输入特征图像数据和2个int8类型卷积核参数的乘法运算。卷积运算是卷积神经网络的基本操作,提高卷积运算... 本文提出设计了一种在ZCU102平台上加速卷积神经网络(CNN)卷积运算的方法,使用1个DSP IP实现卷积操作中1个int8类型或者unit8类型输入特征图像数据和2个int8类型卷积核参数的乘法运算。卷积运算是卷积神经网络的基本操作,提高卷积运算并行度可使卷积运算速率提升一倍。8-bit卷积神经网络量化技术是设计实现的基础,减少了处理器(PS)数据传输带宽需求。ZCU102 MPSoC的可编程逻辑(PL)资源较少,充分利用DSP IP资源可降低逻辑资源需求,提升逻辑资源利用率,增加SoC系统设计灵活性。 展开更多
关键词 zcu102 DSP IP 人工智能 卷积神经网络 8-bit量化
下载PDF
基于AXI4 CDMA的CNN卷积加速器设计
2
作者 苗鑫 陆栋洵 周欢欢 《电子技术(上海)》 2022年第8期7-9,共3页
阐述一种CNN卷积加速器的设计,该加速器基于Xilinx ZCU102 MP SoC开发套件,使用3路AXI4CDMA进行数据传输。DDR数据读写效率影响CNN卷积运算效率,使用CDMA可以提高数据读写效率,减少CPU参与。AMBA AXI4接口协议具有高性能、大吞吐量、低... 阐述一种CNN卷积加速器的设计,该加速器基于Xilinx ZCU102 MP SoC开发套件,使用3路AXI4CDMA进行数据传输。DDR数据读写效率影响CNN卷积运算效率,使用CDMA可以提高数据读写效率,减少CPU参与。AMBA AXI4接口协议具有高性能、大吞吐量、低延迟的特点,可以提升总线数据传输带宽。AXI4 CDMA IP核支持不同数据宽度和Burst长度配置,以适配不同系统AXI4总线接口,增加灵活性。SoC FPGA集成了片上ARM处理子系统PS和可编程逻辑单元部分PL,实现PS和PL数据高效交互。 展开更多
关键词 人工智能 卷积神经网络 卷积运算 zcu102 AXI4 CDMA IP
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部