-
题名基于ZYNQ的稠密光流法软硬件协同处理
被引量:4
- 1
-
-
作者
王芝斌
阳文敏
张圆蒲
柴志雷
-
机构
江南大学物联网工程学院
-
出处
《计算机工程与应用》
CSCD
2014年第18期44-49,共6页
-
基金
国家自然科学基金(No.60703106
No.61170121
No.61202312)
-
文摘
光流法是计算机视觉中一个基础性的算法,可广泛应用于运动检测、运动估计、视频分析等领域。但光流法最大的问题是计算复杂、速度慢,限制了它在实际系统尤其是嵌入式系统中的应用。利用最新的高层综合(HLS)语言与传统的硬件描述语言相结合,在Xilinx的FPGA异构系统芯片(即ZYNQ)平台上,以软硬件协同的工作方式,设计了基于Horn-Schunck稠密光流法的硬件加速器。实验证明,对于640×480大小的图片,软硬件协同处理比纯软件处理的计算性能提高了34倍,执行时间从24.40 s降低到0.71 s。
-
关键词
光流加速器
ZYNQ
高层综合语言
软硬件协同处理
可编程器件
-
Keywords
optical flow accelerator
ZYNQ
high-level synthesis language
software-hardware co-processing
Field-Programmable Gate Array (FPGA)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名可实现时分复用的CNN卷积层和池化层IP核设计
被引量:9
- 2
-
-
作者
张卫
刘宇红
张荣芬
-
机构
贵州大学大数据与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第24期66-71,共6页
-
基金
贵州省科技计划(黔科合基础[2019]1099号)。
-
文摘
近年来,对于神经网络算法的实现,越来越多人选择使用现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA),而其当前实现的方式主要以Verilog硬件描述语言(Verilog Hardware Description Language,Verilog HDL)和高层综合语言(High Level Synthesis,HLS)为主。HLS具有易于理解与使用、开发时间短等特点,故采用HLS来设计卷积神经网络(Convolutional Neural Network,CNN)中的卷积层和池化层,生成IP核后,进一步利用时分复用技术搭建整个系统。实验采用MNIST手写数字数据集进行验证,将10层卷积神经网络布署到Xilinx公司的ZYNQ-7000 xc7z010clg400-1FPGA芯片上,经10 000次迭代后的平均识别准确率为95.34%。该IP核的设计对于快速使用FPGA来实现神经网络进行图像处理具有重要的意义。
-
关键词
卷积神经网络(CNN)
现场可编程逻辑门阵列(FPGA)
高层综合语言
IP核
时分复用
-
Keywords
Convolutional Neural Network(CNN)
Field Programmable Gate Array(FPGA)
high-level integrated language
IP core
time-division multiplexing
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-