期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
YOLO检测网络的FPGA加速计算模型的研究
被引量:
4
1
作者
裴颂文
汪显荣
《小型微型计算机系统》
CSCD
北大核心
2022年第8期1681-1686,共6页
FPGA(Field Programmable Gate Array)凭借其高并行和可定制化的特点,可以解决目标检测网络结构复杂、计算量大和存储开销高等问题.本文基于FPGA验证平台研究并实现了YOLO(You Only Look Once)系列神经网络的加速计算模型.首先采用动态...
FPGA(Field Programmable Gate Array)凭借其高并行和可定制化的特点,可以解决目标检测网络结构复杂、计算量大和存储开销高等问题.本文基于FPGA验证平台研究并实现了YOLO(You Only Look Once)系列神经网络的加速计算模型.首先采用动态定点量化方法降低了数据存储和传输量.然后针对YOLO模型中两类计算开销大的典型卷积层,采用了流水线,循环展开,模块融合等策略分别实现了基于Winograd和GEMM的快速卷积计算引擎,提高加速计算效率.实验结果表明,本文在PYNQ-Z1验证平台上获得的计算性能达到64.9 GOP/s,比基于典型滑动窗口卷积计算方法的性能提高了2.15倍.
展开更多
关键词
FPGA
YOLO
快速卷积算法
并行计算
流水线
下载PDF
职称材料
题名
YOLO检测网络的FPGA加速计算模型的研究
被引量:
4
1
作者
裴颂文
汪显荣
机构
上海理工大学光电信息与计算机工程学院
中国科学院计算技术研究所计算机体系结构国家重点实验室
复旦大学上海市数据科学重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第8期1681-1686,共6页
基金
国家自然科学基金项目(61975124)资助
上海市自然科学基金项目(20ZR1438500)资助
+1 种基金
上海市科委科技行动计划专项基金项目(19DZ2301100,20DZ2303500)资助
上海市数据科学重点实验室开放课题项目(2020090600003)资助.
文摘
FPGA(Field Programmable Gate Array)凭借其高并行和可定制化的特点,可以解决目标检测网络结构复杂、计算量大和存储开销高等问题.本文基于FPGA验证平台研究并实现了YOLO(You Only Look Once)系列神经网络的加速计算模型.首先采用动态定点量化方法降低了数据存储和传输量.然后针对YOLO模型中两类计算开销大的典型卷积层,采用了流水线,循环展开,模块融合等策略分别实现了基于Winograd和GEMM的快速卷积计算引擎,提高加速计算效率.实验结果表明,本文在PYNQ-Z1验证平台上获得的计算性能达到64.9 GOP/s,比基于典型滑动窗口卷积计算方法的性能提高了2.15倍.
关键词
FPGA
YOLO
快速卷积算法
并行计算
流水线
Keywords
FPGA
YOLO
fast convolution algorithm
parallel computing
pipeline
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
YOLO检测网络的FPGA加速计算模型的研究
裴颂文
汪显荣
《小型微型计算机系统》
CSCD
北大核心
2022
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部