-
题名基于异构计算平台的卷积神经网络加速器的设计
- 1
-
-
作者
王帅
杨帆
周贤中
-
机构
广东工业大学信息工程学院
-
出处
《电子器件》
CAS
北大核心
2023年第6期1621-1628,共8页
-
基金
国家自然科学基金项目(61704032)
计算机体系结构国家重点实验室开放课题项目(CARCH201814)。
-
文摘
卷积神经网络在运算过程中存在计算量过大、存储资源消耗高等问题,使其难以在嵌入式设备上进行部署。针对此问题,提出一种在多核异构平台ZYNQ7020上对目标检测网络YOLO-FASTEST前向推理的方案。首先设计了一种输出特征复用的运算模式,提高了片上多层流水的运算效率。然后采用双缓存乒乓传输的方式,使得数据传输时间掩盖计算时间。为了降低硬件资源开销,将网络模型的精度由浮点数量化为16位的定点数,将批量归一化层与卷积层进一步融合。最后对加速器的资源消耗与各模块的设计参数进行建模分析。实验结果表明,该方案在ZYNQ7020平台上获得了13.5 GFLOPS的计算性能,功耗仅为2.56 W。同时能耗比是ARM-A9 CPU的48倍、GTX1050ti GPU的20倍。
-
关键词
卷积神经网络
yolo-fastest模型
FPGA
并行计算
硬件加速
-
Keywords
convolutional neural network
yolo-fastest
FPGA
parallel computing
hardware accelerator
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于ARM和深度学习的智能行人预警系统
被引量:1
- 2
-
-
作者
刘佳丽
黄世震
何恩德
-
机构
福州大学物理与信息工程学院
福州大学微电子集成电路重点实验室
-
出处
《信息技术与网络安全》
2021年第12期60-64,共5页
-
文摘
针对行人交通安全问题,开发行人检测系统以提醒行人和司机危险的发生。对目标检测神经网络模型进行分析和对比实验,选取以darknet为网络框架的YOLO-fastest模型进行改进优化并采用分类并标签的实时交通数据进行训练,最终将训练模型部署至开发板完成实时性检测并能够根据车辆速度反馈给行人危险信号。实验结果表明YOLO-fastest模型的平均检测精度为96.1%,检测速度为33 f/s,模型大小为1.2 MB,既满足检测精度又满足检测速度的要求,能够完成对真实交通场景下的实时性检测。
-
关键词
行人安全
目标检测
神经网络
yolo-fastest算法
-
Keywords
pedestrian safety
target detection
neural network
yolo-fastest algorithm
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-