期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于异构计算平台的卷积神经网络加速器的设计
1
作者 王帅 杨帆 周贤中 《电子器件》 CAS 北大核心 2023年第6期1621-1628,共8页
卷积神经网络在运算过程中存在计算量过大、存储资源消耗高等问题,使其难以在嵌入式设备上进行部署。针对此问题,提出一种在多核异构平台ZYNQ7020上对目标检测网络YOLO-FASTEST前向推理的方案。首先设计了一种输出特征复用的运算模式,... 卷积神经网络在运算过程中存在计算量过大、存储资源消耗高等问题,使其难以在嵌入式设备上进行部署。针对此问题,提出一种在多核异构平台ZYNQ7020上对目标检测网络YOLO-FASTEST前向推理的方案。首先设计了一种输出特征复用的运算模式,提高了片上多层流水的运算效率。然后采用双缓存乒乓传输的方式,使得数据传输时间掩盖计算时间。为了降低硬件资源开销,将网络模型的精度由浮点数量化为16位的定点数,将批量归一化层与卷积层进一步融合。最后对加速器的资源消耗与各模块的设计参数进行建模分析。实验结果表明,该方案在ZYNQ7020平台上获得了13.5 GFLOPS的计算性能,功耗仅为2.56 W。同时能耗比是ARM-A9 CPU的48倍、GTX1050ti GPU的20倍。 展开更多
关键词 卷积神经网络 yolo-fastest模型 FPGA 并行计算 硬件加速
下载PDF
基于ARM和深度学习的智能行人预警系统 被引量:1
2
作者 刘佳丽 黄世震 何恩德 《信息技术与网络安全》 2021年第12期60-64,共5页
针对行人交通安全问题,开发行人检测系统以提醒行人和司机危险的发生。对目标检测神经网络模型进行分析和对比实验,选取以darknet为网络框架的YOLO-fastest模型进行改进优化并采用分类并标签的实时交通数据进行训练,最终将训练模型部署... 针对行人交通安全问题,开发行人检测系统以提醒行人和司机危险的发生。对目标检测神经网络模型进行分析和对比实验,选取以darknet为网络框架的YOLO-fastest模型进行改进优化并采用分类并标签的实时交通数据进行训练,最终将训练模型部署至开发板完成实时性检测并能够根据车辆速度反馈给行人危险信号。实验结果表明YOLO-fastest模型的平均检测精度为96.1%,检测速度为33 f/s,模型大小为1.2 MB,既满足检测精度又满足检测速度的要求,能够完成对真实交通场景下的实时性检测。 展开更多
关键词 行人安全 目标检测 神经网络 yolo-fastest算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部