期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于FPGA的SqueezeNet推断加速器设计
1
作者 储萍 倪伟 《电子科技》 2022年第2期20-26,共7页
针对轻量型深度神经网络SqueezeNet存在中间流动数据量大及消耗计算周期长等问题,文中提出以处理块结构划分整个网络来加速计算。每个处理块由Expand层和Squeeze层组成。以Squeeze层结束的处理块结构减少了计算模块与内存间流动的中间... 针对轻量型深度神经网络SqueezeNet存在中间流动数据量大及消耗计算周期长等问题,文中提出以处理块结构划分整个网络来加速计算。每个处理块由Expand层和Squeeze层组成。以Squeeze层结束的处理块结构减少了计算模块与内存间流动的中间数据量,降低了读写消耗。利用激活函数的特性,在核心计算模块引入提前结束卷积计算技术,并为其设计有效索引生存单元、有效索引控制取值单元和卷积判断单元,可跳过卷积计算中无效值占用的计算量和计算周期。实验结果表明,该加速器能减少55.38%的数据流动量,并将无效值所占的计算量和计算周期减少14.68%。 展开更多
关键词 轻量型深度网络 SqueezeNet 处理块 激活函数 提前结束卷积计算 有效索引 无效值 计算周期
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部