期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向嵌入式的卷积神经网络硬件加速器设计 被引量:4
1
作者 唐蕊 焦继业 徐华昊 《计算机工程与应用》 CSCD 北大核心 2021年第4期252-257,共6页
近年来,随着神经网络模型越来越复杂,针对卷积神经网络推理计算所需内存空间过大,限制其在嵌入式设备上部署的问题,提出一种动态多精度定点数据量化硬件结构,使用定点数代替训练后推理过程中的浮点数执行卷积运算。结果表明,采用16位动... 近年来,随着神经网络模型越来越复杂,针对卷积神经网络推理计算所需内存空间过大,限制其在嵌入式设备上部署的问题,提出一种动态多精度定点数据量化硬件结构,使用定点数代替训练后推理过程中的浮点数执行卷积运算。结果表明,采用16位动态定点量化和并行卷积运算硬件架构,与静态量化策略相比,数据准确率高达97.96%,硬件单元的面积仅为13740门,且内存占用量和带宽需求减半。相比Cortex M4使用浮点数据做卷积运算,该硬件加速单元性能提升了90%以上。 展开更多
关键词 卷积神经网络 嵌入式设备 动态多精度定点数据量化 并行卷积运算硬件架构
下载PDF
(2,1,7)维特比译码器的并行算法实现
2
作者 强秀丽 刘党辉 秦桂枝 《装备指挥技术学院学报》 2000年第6期82-86,共5页
在卫星通信中,高、中速卷积码的应用极为广泛,译码器的硬件实现一直受速度的制约,随着微电子技术的发展,可编程器件的广泛使用,对于中高速(2,1,7)卷积编码的Viterbi(维特比)译码器,完全由硬件实现已成为可能。在并行算法设计中... 在卫星通信中,高、中速卷积码的应用极为广泛,译码器的硬件实现一直受速度的制约,随着微电子技术的发展,可编程器件的广泛使用,对于中高速(2,1,7)卷积编码的Viterbi(维特比)译码器,完全由硬件实现已成为可能。在并行算法设计中,ACS运算器的硬件规模占了整个译码器硬件的一半以上,如果在FPGA(可编程门阵列)中使用多路复用技术来实现(2,1,7)Viterbi译码,可以减少约2/3的器件规模。 展开更多
关键词 维特比译码器 卷积编码 硬件实现 VITERBI译码 卷积 卫星通信 多路复用技术 并行算法 运算 可编程器件
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部