-
题名面向嵌入式的卷积神经网络硬件加速器设计
被引量:4
- 1
-
-
作者
唐蕊
焦继业
徐华昊
-
机构
西安邮电大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第4期252-257,共6页
-
基金
国家自然科学基金(61874087)。
-
文摘
近年来,随着神经网络模型越来越复杂,针对卷积神经网络推理计算所需内存空间过大,限制其在嵌入式设备上部署的问题,提出一种动态多精度定点数据量化硬件结构,使用定点数代替训练后推理过程中的浮点数执行卷积运算。结果表明,采用16位动态定点量化和并行卷积运算硬件架构,与静态量化策略相比,数据准确率高达97.96%,硬件单元的面积仅为13740门,且内存占用量和带宽需求减半。相比Cortex M4使用浮点数据做卷积运算,该硬件加速单元性能提升了90%以上。
-
关键词
卷积神经网络
嵌入式设备
动态多精度定点数据量化
并行卷积运算硬件架构
-
Keywords
convolutional neural network
embedded devices
dynamic multi-precision fixed-point data quantization
parallel convolutional operation hardware architecture
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名(2,1,7)维特比译码器的并行算法实现
- 2
-
-
作者
强秀丽
刘党辉
秦桂枝
-
机构
装备指挥技术学院试验工程系
-
出处
《装备指挥技术学院学报》
2000年第6期82-86,共5页
-
文摘
在卫星通信中,高、中速卷积码的应用极为广泛,译码器的硬件实现一直受速度的制约,随着微电子技术的发展,可编程器件的广泛使用,对于中高速(2,1,7)卷积编码的Viterbi(维特比)译码器,完全由硬件实现已成为可能。在并行算法设计中,ACS运算器的硬件规模占了整个译码器硬件的一半以上,如果在FPGA(可编程门阵列)中使用多路复用技术来实现(2,1,7)Viterbi译码,可以减少约2/3的器件规模。
-
关键词
维特比译码器
卷积编码
硬件实现
VITERBI译码
卷积码
卫星通信
多路复用技术
并行算法
运算器
可编程器件
-
Keywords
FPGA
convolutional codes
generator polynomials
Viterbi decode algorithm
multiple using technology
-
分类号
G632.479
[文化科学—教育学]
TN911
[电子电信—通信与信息系统]
-