-
题名面向CNN卷积层硬件的计算资源优化设计
- 1
-
-
作者
王彬燏
杨志家
谢闯
连莲
王颖
-
机构
沈阳化工大学信息工程学院
中国科学院网络化控制系统重点实验室
中国科学院沈阳自动化研究所
-
出处
《微电子学与计算机》
2024年第7期89-95,共7页
-
基金
国家重点研发计划(2022YFB3204501)。
-
文摘
传统卷积神经网络(Convolutional Neural Network,CNN)专用加速器在实现卷积层算子重构、数据复用和计算资源复用时,会产生硬件资源利用率较低的问题。对此设计了一种基于动态寄存器堆和可重构PE阵列相结合的硬件架构,通过优化数据流使得各PE单元负载均衡,进而提高卷积层计算资源的利用率。可灵活部署0~11大小和1~10步长的奇数卷积核,支持多通道并行卷积、输入数据复用等操作。设计使用verilog硬件描述语言实现,通过创建UVM环境进行功能性验证。实验表明:在加速AlexNet模型的卷积层时,峰值算力的吞吐率相比于相关研究提高了9.5%~64.3%,在映射5种经典神经网络里不同尺寸大小和步长的卷积核时,PE单元的平均利用率相比于相关研究提高了4%~11%。
-
关键词
可重构PE
动态寄存器堆
灵活性
资源利用率
-
Keywords
reconfigurable PE
dynamic register heap
flexibility
resource utilization
-
分类号
TN492
[电子电信—微电子学与固体电子学]
-