-
题名面向CNN卷积层硬件的计算资源优化设计
- 1
-
-
作者
王彬燏
杨志家
谢闯
连莲
王颖
-
机构
沈阳化工大学信息工程学院
中国科学院网络化控制系统重点实验室
中国科学院沈阳自动化研究所
-
出处
《微电子学与计算机》
2024年第7期89-95,共7页
-
基金
国家重点研发计划(2022YFB3204501)。
-
文摘
传统卷积神经网络(Convolutional Neural Network,CNN)专用加速器在实现卷积层算子重构、数据复用和计算资源复用时,会产生硬件资源利用率较低的问题。对此设计了一种基于动态寄存器堆和可重构PE阵列相结合的硬件架构,通过优化数据流使得各PE单元负载均衡,进而提高卷积层计算资源的利用率。可灵活部署0~11大小和1~10步长的奇数卷积核,支持多通道并行卷积、输入数据复用等操作。设计使用verilog硬件描述语言实现,通过创建UVM环境进行功能性验证。实验表明:在加速AlexNet模型的卷积层时,峰值算力的吞吐率相比于相关研究提高了9.5%~64.3%,在映射5种经典神经网络里不同尺寸大小和步长的卷积核时,PE单元的平均利用率相比于相关研究提高了4%~11%。
-
关键词
可重构PE
动态寄存器堆
灵活性
资源利用率
-
Keywords
reconfigurable PE
dynamic register heap
flexibility
resource utilization
-
分类号
TN492
[电子电信—微电子学与固体电子学]
-
-
题名基于惯性传感器的HAR数据采集系统设计
被引量:1
- 2
-
-
作者
王颖
杨志家
谢闯
曾静
王彬燏
-
机构
沈阳化工大学信息工程学院
中国科学院网络化控制系统重点实验室
中国科学院沈阳自动化研究所
-
出处
《电子测量技术》
北大核心
2023年第23期146-152,共7页
-
基金
国家重点研发计划项目(2022YFB3204501)资助
-
文摘
目前针对人体活动识别的数据采集硬件系统研究有限,且存在可参考的数据集单一和泛化性能较低的问题。本文设计一个低功耗、支持数据实时传输、模块化的数据采集系统,并提出一种具有随机性和交叉性的数据采集方法。首先搭建低功耗采集平台进行数据的采集、无线收发和预处理;其次制定全面且精确的采集方案,提高数据集的丰富度;最后用2D-CNN神经网络对不同模式下采集到的数据集进行模型训练。实验结果表明,该采集系统结构合理,具备低功耗特性,能够确保数据传输具备实时性能;该采集系统的应用极大地提高了数据集的质量;获得的数据集在深度学习模型上的准确率可达92.54%;相较于传统数据集,新数据集在人体活动识别任务中表现出更为显著的效果,该采集系统和数据集的开发为神经网络应用提供便利。
-
关键词
惯性传感器
数据采集
Wi-Fi无线模块
人体活动识别
-
Keywords
inertial sensor
data acquisition
Wi-Fi wireless module
human activity recognition
-
分类号
TN96
[电子电信—信号与信息处理]
TP212.9
[自动化与计算机技术—检测技术与自动化装置]
TP368
[自动化与计算机技术—计算机系统结构]
-