针对传统人体动作识别中的硬件成本高和隐私泄露等问题,本文提出了一种基于三维卷积神经网络(3DCNN)和Wi-Fi信道状态信息(Channel State Information,CSI)的人体动作识别方法。首先,从采集到的信号中提取原始CSI数据的幅值和相位;其次,...针对传统人体动作识别中的硬件成本高和隐私泄露等问题,本文提出了一种基于三维卷积神经网络(3DCNN)和Wi-Fi信道状态信息(Channel State Information,CSI)的人体动作识别方法。首先,从采集到的信号中提取原始CSI数据的幅值和相位;其次,进行异常点去除和滤波去噪,通过应用CSI幅度与相位的结合以及滑动方差进行人体动作切割,得到处理后的CSI数据;然后,在此基础上使用3DCNN神经网络提取CSI数据的时间和空间特征,并通过引入注意力机制进一步提升人体动作识别的准确度;最后,在实验室采集的CSI数据集上进行了人体动作识别的实验验证,其准确率达到96.1%。展开更多
针对当前AI专用加速器设计复杂且存在内存瓶颈等不足,提出一种通用型卷积神经网络加速器架构.其RISC(Reduced Instruction Set Computer)指令集支持不同类型卷积神经网络到硬件加速器的高效映射.其通用卷积计算模块是一个由多个基本运...针对当前AI专用加速器设计复杂且存在内存瓶颈等不足,提出一种通用型卷积神经网络加速器架构.其RISC(Reduced Instruction Set Computer)指令集支持不同类型卷积神经网络到硬件加速器的高效映射.其通用卷积计算模块是一个由多个基本运算单元组成的可重构三维脉动阵列,支持不同尺寸的二维卷积计算;脉动阵列规模可根据需要进行配置,适用不同的并行加速需求.为缓解内存瓶颈、提高算力,输入模块引入多级缓存结构,可实现对片外数据的高速读取;输出模块设计一种基于“乒乓”架构的多级数据累加结构,以实现卷积计算结果的高速缓存输出.将所提架构在FPGA芯片上予以实现,实验结果表明该架构凭借较少计算资源和较低功耗取得了与当前先进加速器相近的性能,且通用性更强.展开更多
文摘针对传统人体动作识别中的硬件成本高和隐私泄露等问题,本文提出了一种基于三维卷积神经网络(3DCNN)和Wi-Fi信道状态信息(Channel State Information,CSI)的人体动作识别方法。首先,从采集到的信号中提取原始CSI数据的幅值和相位;其次,进行异常点去除和滤波去噪,通过应用CSI幅度与相位的结合以及滑动方差进行人体动作切割,得到处理后的CSI数据;然后,在此基础上使用3DCNN神经网络提取CSI数据的时间和空间特征,并通过引入注意力机制进一步提升人体动作识别的准确度;最后,在实验室采集的CSI数据集上进行了人体动作识别的实验验证,其准确率达到96.1%。
文摘针对当前AI专用加速器设计复杂且存在内存瓶颈等不足,提出一种通用型卷积神经网络加速器架构.其RISC(Reduced Instruction Set Computer)指令集支持不同类型卷积神经网络到硬件加速器的高效映射.其通用卷积计算模块是一个由多个基本运算单元组成的可重构三维脉动阵列,支持不同尺寸的二维卷积计算;脉动阵列规模可根据需要进行配置,适用不同的并行加速需求.为缓解内存瓶颈、提高算力,输入模块引入多级缓存结构,可实现对片外数据的高速读取;输出模块设计一种基于“乒乓”架构的多级数据累加结构,以实现卷积计算结果的高速缓存输出.将所提架构在FPGA芯片上予以实现,实验结果表明该架构凭借较少计算资源和较低功耗取得了与当前先进加速器相近的性能,且通用性更强.