目前主流人体动作识别大部分都是基于卷积神经网络(Convolutional Neural Network,CNN)实现,而CNN容易忽略视频中的空间位置信息,从而降低了视频空间频域中动作识别能力。同时传统CNN不能快速定位到关键的特征位置,并且在训练过程中不...目前主流人体动作识别大部分都是基于卷积神经网络(Convolutional Neural Network,CNN)实现,而CNN容易忽略视频中的空间位置信息,从而降低了视频空间频域中动作识别能力。同时传统CNN不能快速定位到关键的特征位置,并且在训练过程中不能并行计算导致效率低。为了解决传统CNN在处理时间频域和多并行计算问题,提出了基于视觉Transformer(Vision Transformer,ViT)和3D卷积网络学习时空特征(Learning Spatiotemporal Features with 3D Convolutional Network,C3D)的人体动作识别算法。使用C3D提取视频的多维特征图、ViT的特征切片窗口对多维特征进行全局特征分割;使用Transformer的编码-解码模块对视频中人体动作进行预测。实验结果表明,所提的人体动作识别算法在UCF-101、HMDB51数据集上提高了动作识别的准确率。展开更多
针对合成孔径雷达(SAR)目标的识别问题,提出了一种基于K近邻方法(KNN)的SAR图像目标识别方法。首先,有别于传统的图像特征提取方法,采用逆向思维,通过剪裁和去噪方法对图像的冗余信息进行"剔除",从而尽可能保留图像的原有信息...针对合成孔径雷达(SAR)目标的识别问题,提出了一种基于K近邻方法(KNN)的SAR图像目标识别方法。首先,有别于传统的图像特征提取方法,采用逆向思维,通过剪裁和去噪方法对图像的冗余信息进行"剔除",从而尽可能保留图像的原有信息,并将其作为待分类特征。然后分别用KNN和支持向量机(SVM)在MSTAR(Moving and Stationary Target Acquisition and Recognition)数据集上进行了仿真对比实验。实验结果表明,此方法下KNN的分类效果明显优于SVM,其精度均达到94%以上,证明了所提方法的有效性。展开更多
文摘目前主流人体动作识别大部分都是基于卷积神经网络(Convolutional Neural Network,CNN)实现,而CNN容易忽略视频中的空间位置信息,从而降低了视频空间频域中动作识别能力。同时传统CNN不能快速定位到关键的特征位置,并且在训练过程中不能并行计算导致效率低。为了解决传统CNN在处理时间频域和多并行计算问题,提出了基于视觉Transformer(Vision Transformer,ViT)和3D卷积网络学习时空特征(Learning Spatiotemporal Features with 3D Convolutional Network,C3D)的人体动作识别算法。使用C3D提取视频的多维特征图、ViT的特征切片窗口对多维特征进行全局特征分割;使用Transformer的编码-解码模块对视频中人体动作进行预测。实验结果表明,所提的人体动作识别算法在UCF-101、HMDB51数据集上提高了动作识别的准确率。
文摘针对合成孔径雷达(SAR)目标的识别问题,提出了一种基于K近邻方法(KNN)的SAR图像目标识别方法。首先,有别于传统的图像特征提取方法,采用逆向思维,通过剪裁和去噪方法对图像的冗余信息进行"剔除",从而尽可能保留图像的原有信息,并将其作为待分类特征。然后分别用KNN和支持向量机(SVM)在MSTAR(Moving and Stationary Target Acquisition and Recognition)数据集上进行了仿真对比实验。实验结果表明,此方法下KNN的分类效果明显优于SVM,其精度均达到94%以上,证明了所提方法的有效性。