细粒度图像分类是计算机视觉领域的一大分类任务,其难点在于如何通过类别监督信息自主地找到判别性区域.提出一种新的通道-空间融合注意力模块,基于该模块设计了一种新的Swin Transformer算法SwinT⁃NCSA(a Swin Transformer based on a ...细粒度图像分类是计算机视觉领域的一大分类任务,其难点在于如何通过类别监督信息自主地找到判别性区域.提出一种新的通道-空间融合注意力模块,基于该模块设计了一种新的Swin Transformer算法SwinT⁃NCSA(a Swin Transformer based on a novel channel⁃spatial attention module),分别从通道维和空间维同时提取特征,再将其融入到Swin Transformer模型中以提高其小尺度中多头注意力信息的提取能力.SwinT⁃NCSA算法特别关注了对分类有用的区域,同时忽视对分类无用的背景区域,以此在细粒度图像分类任务中达到较高的分类准确率.在FGVC Aircraft飞机数据集、CUB-200-2011鸟类数据集和Stanford Cars车类数据集3个公共数据集上的实验表明,SwinT⁃NCSA算法可以分别取得93.3%、88.4%和94.7%的准确率,优于同类算法.展开更多
针对轴承故障特征提取能力不足、源域与目标域数据分布差异过大等问题,本文提出了一种基于小波包域对抗注意力迁移学习的故障诊断方法(WWRESE-IDALM)。首先,通过小波包变换(Wavelet Packet Transform,WPT)获得不同重点节构的时频域信息...针对轴承故障特征提取能力不足、源域与目标域数据分布差异过大等问题,本文提出了一种基于小波包域对抗注意力迁移学习的故障诊断方法(WWRESE-IDALM)。首先,通过小波包变换(Wavelet Packet Transform,WPT)获得不同重点节构的时频域信息;其次,将重构后的时频域信息数据经过一层大卷积核和通道注意力模块(Squeeze and Excitation,SE)提取轴承深度关键信息特征;利用改进的域对抗网络(Domain-Adversarial Training of Neural Networks,DANN)和局部最大平均差异(Local Maximum Mean Discrepancy,LMMD)对齐子域分布,减少相关子域和全局域之间的结构差异;最后,通过标签分类网络完成故障分类。在帕德博恩大学轴承数据集诊断结果证明了所提出的WWRESE-IDALM方法具有良好的变工况故障分类能力。展开更多
针对目前基于信道脉冲响应(Channel Impulse Response,CIR)的非视距(None Line of Sight,NLoS)/视距(Line of Sight,LoS)识别方法精度低、泛化能力差的问题,提出了一种多层卷积神经网络(Convolutional Neural Network,CNN)与通道注意力...针对目前基于信道脉冲响应(Channel Impulse Response,CIR)的非视距(None Line of Sight,NLoS)/视距(Line of Sight,LoS)识别方法精度低、泛化能力差的问题,提出了一种多层卷积神经网络(Convolutional Neural Network,CNN)与通道注意力模块(Channel Attention Module,CAM)相结合的NLoS/LoS识别方法。在多层CNN中嵌入CAM提取原始CIR的时域数据特征,利用全局平均池化层代替全连接层进行特征整合并分类输出。使用欧洲地平线2020计划项目eWINE公开的数据集进行不同结构模型和不同识别方法的对比实验,结果表明,所提出的CNN-CAM模型LoS和NLoS召回率分别达到了92.29%与87.71%,准确率达到了90.00%,F1分数达到了90.22%。与现有多种传统识别方法相比,均具有更好的识别效果。展开更多
基金the National Natural Science Foundation of China(62001478,61972435)Aviation Science Foundation Project Contract(ASFC-20165188004)+1 种基金Shanghai Aerospace Science and Technology Innovation Fund(SAST2021-035)Independent Research Fund of Key Laboratory of Military Scientific Research。
文摘细粒度图像分类是计算机视觉领域的一大分类任务,其难点在于如何通过类别监督信息自主地找到判别性区域.提出一种新的通道-空间融合注意力模块,基于该模块设计了一种新的Swin Transformer算法SwinT⁃NCSA(a Swin Transformer based on a novel channel⁃spatial attention module),分别从通道维和空间维同时提取特征,再将其融入到Swin Transformer模型中以提高其小尺度中多头注意力信息的提取能力.SwinT⁃NCSA算法特别关注了对分类有用的区域,同时忽视对分类无用的背景区域,以此在细粒度图像分类任务中达到较高的分类准确率.在FGVC Aircraft飞机数据集、CUB-200-2011鸟类数据集和Stanford Cars车类数据集3个公共数据集上的实验表明,SwinT⁃NCSA算法可以分别取得93.3%、88.4%和94.7%的准确率,优于同类算法.
文摘针对轴承故障特征提取能力不足、源域与目标域数据分布差异过大等问题,本文提出了一种基于小波包域对抗注意力迁移学习的故障诊断方法(WWRESE-IDALM)。首先,通过小波包变换(Wavelet Packet Transform,WPT)获得不同重点节构的时频域信息;其次,将重构后的时频域信息数据经过一层大卷积核和通道注意力模块(Squeeze and Excitation,SE)提取轴承深度关键信息特征;利用改进的域对抗网络(Domain-Adversarial Training of Neural Networks,DANN)和局部最大平均差异(Local Maximum Mean Discrepancy,LMMD)对齐子域分布,减少相关子域和全局域之间的结构差异;最后,通过标签分类网络完成故障分类。在帕德博恩大学轴承数据集诊断结果证明了所提出的WWRESE-IDALM方法具有良好的变工况故障分类能力。
文摘针对目前基于信道脉冲响应(Channel Impulse Response,CIR)的非视距(None Line of Sight,NLoS)/视距(Line of Sight,LoS)识别方法精度低、泛化能力差的问题,提出了一种多层卷积神经网络(Convolutional Neural Network,CNN)与通道注意力模块(Channel Attention Module,CAM)相结合的NLoS/LoS识别方法。在多层CNN中嵌入CAM提取原始CIR的时域数据特征,利用全局平均池化层代替全连接层进行特征整合并分类输出。使用欧洲地平线2020计划项目eWINE公开的数据集进行不同结构模型和不同识别方法的对比实验,结果表明,所提出的CNN-CAM模型LoS和NLoS召回率分别达到了92.29%与87.71%,准确率达到了90.00%,F1分数达到了90.22%。与现有多种传统识别方法相比,均具有更好的识别效果。