-
题名基于改进MMAL的细粒度图像分类研究
- 1
-
-
作者
李冰锋
冀得魁
杨艺
-
机构
河南理工大学电气工程与自动化学院
河南省煤矿装备智能检测与控制重点实验室
-
出处
《电子测量技术》
北大核心
2024年第17期172-179,共8页
-
基金
河南省科技攻关项目(222102210230)
河南理工大学博士基金(B2018-33)项目资助。
-
文摘
针对细粒度图像分类中目标区域难以精准定位及其内部细粒度特征难以识别的问题,提出了一种基于改进MMAL的细粒度图像分类方法。首先,利用形变卷积的感知区域可变性原理,动态地感知样本图像中不同尺度和形状的目标区域特征,从而增强网络对目标区域位置的感知能力。随后,采用GradCAM梯度回流的方法生成网络注意力热图,以减小特征背景噪声的干扰,实现对图像目标区域的精准定位。最后,提出位置感知空间注意力模块,通过融合坐标位置和双尺度空间信息,显著提升了网络对目标区域细粒度特征的提取能力。实验结果表明,与基线算法相比,该方法在CUB-200-2011、Stanford Car和FGVC-Aircraft三个公共数据集上分类精度分别提升了1.4%、1.5%、1.9%,该结果验证了所提方法的有效性。
-
关键词
细粒度图像分类
多尺度形变分组
位置感知空间注意力
GradCAM热图定位
多分支
-
Keywords
fine-grained image classification
multi-scale deformable grouping
position-aware spatial attention
GradCAM heatmap localization
multi-branch architecture
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TN791
[电子电信—电路与系统]
-