基于多尺度特征融合与反复注意力机制的细粒度图像分类算法被引量：6

Fine-Grained Image Classification Algorithm Using Multi-Scale Feature Fusion and Re-Attention Mechanism

下载PDF

导出

摘要细粒度图像分类是对某一类别下的图像子类进行精确划分.细粒度图像分类以其特征相似、姿态各异、背景干扰等特点,一直是计算机视觉和模式识别领域的研究热点和难点,具有重要的研究价值.细粒度图像分类的关键在于如何实现对图像判别性区域的精确提取,已有的基于神经网络算法在精细特征提取方面仍有不足.为解决这一问题,本文提出了一种多尺度反复注意力机制下的细粒度图像分类算法.考虑到高、低层级的特征分别具有丰富的语义、纹理信息,分别将注意力机制嵌入到不同尺度当中,以获取更加丰富的特征信息.此外,对输入特征图先后采取通道和空间注意,该过程可以看作是对特征矩阵的反复注意力(re-attention);最后以残差的方式,将注意力结果与原始输入特征相结合,将不同尺度特征图的注意结果拼接起来送入全连接层,以更加精确地提取显著性特征.在国际上公开的细粒度数据集(CUB-200-2011、FGVC Aircraft和Stanford Cars)上进行实验仿真,分类准确率分别达到86.16%、92.26%和93.40%;与只使用ResNet50结构相比,分别提高了1.66%、1.46%和1.10%;明显高于现有经典算法,也高于人类表现,验证了本文算法的有效性. Fine-grained image classification aims to precisely classify an image subclass under a certain category.Hence,it has become a commonand difficult point in the field of computer vision and pattern recognition and has important research value due to its similar features,different gestures,and background interference.The key issue in fine-grained image classification is how to extract precise features from the discriminative region of an image.Existing algorithms based on neural networks are still insufficient in fine feature extraction.Accordingly,a fine-grained image classification algorithm using multi-scale re-attention mechanism is proposed in this study.Considering that high-and low-level features have rich semantic and texture information,respectively,attention mechanism is embedded in different scales to obtain rich feature information.In addition,an input feature map is processed with both channel and spatial attention,which can be regarded as the re-attention of a feature matrix.Finally,using the residual form to combine the attention results and original input feature maps,the attention results on the feature maps of different scales are concatenated and fed into the full connection layer.Thus,accurately extracting salient features is helpful.Accuracy rates of 86.16%,92.26%,and 93.40%are obtained on the international public fine-grained datasets(CUB-200-2011,FGVC Aircraft,and Stanford Cars).Compared with ResNet50,the accuracy rate is increased by 1.66%,1.46%,and 1.10%,respectively.It is obviously higher than that of existing classical algorithms and human performance,which demonstrate the effectiveness of the proposed algorithm.

作者何凯冯旭高圣楠马希涛 He Kai;Feng Xu;Gao Shengnan;Ma Xitao(School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China)

机构地区天津大学电气自动化与信息工程学院

出处《天津大学学报（自然科学与工程技术版）》 EI CSCD 北大核心 2020年第10期1077-1085,共9页 Journal of Tianjin University：Science and Technology

基金国家自然科学基金资助项目(61271326).

关键词细粒度图像分类多尺度特征融合反复注意力机制 ResNet50 fine-grained image classification multi-scale feature fusion re-attention mechanism ResNet50

分类号 TN911.73 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1冀中,赵可心,张锁平,李明兵.基于空间变换双线性网络的细粒度鱼类图像分类[J].天津大学学报（自然科学与工程技术版）,2019,52(5):475-482. 被引量：10

二级参考文献1

1冀中,谢于中,庞彦伟.基于典型相关分析和距离度量学习的零样本学习[J].天津大学学报（自然科学与工程技术版）,2017,50(8):813-820. 被引量：5

共引文献9

1刘建明,刘煌.基于对抗双线性的细粒度鱼类图像分类方法[J].桂林电子科技大学学报,2020,40(4):316-320.
2史再峰,李慧龙,程明,曹清洁,王子菊.基于SDN-GMM网络的低剂量双能CT投影数据去噪方法[J].天津大学学报（自然科学与工程技术版）,2021,54(9):899-906. 被引量：3
3毛志荣,都云程,肖诗斌,施水才.基于ECA-Net与多尺度结合的细粒度图像分类方法[J].计算机应用研究,2021,38(11):3484-3488. 被引量：17
4杨倩文,周克.基于改进双线性细粒度模型的压板状态识别[J].激光与光电子学进展,2021,58(20):138-147. 被引量：4
5姚青,姚波,吕军,唐健,冯晋,朱旭华.基于双线性注意力网络的农业灯诱害虫细粒度图像识别研究[J].中国农业科学,2021,54(21):4562-4572. 被引量：11
6袁培森,宋进,徐焕良.基于残差网络和小样本学习的鱼图像识别[J].农业机械学报,2022,53(2):282-290. 被引量：5
7赵正伟,朱宏进,杨根滕,王金坤.基于改进Res2Net模型的淡水鱼类图像分类研究[J].软件工程,2022,25(7):28-32.
8巫统仁,张显,刘培,文婷婷,邹振学.一种联合空间变换和置换注意力机制的近岸水产养殖区信息提取方法[J].大连海洋大学学报,2024,39(2):327-336.
9李国鹏,罗建桥,曾保誌,熊鹰,李柏林.增强空间变换的细粒度高频元件分类模型[J].制造业自动化,2024,46(5):61-68.

同被引文献55

1柳小军,鲍鸿.基于ARM9多传感器数据融合火灾报警系统的实现[J].工业控制计算机,2009,22(3):52-53. 被引量：10
2李新宇,张建良,苏步新,国宏伟,郭建.图像技术在炼铁系统中的应用现状及发展(续完)[J].冶金自动化,2015,39(2):1-5. 被引量：3
3秦亭亭,马力,陈超,王玉涛.高炉风口喷煤流量检测方法研究[J].工业计量,2015,25(2):36-39. 被引量：2
4傅天驹,郑嫦娥,田野,丘启敏,林斯俊.复杂背景下基于深度卷积神经网络的森林火灾识别[J].计算机与现代化,2016(3):52-57. 被引量：33
5兰琪,贾敏智.基于图像型的矿井火灾探测方法研究[J].煤炭技术,2016,35(4):187-189. 被引量：6
6王慧,宋宇宁.D-S证据理论在火灾检测中的应用[J].中国安全科学学报,2016,26(5):19-23. 被引量：8
7常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：419
8孙继平,钱晓红.2004—2015年全国煤矿事故分析[J].工矿自动化,2016,42(11):1-5. 被引量：73
9周俊宇,赵艳明.卷积神经网络在图像分类和目标检测应用综述[J].计算机工程与应用,2017,53(13):34-41. 被引量：129
10罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：141

引证文献6

1张天放,张先玲,韩涛,施泽杰,郭永强,王惠永.人工智能图像识别技术在高炉风口监测中的应用[J].冶金自动化,2021,45(3):58-66. 被引量：8
2白瑜颖,刘宁钟,姜晓通.结合注意力混合裁剪的细粒度分类网络[J].计算机技术与发展,2021,31(10):38-42. 被引量：2
3何文静,唐庭龙,吴义熔.基于同步重建与分类的深度自编码的分类网络[J].长江信息通信,2022,35(5):21-24. 被引量：1
4赵端,李涛,董彦强,王志强,刘春.基于边缘智能的煤矿外因火灾感知方法[J].工矿自动化,2022,48(12):108-115. 被引量：4
5高静,段中兴,何宇超.多尺度特征融合的轻量型垃圾分类方法[J].小型微型计算机系统,2023,44(2):376-382. 被引量：1
6孙露露,刘建平,王健,邢嘉璐,张越,王晨阳.细粒度图像分类上Vision Transformer的发展综述[J].计算机工程与应用,2024,60(10):30-46.

二级引证文献16

1李长春,郑春,黄晓林,王定华.智慧工地安防系统研发及运用[J].智能建筑与智慧城市,2022(5):147-149. 被引量：4
2赵恒,陈玮,陈禹.基于人工智能的光交箱资源管理方法[J].信息通信技术与政策,2023(1):89-96. 被引量：2
3孟莉莎,杨贤昭,刘惠康.基于CA-EfficientNetV2的蘑菇图像分类算法研究[J].激光与光电子学进展,2022,59(24):48-55. 被引量：4
4孟令茹,李福民,刘小杰,张智峰,李欣,吕庆.高炉炼铁智能化的研究现状与展望[J].冶金自动化,2023,47(2):27-40. 被引量：2
5刘然,赵伟光,刘颂,刘小杰,李宏扬,吕庆.高炉冶炼智能化的发展与探讨[J].钢铁,2023,58(5):1-10. 被引量：12
6杨莹,吴爱祥,王先成,王国立.基于RAdam算法优化ResNet50模型膏体图像识别方法研究[J].中国矿业,2023,32(7):79-86. 被引量：2
7周荣宝,王寅,陈鹏飞,王宏涛,明名,龙红明,杨代伟,王平.高炉综合炉料熔滴性能及其预测模型[J].中国冶金,2023,33(8):33-42. 被引量：3
8吴甜,刘海华,童顺延.基于深度反馈的卷积神经网络的图像分类[J].计算机与现代化,2023(9):82-86.
9杜雨馨,张贺,王树臣,张建化.综掘系统视觉处理技术研究现状及发展趋势[J].工矿自动化,2023,49(11):22-38. 被引量：2
10任艺,谢林蓉,杜胜,胡杰,陈略峰,吴敏.智能制造在钢铁冶金铁前工序的应用现状及展望[J].烧结球团,2023,48(6):22-30.

1李卫中.基于场景局部特征的多曝光图像融合[J].计算机应用,2020,40(8):2365-2371. 被引量：3
2王孝义,邢素霞,王瑜,曹宇,申楠,潘子妍.基于自适应能量偏移场无边缘主动轮廓模型的乳腺肿块分割与分类方法研究[J].中国医学物理学杂志,2020,37(8):1010-1016. 被引量：3
3张晗昀,罗昌荣,崔梦雪,蚁志鸿,张伟,陈德花.利用AMDAR数据分析厦门、泉州双雷达三维风场反演误差[J].大气科学学报,2020,43(4):699-706. 被引量：2
4LU Yao,SUN You,LIU Xiaodong,GAO Bo.Control allocation for a class of morphing aircraft with integer constraints based on Lévy flight[J].Journal of Systems Engineering and Electronics,2020,31(4):826-840. 被引量：3
5ZOU Yiru,LIU Chunsheng,LU Ke.Extended state observer based smooth switching control for tilt-rotor aircraft[J].Journal of Systems Engineering and Electronics,2020,31(4):815-825. 被引量：1

天津大学学报（自然科学与工程技术版）

2020年第10期

浏览历史

内容加载中请稍等...

基于多尺度特征融合与反复注意力机制的细粒度图像分类算法被引量：6

参考文献1

二级参考文献1

共引文献9

同被引文献55

引证文献6

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于多尺度特征融合与反复注意力机制的细粒度图像分类算法 被引量：6

参考文献1

二级参考文献1

共引文献9

同被引文献55

引证文献6

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于多尺度特征融合与反复注意力机制的细粒度图像分类算法被引量：6