CNN和Transformer在细粒度图像识别中的应用综述被引量：10

Review of Applications of CNN and Transformer in Fine-Grained Image Recognition

下载PDF

导出

摘要细粒度图像识别旨在从类别图像中辨别子类别。由于图像间只有细微差异,这使得识别任务具有挑战性。随着深度学习技术的不断进步,基于深度学习的方法定位局部和表示特征的能力越来越强,其中以卷积神经网络(CNN)和Transformer为基础的各类算法大大提高了细粒度图像识别精度,细粒度图像领域得到了显著发展。为了整理两类方法在细粒度图像识别领域的发展历程,对该领域近年来只运用类别标签的方法进行了综述。介绍了细粒度图像识别的概念,详细阐述了主流细粒度图像数据集;介绍了基于CNN和Transformer的细粒度图像识别方法及其性能;最后,总结了细粒度图像识别未来的研究方向。 Fine grained image recognition aims to distinguish subcategories from category images.This makes the recognition task challenging as there are only subtle differences between images.With the continuous progress of deep learning technology,the ability of locating local and representing features based on deep learning methods is becoming stronger and stronger.Among them,various algorithms based on convolutional neural network(CNN)and transformer greatly improve the accuracy of fine-grained image recognition,and the field of fine-grained image has been significantly developed.In order to sort out the development of the two methods in the field of fine-grained image recognition,the methods that only use category labels in this field in recent years are reviewed.Firstly,the concept of fine-grained image recognition is introduced,and the mainstream fine-grained image data set is described in detail.Secondly,the fine-grained image recognition method based on convolutional neural network and visual transformer and its performance are introduced.Finally,the future research direction of fine-grained image recognition is summarized.

作者马瑶智敏殷雁君萍萍 MAYao;ZHI Min;YIN Yanjun;PING Ping(College of Computer Science and Technology,Inner Mongolia Normal University,Hohhot 010022,China)

机构地区内蒙古师范大学计算机科学技术学院

出处《计算机工程与应用》 CSCD 北大核心 2022年第19期53-63,共11页 Computer Engineering and Applications

基金内蒙古自治区高等学校科学研究项目(NJZZ21004) 内蒙古自然科学基金(2018MS06008) 内蒙古师范大学研究生科研创新基金(CXJJS21159)。

关键词细粒度图像识别深度学习卷积神经网络 TRANSFORMER fine-grained image recognition deep learning convolutional neural network(CNN) Transformer

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1李祥霞,吉晓慧,李彬.细粒度图像分类的深度学习方法[J].计算机科学与探索,2021,15(10):1830-1842. 被引量：9

二级参考文献5

1罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：146
2葛疏雨,高子淋,张冰冰,李培华.基于核化双线性卷积网络的细粒度图像分类[J].电子学报,2019,47(10):2134-2141. 被引量：18
3徐可文,许波,吴英,徐浩然.机器学习在超声图像中的应用综述[J].计算机工程与应用,2021,57(4):11-17. 被引量：10
4佘海龙,解山娟,邹静洁.标准分数降维的3D-CNN高光谱遥感图像分类[J].计算机工程与应用,2021,57(4):169-175. 被引量：8
5谢彭宇,徐新.基于多尺度联合学习的行人重识别[J].北京航空航天大学学报,2021,47(3):613-622. 被引量：3

共引文献8

1刘克,顾佼佼,陈健,孟春英.基于深度学习的空中侦察取证目标分类[J].兵工自动化,2022,41(4):60-63.
2何文静,唐庭龙,吴义熔.基于同步重建与分类的深度自编码的分类网络[J].长江信息通信,2022,35(5):21-24. 被引量：1
3陈朝飞.基于深度学习的图像分类方法研究[J].计算机应用文摘,2023,39(17):133-136.
4陆妍,王阳萍,王文润.基于Transformer的小样本细粒度图像分类方法[J].计算机工程与应用,2023,59(23):219-227. 被引量：3
5许华杰,梁书伟.采用特征图增强原型的小样本图像分类方法[J].计算机科学与探索,2024,18(4):990-1000. 被引量：1
6孙露露,刘建平,王健,邢嘉璐,张越,王晨阳.细粒度图像分类上Vision Transformer的发展综述[J].计算机工程与应用,2024,60(10):30-46.
7万成舟,季晓慧,杨眉,何明跃,张招崇,曾姗,王玉柱.基于渐进多粒度训练深度学习的矿物图像识别[J].地学前缘,2024,31(4):112-118. 被引量：1
8高海燕,丁惠君.基于改进双分支视觉Transformer的艺术绘画分类[J].贵阳学院学报（自然科学版）,2024,19(3):98-103.

同被引文献78

1柳絮,王坚,李文.集成变分模态分解和希尔伯特-黄变换的结构振动时频提取模型[J].武汉大学学报（信息科学版）,2021,46(11):1686-1692. 被引量：13
2李欣宇,孙传猛,魏宇,原玥,武志博,李勇.融合Transformer与残差通道注意力的恶劣场景水位智能检测方法[J].电子测量与仪器学报,2023,37(1):59-69. 被引量：5
3陈伟根,范海炉,王有元,孙才新.基于小波能量与神经网络的断路器振动信号识别方法[J].电力自动化设备,2008,28(2):29-32. 被引量：36
4闫鹏程,孙华刚,毛向东,冯广斌.基于EMD与SVD的齿轮箱分形诊断方法研究[J].电子测量与仪器学报,2012,26(5):404-412. 被引量：25
5李舜酩,郭海东,李殿荣.振动信号处理方法综述[J].仪器仪表学报,2013,34(8):1907-1915. 被引量：223
6仝秋娟,赵岂,李萌.基于自适应动态改变的粒子群优化算法[J].微电子学与计算机,2019,36(2):6-10. 被引量：24
7詹长杰,周步祥.基于PCA-SVM模型的中长期电力负荷预测[J].电测与仪表,2015,52(9):6-10. 被引量：13
8陈芳,王建龙,陈丽珍,段美玲,卫芝贤,任保成.ε-CL-20/F_(2311) PBXs力学性能和结合能的分子动力学模拟[J].原子与分子物理学报,2015,32(3):360-365. 被引量：5
9刘骥,张明泽,张振鹏,赵健康,陈昕.外部振动对500kV交联聚乙烯电缆敷设条件的影响[J].高电压技术,2017,43(2):673-681. 被引量：16
10罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：146

引证文献10

1崔岩,方春华,文中,方萌,游海鑫,郭俊康.基于时频谱图和自适应动态权重PSO-CNN的外破振动信号识别[J].国外电子测量技术,2023,42(1):144-152. 被引量：3
2朱丽,王新鹏,付海涛,冯宇轩,张竞吉.基于注意力机制的细粒度图像分类[J].吉林大学学报（理学版）,2023,61(2):371-376. 被引量：7
3霍旭祥,徐峻.基于CNN模型的小分子活性预测[J].计算机应用文摘,2023,39(13):104-106.
4齐爱玲,王宣淋.基于中层细微特征提取与多尺度特征融合细粒度图像识别[J].计算机应用,2023,43(8):2556-2563. 被引量：2
5张凯歌,卢志刚,聂天常,李志伟,郭宇强.面向无人装备的智能边缘计算软技术分析[J].兵工学报,2023,44(9):2611-2621. 被引量：1
6梅礼坤,陈智利,牛恒.基于改进YOLOv5的坦克目标检测算法[J].激光杂志,2024,45(1):92-98. 被引量：3
7张高义,徐杨,曹斌,石进.全局跨层交互网络学习细粒度图像特征表示[J].计算机与现代化,2024(3):97-104.
8王宏,冯佳俊,戴旗,施宇,梁宇航,张辉.基于CNN-LSTM-CS工业管道腐蚀率预测模型[J].计算机系统应用,2024,33(5):103-109. 被引量：1
9沈宇麒,崔衍.基于双层路由注意力及特征融合的细粒度图像分类[J].计算机技术与发展,2024,34(6):23-28.
10万成舟,季晓慧,杨眉,何明跃,张招崇,曾姗,王玉柱.基于渐进多粒度训练深度学习的矿物图像识别[J].地学前缘,2024,31(4):112-118. 被引量：1

二级引证文献18

1何光华,沈超,张伟,孙柯,刘铭扬,齐金龙,赵嘉豪.基于多时相卫星遥感影像的电缆通道外破风险识别研究[J].电力大数据,2023,26(5):73-80. 被引量：1
2薛建强,史彦军,李波.面向无人集群的边缘计算技术综述[J].兵工学报,2023,44(9):2546-2555. 被引量：2
3朱淑畅,李文辉.一种基于自注意力信息补偿的服装分类算法[J].吉林大学学报（理学版）,2023,61(6):1419-1424.
4刘玉鑫,武文博,张雄,万书亭.基于HHO-CNN的轴承故障诊断方法研究[J].河北大学学报（自然科学版）,2023,43(6):571-583. 被引量：3
5苏雯,徐鑫林,胡宇超,黄博涵,周佩廷.面向垃圾图像分类的残差语义强化网络[J].吉林大学学报（信息科学版）,2023,41(6):1030-1040.
6任伟建,张志强,康朝海,霍凤财,孙勤江,陈建玲.基于动态语义特征的视觉SLAM系统[J].吉林大学学报（信息科学版）,2023,41(6):1041-1047.
7吴新桥,张宸瑞,张可颖,金石,沈家旭.基于智能监测技术的输电线路外破点位快速精准识别[J].粘接,2024,51(1):177-180. 被引量：2
8杨文逸,陈明惠,吴玉全,秦楷博,杨政奇.采用自注意力机制的OCT图像AMD亚型分类研究[J].光学技术,2024,50(1):112-119.
9梅礼坤,陈智利,李栋琦.基于改进YOLOv7的反无人机目标识别技术的研究[J].激光杂志,2024,45(2):63-71.
10袁培森,丁毅飞,徐焕良.基于深度主动学习与CBAM的细粒度菊花表型识别[J].农业机械学报,2024,55(2):258-267. 被引量：3

1陈蕾.在企业税务风险管理中大数据技术应用综述[J].中国科技投资,2022(24):110-112. 被引量：1
2马欣竹,王力华.小程序技术在医疗行业的发展应用综述[J].中国数字医学,2022,17(7):1-8.
3李佳园,李耀南,惠继录.灰狼优化算法的应用综述[J].数字技术与应用,2022,40(9):10-13. 被引量：10
4徐寅祺,顾政,陶海升.MOFs表面修饰的电化学传感器在酚类污染物检测中的应用综述[J].环境化学,2022,41(9):3094-3105. 被引量：2
5魏宇,陈倩羽,孟维坤,苏冠勇.高分辨质谱在环境科学领域应用综述[J].环境监控与预警,2022,14(5):18-26.
6张清,王毅承,韩莹琰.叶类蔬菜在景观园艺中的应用综述[J].现代园艺,2022,45(19):146-149. 被引量：1
7郑鹏.电加工工艺在航空制造中的应用综述[J].装备制造技术,2022(6):264-267.
8闫维宏,李少博,单丽莉,孙承杰,刘秉权.显式融合词法和句法特征的抽取式机器阅读理解模型[J].计算机系统应用,2022,31(9):352-359.

计算机工程与应用

2022年第19期

浏览历史

内容加载中请稍等...

CNN和Transformer在细粒度图像识别中的应用综述被引量：10

参考文献1

二级参考文献5

共引文献8

同被引文献78

引证文献10

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

CNN和Transformer在细粒度图像识别中的应用综述 被引量：10

参考文献1

二级参考文献5

共引文献8

同被引文献78

引证文献10

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

CNN和Transformer在细粒度图像识别中的应用综述被引量：10