基于多分支注意力增强的细粒度图像分类被引量：6

Fine-grained Image Classification Based on Multi-branch Attention-augmentation

下载PDF

导出

摘要针对细粒度图像类间差距小、类内差距大的问题,文中提出以弱监督学习的方式使用多分支注意力增强卷积网络,从而实现细粒度图像分类。文中采用Inception-V3网络提取图像的基础特征,从中获取多个局部响应区域并进行特征融合,在此基础上采用注意力机制对图像关键区域进行自约束的局部裁剪和局部擦除,避免仅提取目标单个部位的特征,促使网络更加关注目标物体不同部位的细节特征,同时也提升了目标区域的定位精度。此外,文中提出中心正则化损失函数来约束训练过程中获取的注意力区域,以进一步提升目标定位精度和扩大图像特征的类间差距。在3个公开数据集上进行了实验,结果表明,所提方法取得了比当前最优方法更好的结果。 In order to address the challenges of high intra-class variances and low inter-class variances in fine-grained image classification,a multi-branch attention-augmented convolution neural network is proposed to solve the problem.The pre-trained Inception-V3 network is used to extract basic feature.In order to solve the problem that features are extracted from one part of an object and encourage the network to pay more attention to the discriminative features of different parts,we apply self-constrained attention-wised cropping and self-constrained attention-wised erasing on the central parts of the original images.It also improves the detection accuracy of object locations.Meanwhile,a central regularization loss function is proposed to constrain attention-augmented training process to obtain better attention regions and expand the gap between different classes of images.Comprehensive experiments on three benchmark datasets show that our approach surpasses the state-of-art works.

作者张文轩吴秦 ZHANG Wen-xuan;WU Qin(School of Artificial Intelligence and Computer Science,Jiangnan University,Jiangsu,Wuxi 214122)

机构地区江南大学人工智能与计算机学院江南大学江苏省模式识别与计算智能工程实验室

出处《计算机科学》 CSCD 北大核心 2022年第5期105-112,共8页 Computer Science

基金国家自然科学基金(61972180)。

关键词细粒度图像分类弱监督学习多分支注意力增强卷积神经网络中心正则化损失 Fine-grained image classification Weakly supervised learning Multi-branch attention-augmentation Convolutional neural network Central regularization loss

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1杨旺功,淮永建.基于深度卷积生成对抗网络的花朵图像增强与分类[J].计算机科学,2020,47(6):176-179. 被引量：13
2吴建,许镜,丁韬.基于集成迁移学习的细粒度图像分类算法[J].重庆邮电大学学报（自然科学版）,2020,32(3):452-458. 被引量：17

二级参考文献13

1沈学华,周志华,吴建鑫,陈兆乾.Boosting和Bagging综述[J].计算机工程与应用,2000,36(12):31-32. 被引量：66
2王小平.基于运动背景的自适应视频对象分割算法[J].重庆邮电大学学报（自然科学版）,2016,28(1):95-99. 被引量：3
3雷鸣,刘传才.改进的基于深度卷积网的图像匹配算法[J].计算机系统应用,2017,26(1):168-174. 被引量：2
4柏顺陈樵,范文涛.基于多尺度分解的双边滤波图像增强[J].重庆理工大学学报（自然科学）,2017,31(5):133-136. 被引量：3
5罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：146
6白琮,黄玲,陈佳楠,潘翔,陈胜勇.面向大规模图像分类的深度卷积神经网络优化[J].软件学报,2018,29(4):1029-1038. 被引量：63
7王礼,方陆明,陈珣,吴超.基于Lab颜色空间的花朵图像分割算法[J].浙江万里学院学报,2018,31(3):67-73. 被引量：9
8王功明,乔俊飞,王磊.一种能量函数意义下的生成式对抗网络[J].自动化学报,2018,44(5):793-803. 被引量：15
9唐贤伦,杜一铭,刘雨微,李佳歆,马艺玮.基于条件深度卷积生成对抗网络的图像识别方法[J].自动化学报,2018,44(5):855-864. 被引量：143
10缪永伟,刘丽丽,汪逊,张旭东,刘震.基于圆锥代理的单幅花朵图像编辑[J].计算机辅助设计与图形学学报,2018,30(8):1466-1478. 被引量：3

共引文献27

1徐向丽,徐颖达,李波.基于机器学习的塑料分类回收预测系统[J].塑料科技,2020,48(3):82-85. 被引量：1
2韦哲,赵刚,王能才,石栋栋,石恒兵,王玉珍.基于深度学习的糖尿病视网膜分类方法研究[J].中国医学装备,2020,17(10):11-15. 被引量：3
3王爱丽,薛冬,吴海滨,王敏慧.基于条件生成对抗网络的手写数字识别[J].液晶与显示,2020,35(12):1284-1290. 被引量：11
4曹靖城,张继东,史国杰.一种使用边缘增强技术提高相似图片检索召回率的方法[J].电信科学,2021,37(1):76-84. 被引量：1
5田佳鹭,邓立国.结合嵌入模块的细粒度图像分类方法[J].现代计算机,2021,27(11):106-110.
6刘汉卿,康晓东,李博,张华丽,冯继超,韩俊玲.利用深度学习网络对医学影像分类识别的比较研究[J].计算机科学,2021,48(S01):89-94. 被引量：7
7陈慧雅,伍锡如.基于生成对抗网络的交通模糊图像复原[J].桂林电子科技大学学报,2021,41(2):167-172. 被引量：3
8武苏雯,赵慧杰,刘鑫,王佳豪.基于迁移学习的图像分类在诗词中的应用研究[J].计算机技术与发展,2021,31(7):215-220. 被引量：2
9林克正,邓旭,张玉伦.二维线性鉴别分析和协同表示的面部识别方法[J].小型微型计算机系统,2021,42(8):1688-1693.
10施丽红.自适应直方图均衡化的合成孔径雷达图像增强[J].无线电工程,2021,51(9):921-926. 被引量：5

同被引文献36

1邵大培,张艳宁,魏巍.基于PCA和图像匹配的飞机识别算法[J].中国体视学与图像分析,2009,14(3):261-265. 被引量：6
2李霞,卢官明,闫静杰,张正言.多模态维度情感预测综述[J].自动化学报,2018,44(12):2142-2159. 被引量：26
3李萍,张波,尚怡君.基于红外图像和特征融合的飞机目标识别方法[J].电光与控制,2016,23(8):92-96. 被引量：16
4谢云霞,黄海于,胡建斌.基于深度卷积神经网络的糖尿病视网膜病变分期及病灶检测[J].计算机应用,2020,40(8):2460-2464. 被引量：12
5何凯,冯旭,高圣楠,马希涛.基于多尺度特征融合与反复注意力机制的细粒度图像分类算法[J].天津大学学报（自然科学与工程技术版）,2020,53(10):1077-1085. 被引量：6
6顾婷菲,郝鹏翼,白琮,柳宁.结合多通道注意力的糖尿病性视网膜病变分级[J].中国图象图形学报,2021,26(7):1726-1736. 被引量：7
7李祥霞,吉晓慧,李彬.细粒度图像分类的深度学习方法[J].计算机科学与探索,2021,15(10):1830-1842. 被引量：9
8张宸嘉,朱磊,俞璐.卷积神经网络中的注意力机制综述[J].计算机工程与应用,2021,57(20):64-72. 被引量：109
9毛志荣,都云程,肖诗斌,施水才.基于ECA-Net与多尺度结合的细粒度图像分类方法[J].计算机应用研究,2021,38(11):3484-3488. 被引量：18
10郑雯,沈琪浩,任佳.基于Improved DR-Net算法的糖尿病视网膜病变识别与分级[J].光学学报,2021,41(22):64-75. 被引量：12

引证文献6

1陆靖桥,宾炜,卢永锵,麦广柱,陈银,伍雁雄.结合注意力互斥正则的细粒度图像分类[J].计算机应用,2023,43(S01):224-228. 被引量：1
2梁礼明,雷坤,詹涛,周珑颂.特征自适应过滤的视网膜病变分级算法[J].图学学报,2022,43(5):815-824. 被引量：1
3张天舒,刘凡,戴雯雯,高瑞琢.基于模态相关性学习的细粒度分类[J].计算机应用研究,2023,40(11):3450-3455.
4舒振宇,秦昊.基于SKNet注意力机制的飞机类型识别算法[J].中南民族大学学报（自然科学版）,2024,43(1):69-77.
5梁礼明,金家新,冯耀,卢宝贺.融合坐标感知与混合提取的视网膜病变分级算法[J].光电工程,2024,51(1):43-54. 被引量：1
6孙露露,刘建平,王健,邢嘉璐,张越,王晨阳.细粒度图像分类上Vision Transformer的发展综述[J].计算机工程与应用,2024,60(10):30-46.

二级引证文献3

1梁礼明,金家新,冯耀,卢宝贺.融合坐标感知与混合提取的视网膜病变分级算法[J].光电工程,2024,51(1):43-54. 被引量：1
2姜文涛,陈晨,张晟翀.空间位置矫正的稀疏特征图像分类网络[J].光电工程,2024,51(5):66-82.
3蒋飞,李皞,李雅琴,肖松宴,刘天玮.基于注意力机制的DM-BCNN鲨鱼种群细粒度分类方法[J].渔业现代化,2024,51(5):90-101.

1孙家慧,葛华勇,张哲浩.结合注意机制和多尺度卷积的YOLO行人检测[J].计算机系统应用,2022,31(4):171-179. 被引量：11
2姚建斌,张英娜,刘建华.基于卷积神经网络和迁移学习的小麦病虫害识别[J].华北水利水电大学学报（自然科学版）,2022,43(2):102-108. 被引量：16
3周巧黎,马丽,曹丽英,于合龙.基于改进轻量级卷积神经网络MobileNetV3的番茄叶片病害识别[J].智慧农业（中英文）,2022,4(1):47-56. 被引量：13
4黄光怡,唐宁宁,陈琦,蓝倩倩,蒋莉,洪祎祎,吕健,李敏,曾思明,徐帆.基于迁移学习和数据增强策略构建真菌性角膜炎镰刀菌属鉴定的智能诊断系统[J].国际眼科杂志,2022,22(5):736-740. 被引量：2
5刘富,罗冰,裴峥.一种基于区域权重平滑的弱监督目标定位方法[J].西华大学学报（自然科学版）,2022,41(3):1-7.
6龚圣斌,王少杰,侯亮,张荣辉,林晓涵,吴彬云.基于Faster-RCNN算法的轻量化改进及其在沙滩废弃物检测中的应用[J].厦门大学学报（自然科学版）,2022,61(2):253-261. 被引量：4
7朱永红,付瑶,李选亮,王俊祥.基于改进的卷积神经网络陶瓷梭式窑火焰图像分类方法[J].陶瓷学报,2022,43(2):302-309. 被引量：2
8李妮妮,王夏黎,付阳阳,郑凤仙,何丹丹,袁绍欣.一种优化YOLO模型的交通警察目标检测方法[J].图学学报,2022,43(2):296-305. 被引量：9
9拉巴卓嘎.浅谈小学语文教学中如何激发学生的学习兴趣[J].传奇故事,2022(14):69-70.
10翁彬月,秦永彬,黄瑞章,任丽娜,田悦霖.NEMTF:基于多维度文本特征的新闻网页信息提取方法[J].计算机应用研究,2022,39(4):1043-1048.

计算机科学

2022年第5期

浏览历史

内容加载中请稍等...

基于多分支注意力增强的细粒度图像分类被引量：6

参考文献2

二级参考文献13

共引文献27

同被引文献36

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于多分支注意力增强的细粒度图像分类 被引量：6

参考文献2

二级参考文献13

共引文献27

同被引文献36

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于多分支注意力增强的细粒度图像分类被引量：6