分类激活图增强的图像分类算法被引量：9

Image Classification Algorithm Based on Classification Activation Map Enhancement

下载PDF

导出

摘要分类激活图(CAM)具有稀疏、不连续、不完整等问题,并且目前大部分研究仅将其用于可视化分析。基于此,首先利用扩张卷积设计了自动加权的多尺度特征学习来弥补分类激活图存在的问题,并将该多尺度特征与分类激活图生成方法结合,设计了多尺度分类激活图生成方法。进一步,将该多尺度的分类激活图嵌入到网络中构成了端到端的结构,实现分类性能增强的目的。以残差网络ResNet为骨干网络,提出了分类增强模型ResNet-CE。在三个公开数据集CIFAR10、CIFAR100和STL10上,对该模型进行了大量的实验。实验表明:ResNet-CE在这三个数据集上的分类性能与参数量相当的ResNet相比有明显的提升,识别的错误率分别降低了0.23%、3.56%和7.96%,并且分类性能优于当前大部分的分类网络。提出的算法能够简单地迁移到已有的分类模型中,提高原有模型的分类性能。同时,该算法保留了对模型判断依据可视化和解释的功能,这在医疗影像中的疾病识别、无人驾驶的场景识别等场景中具有一定的应用价值和意义。 Classification activation map(CAM) has problems such as sparseness, discontinuity, incompleteness, etc.,and most of the current research only uses it for visual analysis. Based on this, this paper firstly utilizes the dilated convolution to design an automatic weighted multi-scale feature learning method in order to compensate for the defects of CAM and combines the multi-scale feature with the generation method of CAM to develop a multi-scale CAM generation method. Further, this paper embeds the multi-scale CAM into the network to form an end-to-end structure in order to enhance the classification performance. Taking the ResNet as the backbone, this paper proposes a classification enhancement model, ResNet-CE. Extensively experiments are conducted with ResNet-CE on three publicly available datasets, CIFAR10, CIFAR100 and STL10. Experiments show that the classification performance of ResNet-CE on these three datasets is significantly improved compared with the ResNet with similar parameters quantity. The error rates are reduced by 0.23%, 3.56% and 7.96%, respectively and the classification performance is better than most mainstream classification models. The proposed model can be easily transferred to the off-the-shelf model to improve its classification performance. At the same time, the algorithm retains the function of visualization and interpretation of the judgment of the model, which has certain application value and significance in scenes, such as diseases recognition in medical image and scene recognition in unmanned driving, etc.

作者杨萌林张文生 YANG Menglin;ZHANG Wensheng(Research Center of Precision Sensing and Control,Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China;School of Artificial Intelligence,University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国科学院自动化研究所精密感知与控制研究中心中国科学院大学人工智能学院

出处《计算机科学与探索》 CSCD 北大核心 2020年第1期149-158,共10页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金Nos.U1636220,61602482,61876183~~

关键词图像分类分类激活图(CAM) 多尺度可视化可解释性 image classification classification activation map(CAM) multiscale visualization interpretability

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1Quan-shi ZHANG,Song-chun ZHU.Visual interpretability for deep learning：a survey[J].Frontiers of Information Technology & Electronic Engineering,2018,19(1):27-39. 被引量：49

共引文献48

1吴飞,廖彬兵,韩亚洪.深度学习的可解释性[J].航空兵器,2019,26(1):39-46. 被引量：37
2朱海麒,姜峰.人工智能时代面向运维数据的异常检测技术研究与分析[J].信息网络安全,2019(11):24-35. 被引量：13
3余萍,曹洁.深度学习在故障诊断与预测中的应用[J].计算机工程与应用,2020,56(3):1-18. 被引量：60
4Guang-Di Liu,Yu-Chen Li,Wei Zhang,Le Zhang.A Brief Review of Artificial Intelligence Applications and Algorithms for Psychiatric Disorders[J].Engineering,2020,6(4):462-467. 被引量：4
5化盈盈,张岱墀,葛仕明.深度学习模型可解释性的研究进展[J].信息安全学报,2020,5(3):1-12. 被引量：42
6苏炯铭,刘鸿福,项凤涛,吴建宅,袁兴生.深度神经网络解释方法综述[J].计算机工程,2020,46(9):1-15. 被引量：26
7Chenshuo Yu,Xiuli Wang,Yang Li.Convolutional Neural Network Visualization in Adversarial Example Attack[J].国际计算机前沿大会会议论文集,2020(1):247-258.
8阳建政,李陶,胡加银,程伟,杜鹏,吴林容,张滢滢.S-Detect技术在甲状腺结节超声诊断中的初步应用[J].肿瘤预防与治疗,2020,33(11):828-833. 被引量：4
9危辉,余莉萍.面向可解释性的物体拓扑结构骨架表征方法[J].中国图象图形学报,2020,25(12):2587-2602. 被引量：2
10刘惠,刘振宇,郏维强,张栋豪,谭建荣.深度学习在装备剩余使用寿命预测技术中的研究现状与挑战[J].计算机集成制造系统,2021,27(1):34-52. 被引量：38

同被引文献78

1王德明,颜熠,周光亮,李勇奇,刘成菊,林立民,陈启军.基于实例分割网络与迭代优化方法的3D视觉分拣系统[J].机器人,2019,41(5):637-648. 被引量：17
2Sunitha Basodi,Chunyan Ji,Haiping Zhang,Yi Pan.Gradient Amplification: An Efficient Way to Train Deep Neural Networks[J].Big Data Mining and Analytics,2020,3(3):196-207. 被引量：7
3彭璐佳,张莉萍,黄勃,谭莲子,童宏伟.基于STM32的车载智能风扇系统的设计与实现[J].传感器与微系统,2018,37(12):76-78. 被引量：9
4周晓明,朱周洪,陈军松,毛拾文,黄永忠.光反射型光伏板清洁度检测仪设计[J].中国计量学院学报,2016,27(1):44-47. 被引量：2
5吴春华,袁同浩,陈雪娟,冯夏云,李智华.光伏电站不均匀积灰检测及优化控制[J].太阳能学报,2017,38(3):774-780. 被引量：8
6周俊宇,赵艳明.卷积神经网络在图像分类和目标检测应用综述[J].计算机工程与应用,2017,53(13):34-41. 被引量：134
7欧习洋,王新华,侯兴哲,刘金涛,张进,陈坚.嵌入式RTOS在智能电能表中的研究与应用[J].电测与仪表,2017,54(12):106-111. 被引量：2
8罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：146
9曲宏伟,王靖雯.积灰对光伏板输出特性影响理论和试验研究[J].太阳能学报,2018,39(8):2335-2340. 被引量：18
10董雪莹,李良荣,黄子强.夜间拍照图像对比度的Gamma灰度校正[J].光电子技术,2018,38(3):195-199. 被引量：5

引证文献9

1赵丽萍,袁霄,祝承,赵晓琦,杨仕虎,梁平,鲁小丫,谭颖.面向图像分类的残差网络进展研究[J].计算机工程与应用,2020,56(20):9-19. 被引量：9
2陈鑫华,钱雪忠,宋威.基于轻量级特征融合卷积网络的图像分类算法[J].计算机工程,2021,47(11):268-275. 被引量：6
3宋东情,朱定局,贺超.基于多模型特征与精简注意力融合的图像分类[J].计算机系统应用,2021,30(11):210-216. 被引量：3
4吴涛.基于特征提取和半监督学习的图像分类算法[J].粘接,2021(11):92-97. 被引量：3
5李宽宽,刘立波.双线性聚合残差注意力的细粒度图像分类模型[J].计算机科学与探索,2022,16(4):938-949. 被引量：3
6马茜.基于图像识别技术的轨道交通缺陷检测研究[J].计算技术与自动化,2022,41(1):117-122. 被引量：8
7何永康,宋连庆,颉清云,郭瑞鸿.可回收物智能分拣系统的设计与实现[J].计算机工程与设计,2022,43(6):1582-1591. 被引量：3
8孙鹏翔,毕利,王俊杰.基于改进深度残差网络的光伏板积灰程度识别[J].计算机应用,2022,42(12):3733-3739. 被引量：2
9姜文涛,董睿,张晟翀.局部注意力引导下的全局池化残差分类网络[J].光电工程,2024,51(7):107-124.

二级引证文献37

1吴佳璐,田秋红,岳金鸿.基于残差双注意力与跨级特征融合模块的静态手势识别[J].计算机系统应用,2022,31(11):111-119. 被引量：1
2朱镕,潘伟,史润发,胡国华,连顺,梅腱.基于特征融合的新冠病毒感染肺部CT图像分类[J].西安文理学院学报（自然科学版）,2024,27(1):1-7.
3黄宏展,蒙祖强.基于双向注意力机制的多模态情感分类方法[J].计算机工程与应用,2021,57(11):119-127. 被引量：3
4周雨帆,李胜旺,杨奎河,白宇,宋子盈.基于轻量级卷积神经网络的苹果表面缺陷检测方法[J].河北工业科技,2021,38(5):388-394. 被引量：13
5宋东情,朱定局,贺超.基于多模型特征与精简注意力融合的图像分类[J].计算机系统应用,2021,30(11):210-216. 被引量：3
6李文其,凌晨昱,余雷.基于卷积神经网络的苹果分级算法研究[J].电工技术,2021(20):48-51. 被引量：5
7ZHOU Honglei,PENG Zhifei,TAO Ran,ZHANG Lu.Feature Fusion Multi_XMNet Convolution Neural Network for Clothing Image Classification[J].Journal of Donghua University(English Edition),2021,38(6):519-526. 被引量：2
8李敬兆,秦晓伟,汪磊.基于边云协同框架的煤矿井下实时视频处理系统[J].工矿自动化,2021,47(12):1-7. 被引量：7
9柴文光,李嘉怡.重加权在多类别不平衡医学图像检测中的应用[J].计算机工程与应用,2022,58(8):237-242. 被引量：4
10肖贤鹏,胡莉,张静,李树春,张华.基于多尺度特征融合的抓取位姿估计[J].计算机工程与应用,2022,58(10):172-177. 被引量：6

1王尤河,游日晴,郑力勇,文春华.基于卷积神经网络的智能巡检机器人场景识别[J].信息技术,2020,44(2):58-61. 被引量：6
2陈俊吉,皮大伟,谢伯元,王洪亮,王霞.基于几何特征与三维点云特征的道路边沿识别算法[J].河北科技大学学报,2019,40(6):461-468. 被引量：4
3李言,蒋高明,吴志明,郑宝平,徐存东.集成于CAM的经编制造执行系统的设计与实现[J].上海纺织科技,2019,47(12):70-73. 被引量：2
4魏志强,毕海霞,刘霞.基于深度卷积神经网络的图上半监督极化SAR图像分类算法[J].电子学报,2020,48(1):66-74. 被引量：10
5马盼盼,王建华,杜虎兵,梁雯.基于SoC FPGA的CNC齿轮测量中心控制器设计[J].工具技术,2020,54(1):103-106. 被引量：6
6信红亚,石镇港,吴莉峰,张妙红,袁湘中,王平,徐永兴,曾贵荣,王海均.醒脑静注射液对大鼠全脑缺血性深昏迷的早期保护作用及其机制[J].中南大学学报（医学版）,2019,44(12):1330-1337. 被引量：8
7钱潇驰,米书里.基于深度神经网络的唐卡的色彩风格特征提取[J].计算机科学与应用,2019,9(11):2129-2134. 被引量：2
8朱向庆,朱万鸿,何昌毅,甘海杰,陈泽锐.面向儿童的智能聊天机器人设计[J].物联网技术,2020,10(1):71-74. 被引量：2
9明志君,陈祉妍.心理健康素养：概念、评估、干预与作用[J].心理科学进展,2020,28(1):1-12. 被引量：106
10何瑞华,镇煌,尤勇,马宸阳.非现场违法记录智能筛选审核的应用研究[J].科学与信息化,2019,0(33):3-5.

计算机科学与探索

2020年第1期

浏览历史

内容加载中请稍等...

分类激活图增强的图像分类算法被引量：9

参考文献1

共引文献48

同被引文献78

引证文献9

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

分类激活图增强的图像分类算法 被引量：9

参考文献1

共引文献48

同被引文献78

引证文献9

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

分类激活图增强的图像分类算法被引量：9