基于多特征组合的细粒度图像分类方法被引量：5

Fine-grained image classification method based on multi-feature combination

下载PDF

导出

摘要针对单一特征表示的局限性会导致细粒度图像分类准确度不高的问题,提出了一种基于卷积神经网络(CNN)和尺度不变特征转换(SIFT)的多特征组合表示方法,综合考虑对目标整体、关键部位和关键点的特征提取。首先,分别以细粒度图像库中的目标整体和头部区域训练CNN得到两个网络模型,用来提取目标的整体和头部CNN特征;然后,对图像库中所有目标区域提取SIFT关键点并通过K均值(K-means)聚类生成码本,再将每个目标区域的SIFT描述子通过局部特征聚合描述符(VLAD)参照码本编码为特征向量;最后,组合多种特征作为最终的特征表示,采用支持向量机(SVM)对细粒度图像进行分类。使用该方法在CUB-200-2011数据库上进行实验,并与单一的特征表示方法进行了比较。实验结果表明,该方法与基于单一CNN特征的细粒度图像分类相比提升了13.31%的准确度,证明了多特征组合对细粒度图像分类的积极作用。 As the limitation of single feature representation may cause low accuracy of fine-grained image classification, a multi-feature combination representation method based on Convolutional Neural Network （CNN） and Scale Invariant Feature Transform （SIFT） was proposed. The features were extracted from the entire target, the key parts and the key points comprehensively. Firstly, two CNN models were trained with the target-entirety regions and the head-only regions in the fine-grained image library respectively, which were used to extract the target-entirety and the head-only CNN features. Secondly, the SIFT key points were extracted from all the target-entirety regions in the image library, and the codebook was generated through the K-means clustering. Then, the SIFT descriptors of each target-entirety region were encoded into a feature vector by using the Vector of Locally Aggregated Descriptors （VLAD） along with the codebook. Finally, Support Vector Machine （SVM） was used to classify the fine-grained images by using the combination of multiple features. The method was evaluated in CUB-200-2011 database and compared with the single feature representation method. The experimental results show that the proposed method can improve the classification accuracy by 13.31% compared with the single CNN feature representation, which proves the positive effect of multi-feature combination on fine-grained image classification.

作者邹承明罗莹徐晓龙 ZOU Chengming;LUO Ying;XU Xiaolong(Hubei Key Laboratory of Transportation Internet of Things（Wuhan University of Technology）,Wuhan Hubei 430070,China;College of Computer Science and Technology,Wuhan University of Technology,Wuhan Hubei 430070,China)

机构地区交通物联网技术湖北省重点实验室(武汉理工大学) 武汉理工大学计算机科学与技术学院

出处《计算机应用》 CSCD 北大核心 2018年第7期1853-1856,1861,共5页 journal of Computer Applications

基金中央高校基本科研业务费专项(2017-zy-084)~~

关键词卷积神经网络尺度不变特征转换 K均值聚类局部特征聚合描述符细粒度图像分类 Convolutional Neural Network （CNN） Scale Invariant Feature Transform （SIFT） K-means clustering Vector of Locally Aggregated Descriptors （VLAD） fine-grained image classification

分类号 TP391.413 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1冯语姗,王子磊.自上而下注意图分割的细粒度图像分类[J].中国图象图形学报,2016,21(9):1147-1154. 被引量：11
2Bo Zhao,Jiashi Feng,Xiao Wu,Shuicheng Yan.A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation[J].International Journal of Automation and computing,2017,14(2):119-135. 被引量：42
3李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：543
4罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：139

二级参考文献99

1LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition [J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
2HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2006, 18(7): 1527-1554.
3LEE H, GROSSE R, RANGANATH R, et al. Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations [C]// ICML '09: Proceedings of the 26th Annual International Conference on Machine Learning. New York: ACM, 2009: 609-616.
4HUANG G B, LEE H, ERIK G. Learning hierarchical representations for face verification with convolutional deep belief networks [C]// CVPR '12: Proceedings of the 2012 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2012: 2518-2525.
5KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [C]// Proceedings of Advances in Neural Information Processing Systems. Cambridge, MA: MIT Press, 2012: 1106-1114.
6GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation [C]// Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2014: 580-587.
7LONG J, SHELHAMER E, DARRELL T. Fully convolutional networks for semantic segmentation [C]// Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2015: 3431-3440.
8SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [EB/OL]. [2015-11-04]. http://www.robots.ox.ac.uk:5000/~vgg/publications/2015/Simonyan15/simonyan15.pdf.
9SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions [C]// Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2015: 1-8.
10HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition [EB/OL]. [2016-01-04]. https://www.researchgate.net/publication/286512696_Deep_Residual_Learning_for_Image_Recognition.

共引文献718

1张哲,邵允学,吕刚.基于机器视觉的台架上钢坯位置分割[J].计算机系统应用,2022,31(10):254-260.
2侯帅鹏,石英,华逸伦,苏涛.基于改进SSD的行人检测模型[J].武汉理工大学学报,2019,41(7):95-102. 被引量：1
3陈凡,宋文革,范誉瀚,陈塞.基于CNN-Transformer融合模型的选煤厂振动筛上杂物语义分割研究[J].煤炭工程,2023,55(S01):193-199.
4张巧荣,徐国愚,张俊峰.利用视觉显著性的前景目标分割[J].兰州大学学报（自然科学版）,2019,55(6):833-840. 被引量：2
5苟玉晓,江永全,杨燕,周冠禄,林凯.基于全卷积神经网络的公交专用道识别[J].计算机应用研究,2020,37(S01):406-407.
6赵毅力,李禹成,陈皓.云南野生鸟类图像自动识别系统[J].计算机应用研究,2020,37(S01):423-425. 被引量：2
7杨颖.基于MobileNet-SSD的蝶类昆虫识别算法[J].智能计算机与应用,2021,11(4):156-158. 被引量：2
8王铮,刘纪平,车向红,王勇,杜凯旋.基于卷积神经网络的地图相似度匹配方法研究[J].测绘科学,2022,47(7):169-175. 被引量：3
9许学斌,刘燊莲,路龙宾,刘晨光.多尺度混合注意力胶囊网络的海洋鱼类识别[J].光电子．激光,2022,33(11):1158-1164. 被引量：2
10雷慧静.卷积神经网络综述[J].中国科技纵横,2018,0(16):44-47. 被引量：1

同被引文献24

1柯圣财,赵永威,李弼程,彭天强.基于卷积神经网络和监督核哈希的图像检索方法[J].电子学报,2017,45(1):157-163. 被引量：36
2于俊清,吴泽斌,吴飞,孙立峰.多媒体工程:2016——图像检索研究进展与发展趋势[J].中国图象图形学报,2017,22(11):1467-1485. 被引量：11
3王念兵,吴秦,许洁,张淮.局部联合结构化稀疏表示的单样本人脸识别[J].计算机工程与应用,2018,54(1):204-209. 被引量：5
4张潜,桑军,吴伟群,吴中元,向宏,蔡斌.基于Xception的细粒度图像分类[J].重庆大学学报（自然科学版）,2018,41(5):85-91. 被引量：16
5王泽宇,吴艳霞,张国印,布树辉.基于空间结构化推理深度融合网络的RGB-D场景解析[J].电子学报,2018,46(5):1253-1258. 被引量：4
6杨晓花,高海云.基于改进贝叶斯的书目自动分类算法[J].计算机科学,2018,45(8):203-207. 被引量：17
7那天,宋晓宁,於东军.基于主元分析和线性判别分析降维的稀疏表示分类[J].南京理工大学学报,2018,42(3):286-291. 被引量：3
8李康,李亚敏,胡学敏,邵芳.基于卷积神经网络的鲁棒高精度目标跟踪算法[J].电子学报,2018,46(9):2087-2093. 被引量：21
9王培森,宋彦,戴礼荣.基于多通道视觉注意力的细粒度图像分类[J].数据采集与处理,2019,34(1):157-166. 被引量：14
10戴志鹏.基于FCN的图像感兴趣区域提取与细粒度分类的研究[J].现代计算机,2019,25(3):44-49. 被引量：2

引证文献5

1葛疏雨,高子淋,张冰冰,李培华.基于核化双线性卷积网络的细粒度图像分类[J].电子学报,2019,47(10):2134-2141. 被引量：17
2王莉,龚文辉,李沁颖.基于约束稀疏表达的细粒度图像分类识别方法[J].计算机仿真,2021,38(11):173-176. 被引量：1
3韩菲,周卫斌,杨永刚,王阳.基于细粒度特征的人脸属性识别[J].天津科技大学学报,2022,37(3):73-80.
4崔西宁,孙红雨,李克龙.基于贝叶斯算法的弱监督细粒度图像分类方法[J].计算机仿真,2022,39(9):467-470. 被引量：2
5曾凡锋,王春真,李琛.基于深浅层特征融合的无监督视频摘要算法研究[J].计算机工程与科学,2023,45(9):1602-1610.

二级引证文献20

1田佳鹭,邓立国.结合嵌入模块的细粒度图像分类方法[J].现代计算机,2021,27(11):106-110.
2卢佳佳.基于计算机视觉的KLT跟踪图像拼接模型设计[J].现代电子技术,2021,44(13):41-45. 被引量：1
3李祥霞,吉晓慧,李彬.细粒度图像分类的深度学习方法[J].计算机科学与探索,2021,15(10):1830-1842. 被引量：7
4李文书,王志骁,李绅皓,赵朋.基于注意力机制的弱监督细粒度图像分类[J].计算机系统应用,2021,30(10):232-239. 被引量：3
5王颖,李晋,赵毅.基于激光传感器的图书错位智慧报警系统研究[J].激光杂志,2021,42(11):179-184.
6杨倩文,周克.基于改进双线性细粒度模型的压板状态识别[J].激光与光电子学进展,2021,58(20):138-147. 被引量：4
7王波,黄冕,刘利军,黄青松,单文琦.基于多层聚焦Inception-V3卷积网络的细粒度图像分类[J].电子学报,2022,50(1):72-78. 被引量：4
8韩成春,崔庆玉.基于B-CNN算法的汽车数据集细粒度图像分类分析[J].自动化仪表,2022,43(3):7-10. 被引量：1
9徐迎春.结合双线性卷积神经网络和注意力机制的人脸表情识别算法[J].九江学院学报（自然科学版）,2022,37(2):54-58. 被引量：1
10张伟华,王海英.基于B-CNN模型的异构网络大数据知识扩充算法研究[J].兵器装备工程学报,2022,43(6):290-294. 被引量：1

1奔跑的传奇本田Super Cub[J].汽车自驾游,2018,0(8):11-11.
2赵毅力,徐丹.联合语义部件的鸟类图像细粒度识别[J].计算机辅助设计与图形学学报,2018,30(8):1522-1529. 被引量：7
3欧强新,李海奎,雷相东,杨英.基于清查数据的福建省马尾松生物量转换和扩展因子估算差异解析——3种集成学习决策树模型的比较[J].应用生态学报,2018,29(6):2007-2016. 被引量：23
4刘佳凤,田娜娜,赵玉杰,周其文,刘潇威,袁旭,郭新蕾.基于Cubist多元混合回归的稻米富集Cd模型构建研究[J].农业环境科学学报,2018,37(6):1059-1065. 被引量：14
5Jin Cui,Hong-li Suo,Jin-hua Wang,Jean-Claude Grivel,Lin Ma,Chun-yan Li,Yao-tang Ji,Shaheen Kausar,Min Liu,Yi Wang.Effect of different deformation and annealing procedures on non-magnetic textured Cu_(60)Ni_(40) alloy substrates[J].International Journal of Minerals,Metallurgy and Materials,2018,25(8):930-936.

计算机应用

2018年第7期

浏览历史

内容加载中请稍等...

基于多特征组合的细粒度图像分类方法被引量：5

参考文献4

二级参考文献99

共引文献718

同被引文献24

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于多特征组合的细粒度图像分类方法 被引量：5

参考文献4

二级参考文献99

共引文献718

同被引文献24

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于多特征组合的细粒度图像分类方法被引量：5