基于迁移学习和批归一化的菜肴图像识别方法被引量：4

FOOD IMAGE RECOGNITION BASED ON TRANSFER LEARNINGAND BATCH NORMALIZATION

下载PDF

导出

摘要菜肴图像识别属于图像细粒度识别。针对菜肴子类之间差距小、外观差异大且受外界因素影响难以识别问题,提出一种基于迁移学习和批归一化结合的深度学习模型菜肴图像识别方法。以预训练的VGG-16为迁移学习基础,对部分卷积层以及全连接层输出做批归一化处理,最终得到尺度变换和平移后的特征集合。通过迁移学习解决深度学习所带来的过拟合问题,获取比人工特征更具有鉴别性的深度特征;通过批归一化处理缓解深度学习中存在的梯度消失问题。迁移学习的相关实验中以loss、top1、top5准确率为指标;批归一化相关实验中以top1准确率和top5准确率为指标。实验表明,在VireoFood172和UEC-Food100数据集上,所提出的模型与原始模型相比,loss明显下降,准确率有大幅提升,并且与现有方法相比在菜肴图像识别的top1和top5准确率上均有所提升。 Food image recognition is a kind of fine-grained image recognition.Considering small gaps among subclasses of various food,large differences in appearance and other uncertain external factors make it difficult to recognize food images,a deep learning model based on transfer learning and batch normalization is put forward to deal with these problems.Based on the pre-trained VGG-16 model,outputs of partial convolution layers and all fully connected layers were normalized,and we obtained the features after scale transform and scale translation.Transfer learning was applied to the model to overcome over-fitting caused by deep learning in some way as well as obtaining more discriminative in-depth features than artificial features.Batch normalization could help solve the problem of gradient disappearance in deep learning.The indicators in the related experiments of transfer learning were loss,top1 precision and top5 precision,while top1 precision and top5 precision were used as indicators in experiments related with batch normalization.The results of the experiments show that the loss decreases significantly,and the precision is greatly improved on VireoFood 172 and UEC-Food 100 datasets compared with the primitive model.Compared with the existing methods,the accuracy of top 1 and top 5 of food image recognition is improved.

作者郭心悦胡沁涵刘纯平杨季文 Guo Xinyue;Hu Qinhan;Liu Chunping;Yang Jiwen(School of Computer Science and Technology,Soochow University,Suzhou 215006,Jiangsu,China)

机构地区苏州大学计算机科学与技术学院

出处《计算机应用与软件》北大核心 2021年第3期124-133,共10页 Computer Applications and Software

基金国家自然科学基金项目(61773272,61272258) 江苏高校优势学科建设工程项目。

关键词菜肴识别卷积神经网络 VGG-16 迁移学习批归一化 Food image recognition Convolutional neural network(CNN) VGG-16 Transfer learning Batch normalization

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1翁雨辰,田野,路敦民,李琼砚.深度区域网络方法的细粒度图像分类[J].中国图象图形学报,2017,22(11):1521-1531. 被引量：17
2冯语姗,王子磊.自上而下注意图分割的细粒度图像分类[J].中国图象图形学报,2016,21(9):1147-1154. 被引量：11
3汪鹏,张奥帆,王利琴,董永峰.基于迁移学习与多标签平滑策略的图像自动标注[J].计算机应用,2018,38(11):3199-3203. 被引量：10
4罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：146
5刘尚旺,郜翔.基于深度模型迁移的细粒度图像分类方法[J].计算机应用,2018,38(8):2198-2204. 被引量：5

二级参考文献37

1Wah C, Branson S, Welinder P, et al. The Caltech-UCSD birds- 200-2011 dataset: Computation & Neural Systems Technical Report, CNS-TR-2011-001 [ R]. San Diego, USA: California Institute of Technology, 2011.
2Nilsback M E, Zisserman A. Automated flower classification over a large number of classes [ C ~//Proceedings of the 6th Indian Conference on Computer Vision, Graphics & Image Processing. Bhubaneswar, India: IEEE, 2008 : 722-729. [DOI: 10.1109/ ICVGIP. 2008.47 ].
3Deng J, Dong W, Socher R, et al. ImageNet: a large-scale hier- archical image database[ C ]//Proceedings of 2009 IEEE Confer- ence on Computer Vision and Pattern Recognition. Miami, FL, USA: IEEE, 2009: 248-255. [DOI: 10. ll09/CVPR. 2009. 5206848 ].
4Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks [ C ~//Proceedings of Ad- vances in Neural Information Processing Systems 25, NIPS. Lake Tahoe, Nevada, USA: MIT press, 2012, 25 (2) : 1097-1105.
5Zeiler M D, Fergus R. Visualizing and understanding eonvolu- tional networks [ C ]//Proceedings of the 13th European Confer- ence on Computer Vision-ECCV 2014. Zurich, Switzerland: Springer International Publishing, 2014: 818-833. [DOI: 10. 1007/978 -3 -319 -10590-1 _531.
6Russakovsky O, Deng J, Huang Z H, et al. Detecting avocados to zucchinis: what have we done, and where are we going? [ C]//Proceedings of the 2013 IEEE International Conference on Computer Vision. Sydney, NSW: IEEE, 2013: 2064-2071. [ DOI : 10.1109/ICCV. 2013. 2581.
7Zhang N, Donahue J, Girshick R, et al. Part-based R-CNNs for fine-grained category detection [ C ]//Proceedings of the 13th Eu- ropean Conference on Computer Vision-ECCV 2014. Zurich, Switzerland: Springer International Publishing, 2014 : 834-849. [ DOI: 10. 1007/978-3-319-10590-1_54].
8Farrell R, Oza O, Zhang N, et al. Birdlets: subordinate categori- zation using volumetric primitives and pose-normalized appear- ance [ C ~//Proceedings of the 2011 International Conference on Computer Vision. Barcelona, Spain: IEEE, 2011: 161-168. [ DOI : 10.1109/ICCV. 2011. 6126238 ].
9Greeting C, Rodner E, Freytag A, et al. Nonparametric part transfer for fine-grained recognition [ C ]//Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recogni- tion. Columbus, OH, USA: IEEE, 2014: 2489-2496. [ DOI: 10.1109/CVPR. 2014.319 ].
10Zhang N, Farrell R, Iandola F, et al. Deformable part descriptors for fine-grained recognition and attribute prediction [ C ]//Pro- ceedings of the 2013 IEEE International Conference on ComputerVision. Sydney, NSW, Australia: IEEE, 2013: 729-736. DOI: 10. ll09/ICCV. 2013.96].

共引文献176

1张哲,邵允学,吕刚.基于机器视觉的台架上钢坯位置分割[J].计算机系统应用,2022,31(10):254-260.
2张巧荣,徐国愚,张俊峰.利用视觉显著性的前景目标分割[J].兰州大学学报（自然科学版）,2019,55(6):833-840. 被引量：2
3赵毅力,李禹成,陈皓.云南野生鸟类图像自动识别系统[J].计算机应用研究,2020,37(S01):423-425. 被引量：5
4王铮,刘纪平,车向红,王勇,杜凯旋.基于卷积神经网络的地图相似度匹配方法研究[J].测绘科学,2022,47(7):169-175. 被引量：5
5许学斌,刘燊莲,路龙宾,刘晨光.多尺度混合注意力胶囊网络的海洋鱼类识别[J].光电子．激光,2022,33(11):1158-1164. 被引量：3
6商立军,臧益民,王四旺.耐钙心肌细胞的分离及基本电生理特性[J].第四军医大学学报,2000,21(2):247-249. 被引量：12
7田娟秀,刘国才,谷珊珊,鞠忠建,刘劲光,顾冬冬.医学图像分析深度学习方法研究与挑战[J].自动化学报,2018,44(3):401-424. 被引量：106
8张潜,桑军,吴伟群,吴中元,向宏,蔡斌.基于Xception的细粒度图像分类[J].重庆大学学报（自然科学版）,2018,41(5):85-91. 被引量：16
9胡清华,王煜,周玉灿,赵红,钱宇华,梁吉业.大规模分类任务的分层学习方法综述[J].中国科学：信息科学,2018,48(5):487-500. 被引量：16
10张号逵,李映,姜晔楠.深度学习在高光谱图像分类领域的研究现状与展望[J].自动化学报,2018,44(6):961-977. 被引量：78

同被引文献30

1周新伦,李锋,华星城,韦剑.甲骨文计算机识别方法研究[J].复旦学报（自然科学版）,1996,35(5):481-486. 被引量：22
2魏丽芳,董恒,潘林,余轮.基于特征的眼底图像配准方法[J].计算机仿真,2011,28(11):227-230. 被引量：2
3李锋,周新伦.甲骨文自动识别的图论方法[J].电子与信息学报,1996,22(S1):41-47. 被引量：21
4姚金良,翁璐斌,王小华.一种基于连通分量的文本区域定位方法[J].模式识别与人工智能,2012,25(2):325-331. 被引量：9
5栗青生,吴琴霞,王蕾.基于甲骨文字形动态描述库的甲骨文输入方法[J].中文信息学报,2012,26(4):28-33. 被引量：12
6朱承璋,邹北骥,向遥,严权峰,梁毅雄,崔锦恺,刘晴.彩色眼底图像视网膜血管分割方法研究进展[J].计算机辅助设计与图形学学报,2015,27(11):2046-2057. 被引量：44
7顾绍通.基于拓扑配准的甲骨文字形识别方法[J].计算机与数字工程,2016,44(10):2001-2006. 被引量：17
8孙俊,谭文军,毛罕平,武小红,陈勇,汪龙.基于改进卷积神经网络的多种植物叶片病害识别[J].农业工程学报,2017,33(19):209-215. 被引量：195
9马鹏鹏,周爱明,姚青,杨保军,唐健,潘修强.图像特征和样本量对水稻害虫识别结果的影响[J].中国水稻科学,2018,32(4):405-414. 被引量：16
10黄潇,谷硕,马晓晔,梁文君,张韵,高连娣,魏锐利.人工智能糖网眼底图像识别在真实世界的应用[J].情报工程,2018,4(1):24-30. 被引量：18

引证文献4

1林小渝,陈善雄,高未泽,莫伯峰,焦清局.基于深度学习的甲骨文偏旁与合体字的识别研究[J].南京师大学报（自然科学版）,2021,44(2):104-116. 被引量：5
2张小青,樊江川,郭新宇,赵春江.基于Faster R-CNN的大田玉米雄穗识别及抽穗期判定研究[J].安徽农业大学学报,2021,48(5):849-856. 被引量：3
3杨红云,肖小梅,黄琼,郑国梁,易文龙.基于卷积神经网络和迁移学习的水稻害虫识别[J].激光与光电子学进展,2022,59(16):323-330. 被引量：14
4董恒,黄香平,傅诏午,邹梓秀,林涌.基于Batch Normalization的UNet视网膜血管分割算法[J].洛阳师范学院学报,2024,43(5):33-37.

二级引证文献22

1刘洋,陆逸,魏钰驰,孙智莹,朱立芳.甲骨文识别技术研究现状与展望[J].知识管理论坛,2023(2):115-125. 被引量：1
2陈牧图,谭睿,石垒垒,冯月芹.基于深度学习的智能垃圾分类系统设计[J].电子测试,2022,36(17):12-14. 被引量：5
3刘玉耀,彭琼尹.基于卷积神经网络和迁移学习的瓯柑病虫害识别研究[J].热带农业科学,2022,42(9):64-70. 被引量：2
4尚皓玺,郭小燕,朱恒宇.基于迁移学习与GhostNet模型的农业害虫图像识别研究[J].软件导刊,2022,21(11):137-143. 被引量：2
5范贝贝,李瑾,马晨.我国作物种业数字化发展:成效、困境与前瞻[J].中国农业科技导报,2022,24(12):25-32. 被引量：5
6王帅,李鹏,苏倩文.甲骨文信息化研究之路简述[J].黄河．黄土．黄种人,2022(27):16-21.
7马娜,郭嘉欣.基于LM神经网络的小麦叶片病害识别[J].农学学报,2023,13(2):60-66. 被引量：2
8邓向武,梁松,齐龙,余淑婷.基于DeepLabV3+的稻田苗期杂草语义分割方法研究[J].中国农机化学报,2023,44(4):174-180. 被引量：3
9郑显润,郑鹏,王文秀,程亚红,苏宇锋.基于多尺度特征提取深度残差网络的水稻害虫识别[J].华南农业大学学报,2023,44(3):438-446. 被引量：3
10马睿,王佳,赵威,郭宏杰,马德新,兰进好.基于卷积神经网络与迁移学习的玉米籽粒图像分类识别[J].中国粮油学报,2023,38(5):128-134. 被引量：7

1李超,柳伟.一种基于Boosting的差分互补卷积网络[J].深圳信息职业技术学院学报,2020,18(6):31-36.
2陈浩,杨俊安,刘辉.基于深度残差适配网络的通信辐射源个体识别[J].系统工程与电子技术,2021,43(3):603-609. 被引量：12
3刘忠强,钟涛,曹晓欢,张煜.基于组织修复的脑肿瘤图像配准方法[J].南方医科大学学报,2021,41(2):292-298. 被引量：1
42020年1-11月房地产企业销售金额TOP20排行榜[J].房地产导刊,2021(1):10-10.
5雷定猷,闫红莹,洪舒华,张英贵.铁路集装箱轻重货物混合平衡装载研究[J].铁道学报,2021,43(1):1-9. 被引量：3
6陈晓丹,陶佳梦,吴松明,翁亚彪,林瑞庆.抗球虫药对鸡源产气荚膜梭菌的体外抑菌效果研究[J].养禽与禽病防治,2021(3):13-18. 被引量：1
7王桉迪,姚睿捷,黄强.基于双边滤波与受限玻尔兹曼机的冷冻电镜单颗粒图像识别[J].生物物理学,2021,9(1):34-42. 被引量：2

计算机应用与软件

2021年第3期

浏览历史

内容加载中请稍等...

基于迁移学习和批归一化的菜肴图像识别方法被引量：4

参考文献5

二级参考文献37

共引文献176

同被引文献30

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于迁移学习和批归一化的菜肴图像识别方法 被引量：4

参考文献5

二级参考文献37

共引文献176

同被引文献30

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于迁移学习和批归一化的菜肴图像识别方法被引量：4