基于Faster R-CNN的食品图像检索和分类被引量：11

Faster R-CNN based food image retrieval and classification

下载PDF

导出

摘要面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49 168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能. Automatic understanding of food images has various applications in different fields,such as food intake monitor and food calorie estimation.Thus,the research on food related tasks,such as food image retrieval and classification has been one of the hot research topics in the field of multimedia analysis and applications recently.Existing methods mainly extract the visual features from the whole food image for further food analysis.The extracted features are lacking in robustness because of the background interference from the images.In order to solve this problem,we propose a Faster R-CNN（ Region-based Convolutional Neural Network） based food retrieval and classification method.For the solution,we first detect the food candidate regions using Faster R-CNN,and then adopt the CNN network to extract the visual features from the detected food regions.Such extracted features are more discriminative for reducing the background interference.Furthermore,we select the annotated food images from the Visual Genome dataset to fine-tune the Faster R-CNN to guarantee its performance. We conduct the experiment on two datasets：Food-101 with 101 classes and 10 641 food images,and Dish-233 with 233 dishes and 49 168 images.The extensive evaluation demonstrates the effectiveness of the proposed Faster R-CNN based food visual feature extraction method in food image retrieval and classification.

作者梅舒欢闵巍庆刘林虎段华蒋树强

机构地区山东科技大学数学与系统科学学院中国科学院计算技术研究所智能信息处理重点实验室中国科学院大学人工智能技术学院

出处《南京信息工程大学学报（自然科学版）》 CAS 2017年第6期635-641,共7页 Journal of Nanjing University of Information Science & Technology（Natural Science Edition）

基金国家自然科学基金(61532018 61602437 61672497 61472229 61202152) 北京市科技计划(D161100001816001) 山东省自然科学基金(ZR2017MF02) 山东省科技发展计划(2016ZDJS02A11 2014GGX101035 2014BSB01020)

关键词食品图像图像检索图像分类深度学习 FASTER R-CNN 卷积神经网络 food image image retrieval image classification deep learning Faster R-CNN convolutional neural network

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献86

1方仁渊,王敏.基于改进型YOLO网络的商品包装类型检测[J].电子测量技术,2020(7):108-112. 被引量：5
2周亚军,王淑杰,闫琳娜,于庆宇.重组鹿肉制品的加工特性[J].农业工程学报,2008,24(9):268-275. 被引量：15
3林传力,赵宇明.基于Sift特征的商标检索算法[J].计算机工程,2008,34(23):275-277. 被引量：17
4王殿海,胡宏宇,李志慧,曲昭伟.违章停车检测与识别算法[J].吉林大学学报（工学版）,2010,40(1):42-46. 被引量：17
5蔺海峰,马宇峰,宋涛.基于SIFT特征目标跟踪算法研究[J].自动化学报,2010,36(8):1204-1208. 被引量：71
6程曼,王让会.物联网技术的研究与应用[J].地理信息世界,2010,8(5):22-28. 被引量：65
7张浩鹏,王宗义.基于灰度方差和边缘密度的车牌定位算法[J].仪器仪表学报,2011,32(5):1095-1102. 被引量：42
8赵志军,沈强,唐晖,方旭明.物联网架构和智能信息处理理论与关键技术[J].计算机科学,2011,38(8):1-8. 被引量：72
9丁治明,高需.面向物联网海量传感器采样数据管理的数据库集群系统框架[J].计算机学报,2012,35(6):1175-1191. 被引量：96
10王小燕,王锡昌,刘源,董若琰.基于SVM算法的近红外光谱技术在鱼糜水分和蛋白质检测中的应用[J].光谱学与光谱分析,2012,32(9):2418-2421. 被引量：10

引证文献11

1唐士宇,朱艾春,张赛,曹青峰,崔冉,华钢.基于深度卷积神经网络的井下人员目标检测[J].工矿自动化,2018,44(11):32-36. 被引量：9
2蔡超,刘海慧,陈亚峰,刘江锋,杨艳.基于人工智能的物联网远端资产巡检系统应用[J].邮电设计技术,2018(12):27-30.
3向华荣,曾敬.基于卷积神经网络的汽车试验场外物入侵识别[J].重庆交通大学学报（自然科学版）,2020,39(1):8-14. 被引量：11
4李辉,闵巍庆,王致岭,彭鑫.基于图卷积网络的多标签食品原材料识别[J].南京信息工程大学学报（自然科学版）,2019,11(6):743-750. 被引量：1
5王博,杨洪遥,陆逢贵,陈子东,曹振霞,刘登勇.重组牛肉图像识别模型的比较研究[J].肉类研究,2020,34(7):13-17. 被引量：1
6王博,杨洪遥,陆逢贵,陈子东,曹振霞,刘登勇.糖熏鸡腿颜色快速精准识别的多层卷积神经网络模型研究[J].食品与发酵工业,2021,47(1):259-265. 被引量：3
7陈欢欢,汪建晓,王高杰,陈勇.基于改进Faster R-CNN的瓶装饮料商品目标检测方法[J].集成技术,2021,10(3):1-11. 被引量：1
8陈浩霖,高尚兵,相林,蔡创新,汪长春.FIRE-DET:一种高效的火焰检测模型[J].南京信息工程大学学报（自然科学版）,2023,15(1):76-84. 被引量：4
9庄建军,叶振兴.基于改进YOLOv5m的电动车骑行者头盔与车牌检测方法[J].南京信息工程大学学报（自然科学版）,2024,16(1):1-10. 被引量：5
10曹品丹,闵巍庆,宋佳骏,盛国瑞,杨延村,王丽丽,蒋树强.基于增强视觉Transformer的哈希食品图像检索[J].食品科学,2024,45(10):1-8.

二级引证文献36

1张春堂,管利聪.基于SSD-MobileNet的矿工安保穿戴设备检测系统[J].工矿自动化,2019,45(6):96-100. 被引量：12
2杨建伟,涂兴子,梅峰漳,李亚宁,范鑫杰.基于深度学习优化YOLOV3算法的芳纶带检测算法研究[J].中国矿业,2020,29(4):67-72. 被引量：3
3孙杰臣,李敬兆,王继伟,许志.煤矿井下人车联动控制系统[J].工矿自动化,2020,46(12):7-12. 被引量：2
4魏智锋,肖书浩,蒋国璋,伍世虔,程国飞.基于深度学习的人造板表面缺陷检测研究[J].林产工业,2021,58(2):21-26. 被引量：18
5唐克双,陈思曲,曹喻旻,张锋鑫.基于Inception卷积神经网络的城市快速路行程速度短时预测[J].同济大学学报（自然科学版）,2021,49(3):370-381. 被引量：7
6董昕宇,师杰,张国英.基于参数轻量化的井下人体实时检测算法[J].工矿自动化,2021,47(6):71-78. 被引量：6
7赵树恩,刘伟.基于改进VGG模型的低照度道路交通标志识别[J].重庆交通大学学报（自然科学版）,2021,40(10):178-184. 被引量：8
8马建民.铁路运输通信网络入侵信号识别方法研究[J].信息技术,2022,46(3):138-143.
9吕东芳,宋雷震.基于卷积神经网络车辆行驶的识别预警系统[J].青岛理工大学学报,2022,43(2):148-154. 被引量：1
10付吉菊.交互式网络恶意入侵跳频数据特征自动挖掘方法[J].宁夏师范学院学报,2022,43(7):72-79. 被引量：2

1周文罡,李厚强,田奇.图像检索技术研究进展[J].南京信息工程大学学报（自然科学版）,2017,9(6):613-634. 被引量：12
2郑肇葆,郑宏.利用数据引力进行图像分类[J].武汉大学学报（信息科学版）,2017,42(11):1604-1607. 被引量：2
3曹大有,胥帅.基于TensorFlow预训练模型快速、精准的图像分类器[J].汉江师范学院学报,2017,37(3):27-32. 被引量：12
4倪世彬.大数据时代下人力资源管理的革新[J].现代商业,2017(29):40-41. 被引量：4
5杨国亮,王志元,张雨.一种改进的深度卷积神经网络的精细图像分类[J].江西师范大学学报（自然科学版）,2017,41(5):473-480. 被引量：5
6刘芳辉,郭慧,张培,胡方尚.边界元在基于形状特征图像检索中的应用[J].东华大学学报（自然科学版）,2017,43(5):694-702.
7王强,李孝杰,陈俊.基于He-Net的卷积神经网络算法的图像分类研究[J].成都信息工程大学学报,2017,32(5):503-507. 被引量：2
8杨文,钟能,严天恒,杨祥立.基于黎曼流形的极化SAR图像分类[J].雷达学报（中英文）,2017,6(5):433-441. 被引量：1
9徐思雨,蔡佳妮,祝继华,王佳星,栾婷婷,庞善民.自适应多位编码量化的哈希图像检索方法[J].西安交通大学学报,2017,51(8):19-25. 被引量：1
10朱杰,吴树芳,谢博鋆,马丽艳.基于颜色的压缩层次图像表示方法[J].计算机应用,2017,37(11):3238-3243.

南京信息工程大学学报（自然科学版）

2017年第6期

浏览历史

内容加载中请稍等...

基于Faster R-CNN的食品图像检索和分类被引量：11

同被引文献86

引证文献11

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于Faster R-CNN的食品图像检索和分类 被引量：11

同被引文献86

引证文献11

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于Faster R-CNN的食品图像检索和分类被引量：11