期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
改进注意力模型的食品图像识别方法
1
作者 姜枫 周莉莉 《计算机工程与应用》 CSCD 北大核心 2024年第12期153-159,共7页
随着人们对健康饮食需求的日益增加,各种饮食评估辅助软件应运而生,食品图像识别问题受到越来越多的关注。食品图像识别属于细粒度图像识别问题,较其他图像识别难度更大。目前主流的食品图像数据集,如ISIA Food-500、ETH Food-101、Vire... 随着人们对健康饮食需求的日益增加,各种饮食评估辅助软件应运而生,食品图像识别问题受到越来越多的关注。食品图像识别属于细粒度图像识别问题,较其他图像识别难度更大。目前主流的食品图像数据集,如ISIA Food-500、ETH Food-101、Vireo Food-172等所包含的图像数量偏少,难以很好地训练图像识别系统,进一步增大了图像识别难度。提出一种基于注意力机制的图像识别方法,该方法在自注意力的基础上引入局部注意力的概念,用于描绘图像细粒度特征,提高图像识别的准确率。此外,还提出一种图像自监督预训练算法,缓解食品图像训练样本不足的问题。实验结果表明,所提方法在ISIA Food-500数据集的Top-1和Top-5准确率分别达到65.58%和90.03%,性能优于现有的其他算法。 展开更多
关键词 食品图像 细粒度图像识别 局部注意力 自监督预训练 ISIA Food-500数据集
下载PDF
基于增强视觉Transformer的哈希食品图像检索
2
作者 曹品丹 闵巍庆 +4 位作者 宋佳骏 盛国瑞 杨延村 王丽丽 蒋树强 《食品科学》 EI CAS CSCD 北大核心 2024年第10期1-8,共8页
作为食品计算的一个主要任务,食品图像检索近年来受到了广泛的关注。然而,食品图像检索面临着两个主要的挑战。首先,食品图像具有细粒度的特点,这意味着不同食品类别之间的视觉差异可能很小,这些差异只能在图像的局部区域中观察到。其次... 作为食品计算的一个主要任务,食品图像检索近年来受到了广泛的关注。然而,食品图像检索面临着两个主要的挑战。首先,食品图像具有细粒度的特点,这意味着不同食品类别之间的视觉差异可能很小,这些差异只能在图像的局部区域中观察到。其次,食品图像包含丰富的语义信息,如食材、烹饪方式等,这些信息的提取和利用对于提高检索性能至关重要。为解决这些问题,本实验基于预训练的视觉Transformer(Vision Transformer,ViT)模型提出了一种增强ViT的哈希网络(enhanced ViT hash network,EVHNet)。针对食品图像的细粒度特点,EVHNet中设计了一个基于卷积结构的局部特征增强模块,使网络能够学习到更具有代表性的特征。为更好地利用食品图像的语义信息,EVHNet中还设计了一个聚合语义特征模块,根据类令牌特征来聚合食品图像中的语义信息。本实验提出的EVHNet模型在贪婪哈希、中心相似量化和深度极化网络3种流行的哈希图像检索框架下进行评估,并与AlexNet,ResNet50、ViT-B_32和ViT-B_164种主流网络模型进行比较,在Food-101、Vireo Food-172、UEC Food-2563个食品数据集上的实验结果表明,EVHNet模型在检索精度上的综合性能优于其他模型。 展开更多
关键词 食品图像检索 食品计算 哈希检索 VisionTransformer网络 深度哈希学习
下载PDF
基于CBAM-InceptionV3迁移学习的食品图像分类 被引量:1
3
作者 杜慧江 崔潇以 +1 位作者 王艺蒙 孙丽萍 《粮油食品科技》 CAS CSCD 北大核心 2024年第1期91-98,共8页
为提高食品图像自动识别分类的准确率,提出一种嵌入通道注意力机制和空间注意力机制的卷积块注意力模块(CBAM)的“开端”第三版(Inception V3)分类模型。将带有图像网络(ImageNet)预训练权重参数的InceptionV3模型拆分后,在每个Inceptio... 为提高食品图像自动识别分类的准确率,提出一种嵌入通道注意力机制和空间注意力机制的卷积块注意力模块(CBAM)的“开端”第三版(Inception V3)分类模型。将带有图像网络(ImageNet)预训练权重参数的InceptionV3模型拆分后,在每个Inception块后嵌入CBAM模块,再重新组装成新模型,共嵌入11个CBAM模块。将此模型用于经过填充和缩放到299×299像素的Food-101食品图像数据集进行迁移学习,最高准确率达到82.01%。与原始的InceptionV3模型相比,CBAM模块能够有效提升模型的特征提取和分类能力;同时迁移学习与从头开始训练相比也可以大幅提高准确率、缩短训练时间。与其它几类主流卷积神经网络模型进行对比实验,结果表明该模型具有较高的识别准确率,可为食品图像分类识别提供有力支撑。 展开更多
关键词 食品图像分类 通道注意力 空间注意力 CBAM InceptionV3 迁移学习
下载PDF
深度学习在食品图像识别与分类中的应用研究
4
作者 张奥雅 《中国食品工业》 2024年第6期130-133,共4页
随着科学技术的不断发展,我国机器学习领域取得了显著的成就,尤其是在语音和图像上的深度学习技术极具优势并得到了广泛应用。本文重点阐述了深度学习技术在食品图像识别以及分类中的应用方法和效果,旨在实现对各种食品图像的快速分类... 随着科学技术的不断发展,我国机器学习领域取得了显著的成就,尤其是在语音和图像上的深度学习技术极具优势并得到了广泛应用。本文重点阐述了深度学习技术在食品图像识别以及分类中的应用方法和效果,旨在实现对各种食品图像的快速分类以及精准识别,以期为从业人员提供参考和借鉴。 展开更多
关键词 深度学习 食品图像 识别分类
下载PDF
基于卷积神经网络的食品图像识别 被引量:14
5
作者 廖恩红 李会芳 +1 位作者 王华 庞雄文 《华南师范大学学报(自然科学版)》 CAS 北大核心 2019年第4期113-119,共7页
针对传统食品图像识别方法提取特征能力差、准确率差、运行效率差和卷积神经网络识别相似食品图像难度大等问题,提出了一种新的食品图像识别模型China Food-CNN,以实现对食物的精准分类;在多分类损失函数Softmax With Loss的基础上,针... 针对传统食品图像识别方法提取特征能力差、准确率差、运行效率差和卷积神经网络识别相似食品图像难度大等问题,提出了一种新的食品图像识别模型China Food-CNN,以实现对食物的精准分类;在多分类损失函数Softmax With Loss的基础上,针对食品图像类间相似性大的问题,提出了最大类间距损失函数(MCSWithLoss),以增大相似类之间的距离,实现相似类的区分;针对随机选取样本时的训练集冗余问题,在网络模型训练时使用负样本选择算法.实验结果表明:China Food-CNN模型对食品图像的识别准确率达69.2%,分别比Alex Net、VGG16、Res Net模型提升了17.6%、16.8%和3.6%. 展开更多
关键词 食品图像识别 卷积神经网络 最大类间距损失函数
下载PDF
一种基于候选区域的多种食品图像识别系统 被引量:2
6
作者 沈凤仙 《湖北农业科学》 2020年第23期152-155,共4页
通过对候选区域食物进行检测,根据不同特征对其进行分类。通过融合多个区域检测器的输出结果来检测候选区域,以组合每个类别的图像特征MKL估计最优权值。基于特征融合的食品识别方法,应用于具有各种视觉特征的候选区域边界盒,按照得分... 通过对候选区域食物进行检测,根据不同特征对其进行分类。通过融合多个区域检测器的输出结果来检测候选区域,以组合每个类别的图像特征MKL估计最优权值。基于特征融合的食品识别方法,应用于具有各种视觉特征的候选区域边界盒,按照得分降序排列,估计多重候选食物的图像。结果表明,对于多种食品图像数据集,实现了55.8%的分类率,对于食品识别领域具有一定的参考意义。 展开更多
关键词 多种食品图像 区域检测 窗口搜索 多核学习
下载PDF
基于Faster R-CNN的食品图像检索和分类 被引量:11
7
作者 梅舒欢 闵巍庆 +2 位作者 刘林虎 段华 蒋树强 《南京信息工程大学学报(自然科学版)》 CAS 2017年第6期635-641,共7页
面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能... 面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49 168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能. 展开更多
关键词 食品图像 图像检索 图像分类 深度学习 FASTER R-CNN 卷积神经网络
下载PDF
基于卷积神经网络的食品图像识别 被引量:6
8
作者 王博 刘俊康 +2 位作者 陆逢贵 刘登勇 曹振霞 《食品安全质量检测学报》 CAS 2019年第18期6241-6247,共7页
目的探究一种基于Inception_V3-CNN模型的食品图像识别和分类方法。方法选取包含20类食品和19609张的食品图像建立数据集Food-101,通过卷积神经网络(convolutional neural networks,CNN)提取图像候选区域的视觉特征,并自动进行分类,使... 目的探究一种基于Inception_V3-CNN模型的食品图像识别和分类方法。方法选取包含20类食品和19609张的食品图像建立数据集Food-101,通过卷积神经网络(convolutional neural networks,CNN)提取图像候选区域的视觉特征,并自动进行分类,使其具有较高的识别率;此外,采集来自kaggle库中已标注的食品图像集做预测对比实验,以保证Inception_V3-CNN模型检测的准确度。结果该方法能够去除背景噪音,且仅需部分提取视觉特征,可以有效解决网络食品图像的分类问题,与多视图支持向量机(support vectormachine,SVM)+方向梯度直方图(histogram of oriented gradients,HOG)和传统CNN方法相比,在测试时间相近、设备计算能力相同的条件下,该方法识别率更高,迭代次数为15000次时,Loss值降至4.92,准确率可达93.89%。结论此方法可以快速识别食品图像,在实际网络图片中能有较好的可移植性。将算法移植到移动设备中实现APP的模块化操作也将成为后续工作探索的重点方向。 展开更多
关键词 食品图像 图像检索 图像分类 Inception_V3-CNN 卷积神经网络
下载PDF
食品图像识别方法综述 被引量:6
9
作者 闵巍庆 刘林虎 +2 位作者 刘宇昕 罗梦江 蒋树强 《计算机学报》 EI CAS CSCD 北大核心 2022年第3期542-566,共25页
食品与人类的行为、健康和文化等密切相关.社交网络、移动网络和物联网等泛在网络产生了食品大数据,这些大数据与人工智能,尤其是快速发展的深度学习催生了新的交叉研究领域食品计算.作为食品计算的核心任务之一,食品图像识别同时是计... 食品与人类的行为、健康和文化等密切相关.社交网络、移动网络和物联网等泛在网络产生了食品大数据,这些大数据与人工智能,尤其是快速发展的深度学习催生了新的交叉研究领域食品计算.作为食品计算的核心任务之一,食品图像识别同时是计算机视觉领域中细粒度视觉识别的重要分支,因而具有重要的理论研究意义,并在智慧健康、食品智能装备、智慧餐饮、智能零售及智能家居等方面有着广泛的应用前景.为此,本文对食品图像识别领域进行了全面综述.该文首先从识别对象、视觉特征表示及学习方法等不同维度对目前的食品图像识别进行分类并深入阐述和分析了当前的研究进展,指出深度学习模型是当前食品图像识别的主流方法,融入各种上下文信息和外部知识是改进食品图像识别的重要手段.其次从食品数据规模、食品类型及是否包含上下文和多模态信息等方面介绍了现有的食品图像识别数据集,并给出了不同识别方法在主流数据集上的性能对比和分析.接下来总结了食品图像识别在饮食质量评估、食品自动结算、智能厨具、食品图像的组织检索和推荐等多个方面的应用情况.最后本文从面向食品特点的食品图像识别方法、大规模食品图像识别基准数据集构建等方面对食品图像识别未来可能的研究方向进行了总结和展望. 展开更多
关键词 食品图像识别 深度学习 饮食管理 食品计算
下载PDF
多尺度拼图重构网络的食品图像识别 被引量:3
10
作者 刘宇昕 闵巍庆 +1 位作者 蒋树强 芮勇 《软件学报》 EI CSCD 北大核心 2022年第11期4379-4395,共17页
近年来,食品图像识别由于在健康饮食管理、无人餐厅等领域的广泛应用而受到了越来越多的关注.不同于其他物体识别任务,食品图像属于细粒度图像,具有较高的类内差异性和类间相似性,而且食品图像没有固定的语义模式和空间布局,这些特点使... 近年来,食品图像识别由于在健康饮食管理、无人餐厅等领域的广泛应用而受到了越来越多的关注.不同于其他物体识别任务,食品图像属于细粒度图像,具有较高的类内差异性和类间相似性,而且食品图像没有固定的语义模式和空间布局,这些特点使得食品图像识别更具挑战性.为此,提出了一种用于食品图像识别的多尺度拼图重构网络(multi-scale jigsaw and reconstruction network,MJR-Net).MJR-Net由拼图重构模块、特征金字塔模块和通道注意力模块这3部分组成.拼图重构模块使用破坏重构学习方法将原始图像进行破坏和重构,以提取局部的判别性细节特征;特征金字塔模块可以融合不同尺寸的中层特征,以捕获多尺度的局部判别性特征;通道注意力模块对不同特征通道的重要程度进行建模,以增强判别性的视觉模式,减弱噪声干扰.此外,还使用A-softmax和Focal损失,分别从增大类间差异和修正分类样本的角度优化网络.MJR-Net在ETH Food-101,Vireo Food-172和ISIA Food-500这3个食品数据集上进行实验,分别取得了90.82%,91.37%和64.95%的识别准确率.实验结果表明,与其他食品图像识别方法相比,MJR-Net表现出较大的竞争力,并在Vireo Food-172和ISIA Food-500上取得了最优识别性能.全面的消融实验和可视化分析证明了该方法的有效性. 展开更多
关键词 食品图像识别 深度学习 拼图重构 特征金字塔 注意力机制
下载PDF
基于端到端框架的食品图像检测法 被引量:2
11
作者 戴长江 马远浩 《电子技术与软件工程》 2021年第9期132-135,共4页
本文提出了一个基于图像的食品分析框架,该框架集成了食品定位、分类和部分尺寸估计。我们提出的框架是端到端的,即输入可以是一个包含多个食物的任意食物图像,并且我们的系统可以定位每个食物及其相应的预测食物类型和部分大小。我们... 本文提出了一个基于图像的食品分析框架,该框架集成了食品定位、分类和部分尺寸估计。我们提出的框架是端到端的,即输入可以是一个包含多个食物的任意食物图像,并且我们的系统可以定位每个食物及其相应的预测食物类型和部分大小。我们还改进了单一食物部分的估计,将定位结果与条件GAN获得的食物能量分布图合并,生成四通道RGB分布图像。我们的端到端框架是在从营养喂养研究中收集的真实食物图像数据集上进行评估的。 展开更多
关键词 食品图像分析 端到端框架 多任务处理 能量分布图合并
下载PDF
基于卷积神经网络的食品图像识别
12
作者 韩筠 罗泽钦 《科技创新导报》 2021年第3期104-107,共4页
随着消费观念的升级,人们对饮食健康越来越重视,因此,食品图像识别成为众多领域研究的热点。针对传统食品图像识别方法提取特征能力差、准确率差等问题,采用Google团队发布的卷积神经网络模型——Inception_ResNet_V2模型对食品图像进... 随着消费观念的升级,人们对饮食健康越来越重视,因此,食品图像识别成为众多领域研究的热点。针对传统食品图像识别方法提取特征能力差、准确率差等问题,采用Google团队发布的卷积神经网络模型——Inception_ResNet_V2模型对食品图像进行识别和分类,该模型曾经在图像分类测试中实现了当下最好的成绩。在Food-101数据集中随机选取10个分类共计10000张图片建立数据集Food-10,通过多层卷积神经网络提取图像特征,自动进行分类,并将其与来自K agg le库中的图像集做预测对比实验。结果表明,Incept ion_ResNet_V2模型能够较好地去除背景噪音,达到较好的识别效果,迭代次数为5000次时,Loss值降至0.0512,准确率可达到82.7%,为该模型用于食品图像识别提供有价值的参考。 展开更多
关键词 食品图像 卷积神经网络 Inception_ResNet_V2-CNN模型 图像识别
下载PDF
基于直线截距直方图的Arimoto熵或Arimoto灰度熵的食品图像分割 被引量:2
13
作者 吴一全 龙云淋 《现代食品科技》 EI CAS 北大核心 2016年第1期164-169,共6页
食品生产中涉及到的食品种类繁多且必须满足国家相关食品安全标准,为此要求食品图像分割方法必须速度快、准确性高、普适性强。利用基于二维Arimoto熵或二维Arimoto灰度熵的阈值选取方法对食品图像进行分割,算法复杂度高,难以满足实时... 食品生产中涉及到的食品种类繁多且必须满足国家相关食品安全标准,为此要求食品图像分割方法必须速度快、准确性高、普适性强。利用基于二维Arimoto熵或二维Arimoto灰度熵的阈值选取方法对食品图像进行分割,算法复杂度高,难以满足实时性要求。针对这一问题,提出基于直线截距直方图的Arimoto熵或Arimoto灰度熵的食品图像分割方法。首先给出直线截距直方图的定义,然后根据此定义建立图像的直线截距直方图,最后计算基于此直线截距直方图的不同灰度级的Arimoto熵或Arimoto灰度熵,当该熵达到最大时,对应的灰度级即为图像的最佳分割阈值。针对此方法,对多种食品图像进行了大量的试验,通过与现有的基于一维和二维Arimoto熵、Arimoto灰度熵的分割方法对比,发现本文方法在综合提升算法速度和改善分割效果上,性能更优。 展开更多
关键词 食品图像分割 直线截距直方图 Arimoto熵 Arimoto灰度熵
原文传递
基于改进卷积神经网络的食品异物自动识别方法 被引量:3
14
作者 邓阿琴 胡平霞 《食品与机械》 北大核心 2022年第7期133-137,共5页
目的:提高食品中异物识别速度和精度。方法:在LeNet-5网络结构的基础上增加批量归一化层和Dropout层得到改进的CNN模型,利用此模型建立识别系统用于食品图像中异物自动识别。通过试验对所建模型性能进行分析。结果:与传统的模型相比,该... 目的:提高食品中异物识别速度和精度。方法:在LeNet-5网络结构的基础上增加批量归一化层和Dropout层得到改进的CNN模型,利用此模型建立识别系统用于食品图像中异物自动识别。通过试验对所建模型性能进行分析。结果:与传统的模型相比,该模型具有更高的检测精度和更快的识别速度,食品异物的识别准确率为99.75%,识别时间仅为0.332 s。结论:建立的饺子图像异物识别模型具有较好的检测速度和识别精度。 展开更多
关键词 食品图像 异物识别 LeNet-5网络 CNN模型 饺子图像
下载PDF
基于图卷积网络的多标签食品原材料识别 被引量:1
15
作者 李辉 闵巍庆 +1 位作者 王致岭 彭鑫 《南京信息工程大学学报(自然科学版)》 CAS 2019年第6期743-750,共8页
当前,食品图像的营养成分识别主要还是集中在食品类别的识别以及作为多标签任务的识别.但是这两种方法并不具备很好的判别性,因为它们忽略了原材料之间的潜在关系.因此,本文在前期工作的基础上引入了原材料之间的关系.具体地说,我们的... 当前,食品图像的营养成分识别主要还是集中在食品类别的识别以及作为多标签任务的识别.但是这两种方法并不具备很好的判别性,因为它们忽略了原材料之间的潜在关系.因此,本文在前期工作的基础上引入了原材料之间的关系.具体地说,我们的工作主要分为图像特征提取和原材料关系学习两部分.图像特征提取通过卷积神经网络提取到图像的低维特征向量.图卷积网络通过使用图数据(图的每个节点表示原材料的词嵌入,边表示节点之间的相关性),将图数据直接映射到一组相互依赖的分类器中,并与图像的低维特征向量融合,最后进行分类.通过在Food-101和VireoFood-172两个食品数据集上进行实验,并与当前最好的实验模型进行对比,发现基于图卷积的食品多标签分类方法可以有效地提高食品图像的分类性能. 展开更多
关键词 多标签分类 食品原材料 食品图像 卷积神经网络 图卷积网络
下载PDF
A Method for Sea Surface Wind Field Retrieval from SAR Image Mode Data 被引量:4
16
作者 SHAO Weizeng SUN Jian +1 位作者 GUAN Changlong SUN Zhanfeng 《Journal of Ocean University of China》 SCIE CAS 2014年第2期198-204,共7页
To retrieve wind field from SAR images, the development for surface wind field retrieval from SAR images based on the improvement of new inversion model is present. Geophysical Model Functions (GMFs) have been widel... To retrieve wind field from SAR images, the development for surface wind field retrieval from SAR images based on the improvement of new inversion model is present. Geophysical Model Functions (GMFs) have been widely applied for wind field retrieval from SAR images. Among them CMOD4 has a good performance under low and moderate wind conditions. Although CMOD5 is developed recently with a more fundamental basis, it has ambiguity of wind speed and a shape gradient of normalized radar cross section under low wind speed condition. This study proposes a method of wind field retrieval from SAR image by com-bining CMOD5 and CMOD4 Five VV-polarisation RADARSAT2 SAR images are implemented for validation and the retrieval re-suits by a combination method (CMOD5 and CMOD4) together with CMOD4 GMF are compared with QuikSCAT wind data. The root-mean-square error (RMSE) of wind speed is 0.75 m s-1 with correlation coefficient 0.84 using the combination method and the RMSE of wind speed is 1.01 m s-1 with correlation coefficient 0.72 using CMOD4 GMF alone for those cases. The proposed method can be applied to SAR image for avoiding the internal defect in CMOD5 under low wind speed condition. 展开更多
关键词 SAR surface wind retrieval geophysical model function CMOD4 CMOD5
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部