-
题名改进注意力模型的食品图像识别方法
被引量:1
- 1
-
-
作者
姜枫
周莉莉
-
机构
南京理工大学泰州科技学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第12期153-159,共7页
-
基金
江苏省高等学校自然科学研究面上项目(19KJB520038)
江苏省“333人才”项目。
-
文摘
随着人们对健康饮食需求的日益增加,各种饮食评估辅助软件应运而生,食品图像识别问题受到越来越多的关注。食品图像识别属于细粒度图像识别问题,较其他图像识别难度更大。目前主流的食品图像数据集,如ISIA Food-500、ETH Food-101、Vireo Food-172等所包含的图像数量偏少,难以很好地训练图像识别系统,进一步增大了图像识别难度。提出一种基于注意力机制的图像识别方法,该方法在自注意力的基础上引入局部注意力的概念,用于描绘图像细粒度特征,提高图像识别的准确率。此外,还提出一种图像自监督预训练算法,缓解食品图像训练样本不足的问题。实验结果表明,所提方法在ISIA Food-500数据集的Top-1和Top-5准确率分别达到65.58%和90.03%,性能优于现有的其他算法。
-
关键词
食品图像
细粒度图像识别
局部注意力
自监督预训练
ISIA
food-500数据集
-
Keywords
food images
fine-grained image recognition
local attention
self-supervised pre-training
ISIA food-500 dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合双注意力机制的道路裂缝检测
被引量:13
- 2
-
-
作者
张志华
温亚楠
慕号伟
杜小平
-
机构
兰州交通大学测绘与地理信息学院
地理国情监测技术应用国家地方联合工程研究中心
甘肃省地理国情监测工程实验室
中国科学院空天信息创新研究院数字地球重点实验室
-
出处
《中国图象图形学报》
CSCD
北大核心
2022年第7期2240-2250,共11页
-
基金
国家自然科学基金项目(41861059,42161069,61862039)
中国科学院战略先导专项(A)类项目(XDA19080103)
兰州交通大学优秀平台项目(201806)。
-
文摘
目的道路裂缝检测旨在识别和定位裂缝对象,是保障道路安全的关键问题之一。为解决传统深度神经网络在检测背景较复杂、干扰较大的裂缝图像时精度较低的问题,设计了一种基于双注意力机制的深度学习道路裂缝检测网络。方法本文提出了在骨干网络中融入空洞卷积和两种注意力机制的方法,将其中的轻量型注意力机制与残差模块结合为残差注意力模块Res-A。对比研究了该模块“串联”和“并联”两种方式对于裂缝特征关系权重的影响并获得最佳连接。同时,引入Non-Local计算模式的注意力机制,通过挖掘特征图谱的关系权重以提高裂缝检测性能。结合两种注意力机制可以有效解决复杂背景下道路裂缝难检测的问题,提高了道路裂缝检测精度。结果在公开复杂道路裂缝数据集Crack500上进行对比实验与验证。为证明本文网络的有效性,将平均交并比(mean intersection over union,mIoU)、像素精确度(pixel accuracy,PA)和训练迭代时间作为评价指标,并进行了3组对比实验。第1组实验用于评价残差注意力模块中通道注意力机制和空间注意力机制之间不同组合方式的检测性能,结果表明这两种机制并联相加时的mIoU和PA分别为79.28%和93.88%,比其他两种组合方式分别提高了2.11%和2.08%、11.29%和0.23%。第2组实验用于评价残差注意力模块的有效性,结果表明添加残差注意力模块时的mIoU和PA分别比不添加时高出2.34%和3.01%。第3组实验用于对比本文网络和其他典型网络的检测性能。结果表明,本文网络的mIoU和PA分别比FCN(fully convolutional network)、PSPNet(pyramid scene parsing network)、ICNet(image cascade network)、PSANet(point-wise spatial attention network)和Dense ASPP(dense atrous spatial pyramid pooling)高出7.67%和2.94%、1.54%和0.42%、6.51%和3.34%、7.76%和2.13%、7.70%和-1.59%。实验结果表明本文网络的mIoU和PA优于典型的深度神经网络。结论本文使用带空洞卷积的ResNet-101网络结合双注意力机制,在保持特征图分辨率并且提高感受野的同时,能够更好地适应背景复杂、干扰较多的裂缝对象。
-
关键词
深度学习
残差网络
双注意力机制
道路裂缝检测
Crack500数据集
-
Keywords
deep learning
residual network
dual attention mechanism
road crack detection
Crack500 dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-