-
题名基于多尺度注意力的鸟类图像识别
- 1
-
-
作者
阮涛
郝智程
-
机构
北京信息科技大学应用数学研究所
-
出处
《计算机与数字工程》
2024年第10期3148-3152,3171,共6页
-
文摘
鸟类图像不同子类别外观相似,而同类别目标因复杂的背景、姿态等呈现较大的类内差异。针对这个问题,提出了基于多尺度注意力的卷积神经网络模型。模型通过无参数学习的目标模块和部件模块使注意力由全局图像逐渐聚焦到目标和部件图像,形成了能输入多尺度图像的三分支网络模型。此外,引入排序损失以减少背景的干扰。在CUB-200-2011和NABirds数据集上,模型的识别精度分别为87.21%和85.96%,与基线模型相比,识别精度得到有效提高,验证了模型的有效性。
-
关键词
鸟类图像识别
多尺度注意力
排序损失
卷积神经网络
-
Keywords
bird image recognition
multiscale attention
rank loss
convolutional neural networks
-
分类号
TP751
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于特征融合的细粒度鸟类图像分类研究
- 2
-
-
作者
李昊霖
俞成海
卢智龙
陈涵颖
-
机构
浙江理工大学计算机科学与技术学院
华北电力大学
-
出处
《计算机时代》
2023年第12期130-134,共5页
-
文摘
特征金字塔(FPN)因能将低尺度的特征与更高尺度的特征融合、呈现每个层次丰富的语义信息,而被广泛应用于小尺度目标定位识别中,但其目前无法连接跨尺度特征信息,且分类准确率不高。本文提出特征融合金字塔模块(FFPN),通过在ResNet50主干网络中引入FFPN模块,有效地提高了细粒度鸟类图像分类的性能。模型在CUB-200-2011数据集上达到了83.379%的分类准确度,在Bird-400数据集中达到了91.201%的准确度,实现了较好的分类效果。
-
关键词
特征融合
多尺度特征
细粒度图像分类
鸟类图像识别
-
Keywords
feature fusion
multi-scale features
fine-grained image classification
bird image recognition
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-