针对坐标注意力(CA)在水平和垂直方向特征的平均池化可能丢失目标显著特征,以及使用二维普通卷积对小目标特征学习不足的情况,提出了CARFB(coordinate attention and receptive field block)模块。该模块将CA的平均池化修改为平均+最大...针对坐标注意力(CA)在水平和垂直方向特征的平均池化可能丢失目标显著特征,以及使用二维普通卷积对小目标特征学习不足的情况,提出了CARFB(coordinate attention and receptive field block)模块。该模块将CA的平均池化修改为平均+最大池化,以保留输入特征在水平和垂直方向的显著和细节信息;利用RFB具有不同大小感受野的优势,在水平和垂直方向分别使用RFB模块代替CA的融合特征统一卷积,以同时提取不同大小目标的特征;引入包含不同大小卷积核和步长的CBS模块,替换CA的二维普通卷积,进一步提取水平和垂直方向的特征,得到重新加权的输出特征。CARFB模块在水平和垂直方向保存目标位置信息,利用不同感受野提取不同大小目标的强辨别性特征,从而具有更强的特征学习能力。为了验证提出的即插即用模块CARFB的性能,将其嵌入ObjectBox目标检测框架,得到ObjectBox-CARFB模型;用CARFB模块替换RFBnet中的RFB模块,得到CARFBnet目标检测模型。MSCOCO数据集的实验测试表明,ObjectBox-CARFB模型的性能得到全面提升,尤其对小目标的检测性能提升突出;PASCALVOC和MSCOCO数据集的实验结果表明,CARFBnet300和CARFBnet512的目标检测能力分别优于原始RFBnet300和RFBnet512模型,并优于其他同系列对比模型。提出的CARFB模块具有更强的特征学习能力,对不同尺度目标均能取得较好的检测效果,特别是在小目标检测方面,效果提升显著。提出的CARFB模块可以嵌入到任何一个卷积神经网络,能保存更多的目标信息,具有更强的特征学习能力和更高的网络性能,对不同尺度目标均能取得较好的检测效果,尤其对小目标的检测效果提升显著。展开更多
针对遥感图像中小目标数量众多且背景复杂所导致的识别精度低的问题,提出了一种改进的遥感图像小目标检测方法。该方法基于改进的YOLOv7网络模型,将双级路由注意力机制加入至下采样阶段以构建针对小目标的特征提取模块MP-ATT(max poolin...针对遥感图像中小目标数量众多且背景复杂所导致的识别精度低的问题,提出了一种改进的遥感图像小目标检测方法。该方法基于改进的YOLOv7网络模型,将双级路由注意力机制加入至下采样阶段以构建针对小目标的特征提取模块MP-ATT(max pooling-attention),使得模型更加关注小目标的特征,提高小目标检测精度。为了加强对小目标的细节感知能力,使用DCNv3(deformable convolution network v3)替换骨干网络中的二维卷积,以此构建新的层聚合模块ELAN-D。为网络设计新的小目标检测层以获取更精细的特征信息,从而提升模型的鲁棒性。同时使用MPDIoU(minimum point distance based IoU)替换原模型中的CIoU来优化损失函数,以适应遥感图像的尺度变化。实验表明,所提出的方法在DOTA-v1.0数据集上取得了良好效果,准确率、召回率和平均准确率(mean average precision,mAP)相比原模型分别提升了0.4、4.0、2.3个百分点,证明了该方法能够有效提升遥感图像中小目标的检测效果。展开更多
针对高速公路隧道内光线昏暗、图像受灯光影响及远距离小目标检测困难等问题,提出了一种改进的YOLOv5高速公路隧道车辆和人员检测算法。首先,使用高斯混合聚类来获得更加匹配数据集目标的一组锚框,提高了模型的检测精度;其次,在特征融...针对高速公路隧道内光线昏暗、图像受灯光影响及远距离小目标检测困难等问题,提出了一种改进的YOLOv5高速公路隧道车辆和人员检测算法。首先,使用高斯混合聚类来获得更加匹配数据集目标的一组锚框,提高了模型的检测精度;其次,在特征融合部分引入内容感知重组特征(content-aware ReAssembly of FEatures, CARAFE)上采样算子,扩大感受野,降低上采样过程特征细节损失;最后,通过向网络中插入坐标注意力(coordinate attention, CA),进一步增强模型对图像各位置特征的提取能力。为验证算法的有效性,在浙江温丽高速公路隧道数据集上进行实验,结果表明:所提算法的平均检测精度(mean average precision, mAP)达到了95.7%,较原模型提升3.8%,对于远距离小目标和受严重灯光影响的目标能够实现更加精准检测,为复杂环境下高速公路隧道内车辆和人员检测提供了一种有效的解决方案。展开更多
为解决交通道路小目标检测难度大、精度低,容易出现错检漏检的问题,提出一种基于YOLO v5(you only look once v5)算法的多尺度特征融合目标检测改进算法。首先,增加小目标检测头用于适应小目标尺寸,缓解漏检情况。然后,引入可变形卷积网...为解决交通道路小目标检测难度大、精度低,容易出现错检漏检的问题,提出一种基于YOLO v5(you only look once v5)算法的多尺度特征融合目标检测改进算法。首先,增加小目标检测头用于适应小目标尺寸,缓解漏检情况。然后,引入可变形卷积网络v2(deformable convolutional networks V2,DCN V2)提高模型对运动中小目标的学习能力;同时,增加上下文增强模块,提升对远距离小目标的识别能力。最后,在替换损失函数、提高边界框定位精度的同时,使用空间金字塔池化和上下文空间金字塔卷积分组模块,提高网络的感受野和特征表达能力。实验结果表明,所提算法在KITTI数据集小目标类别上平均识别精度达到了95.2%,相较于原始YOLO v5,算法总体平均识别精度提升了2.7%,对小目标的检测效果更佳,平均识别精度提升了3.1%,证明所提算法在道路小目标检测方面的有效性。展开更多
针对无人机航拍图像目标检测中视野变化大、时空信息复杂等问题,文中基于YOLOv5(You Only Look Once Version5)架构,提出基于图像低维特征融合的航拍小目标检测模型.引入CA(Coordinate Attention),改进MobileNetV3的反转残差块,增加图...针对无人机航拍图像目标检测中视野变化大、时空信息复杂等问题,文中基于YOLOv5(You Only Look Once Version5)架构,提出基于图像低维特征融合的航拍小目标检测模型.引入CA(Coordinate Attention),改进MobileNetV3的反转残差块,增加图像空间维度信息的同时降低模型参数量.改进YOLOv5特征金字塔网络结构,融合浅层网络中的特征图,增加模型对图像低维有效信息的表达能力,进而提升小目标检测精度.同时为了降低航拍图像中复杂背景带来的干扰,引入无参平均注意力模块,同时关注图像的空间注意力与通道注意力;引入VariFocal Loss,降低负样本在训练过程中的权重占比.在VisDrone数据集上的实验验证文中模型的有效性,该模型在有效提升检测精度的同时明显降低复杂度.展开更多
文摘针对坐标注意力(CA)在水平和垂直方向特征的平均池化可能丢失目标显著特征,以及使用二维普通卷积对小目标特征学习不足的情况,提出了CARFB(coordinate attention and receptive field block)模块。该模块将CA的平均池化修改为平均+最大池化,以保留输入特征在水平和垂直方向的显著和细节信息;利用RFB具有不同大小感受野的优势,在水平和垂直方向分别使用RFB模块代替CA的融合特征统一卷积,以同时提取不同大小目标的特征;引入包含不同大小卷积核和步长的CBS模块,替换CA的二维普通卷积,进一步提取水平和垂直方向的特征,得到重新加权的输出特征。CARFB模块在水平和垂直方向保存目标位置信息,利用不同感受野提取不同大小目标的强辨别性特征,从而具有更强的特征学习能力。为了验证提出的即插即用模块CARFB的性能,将其嵌入ObjectBox目标检测框架,得到ObjectBox-CARFB模型;用CARFB模块替换RFBnet中的RFB模块,得到CARFBnet目标检测模型。MSCOCO数据集的实验测试表明,ObjectBox-CARFB模型的性能得到全面提升,尤其对小目标的检测性能提升突出;PASCALVOC和MSCOCO数据集的实验结果表明,CARFBnet300和CARFBnet512的目标检测能力分别优于原始RFBnet300和RFBnet512模型,并优于其他同系列对比模型。提出的CARFB模块具有更强的特征学习能力,对不同尺度目标均能取得较好的检测效果,特别是在小目标检测方面,效果提升显著。提出的CARFB模块可以嵌入到任何一个卷积神经网络,能保存更多的目标信息,具有更强的特征学习能力和更高的网络性能,对不同尺度目标均能取得较好的检测效果,尤其对小目标的检测效果提升显著。
文摘针对遥感图像中小目标数量众多且背景复杂所导致的识别精度低的问题,提出了一种改进的遥感图像小目标检测方法。该方法基于改进的YOLOv7网络模型,将双级路由注意力机制加入至下采样阶段以构建针对小目标的特征提取模块MP-ATT(max pooling-attention),使得模型更加关注小目标的特征,提高小目标检测精度。为了加强对小目标的细节感知能力,使用DCNv3(deformable convolution network v3)替换骨干网络中的二维卷积,以此构建新的层聚合模块ELAN-D。为网络设计新的小目标检测层以获取更精细的特征信息,从而提升模型的鲁棒性。同时使用MPDIoU(minimum point distance based IoU)替换原模型中的CIoU来优化损失函数,以适应遥感图像的尺度变化。实验表明,所提出的方法在DOTA-v1.0数据集上取得了良好效果,准确率、召回率和平均准确率(mean average precision,mAP)相比原模型分别提升了0.4、4.0、2.3个百分点,证明了该方法能够有效提升遥感图像中小目标的检测效果。
文摘针对高速公路隧道内光线昏暗、图像受灯光影响及远距离小目标检测困难等问题,提出了一种改进的YOLOv5高速公路隧道车辆和人员检测算法。首先,使用高斯混合聚类来获得更加匹配数据集目标的一组锚框,提高了模型的检测精度;其次,在特征融合部分引入内容感知重组特征(content-aware ReAssembly of FEatures, CARAFE)上采样算子,扩大感受野,降低上采样过程特征细节损失;最后,通过向网络中插入坐标注意力(coordinate attention, CA),进一步增强模型对图像各位置特征的提取能力。为验证算法的有效性,在浙江温丽高速公路隧道数据集上进行实验,结果表明:所提算法的平均检测精度(mean average precision, mAP)达到了95.7%,较原模型提升3.8%,对于远距离小目标和受严重灯光影响的目标能够实现更加精准检测,为复杂环境下高速公路隧道内车辆和人员检测提供了一种有效的解决方案。
文摘针对无人机航拍图像目标检测中视野变化大、时空信息复杂等问题,文中基于YOLOv5(You Only Look Once Version5)架构,提出基于图像低维特征融合的航拍小目标检测模型.引入CA(Coordinate Attention),改进MobileNetV3的反转残差块,增加图像空间维度信息的同时降低模型参数量.改进YOLOv5特征金字塔网络结构,融合浅层网络中的特征图,增加模型对图像低维有效信息的表达能力,进而提升小目标检测精度.同时为了降低航拍图像中复杂背景带来的干扰,引入无参平均注意力模块,同时关注图像的空间注意力与通道注意力;引入VariFocal Loss,降低负样本在训练过程中的权重占比.在VisDrone数据集上的实验验证文中模型的有效性,该模型在有效提升检测精度的同时明显降低复杂度.