针对水面目标检测中的噪声干扰和小目标的漏检问题,提出一种改进YOLOv8的水面小目标检测算法YOLOv8-WSSOD(YOLOv8-water surface small object detection).首先,为降低水面复杂环境在主干网络下采样过程中产生的噪声干扰,提出基于BiFor...针对水面目标检测中的噪声干扰和小目标的漏检问题,提出一种改进YOLOv8的水面小目标检测算法YOLOv8-WSSOD(YOLOv8-water surface small object detection).首先,为降低水面复杂环境在主干网络下采样过程中产生的噪声干扰,提出基于BiFormer双层路由注意力机制构建的C2fBF(C2f-BiFormer)模块,在特征提取过程中保留细粒度的上下文特征信息;其次,针对水面小目标的漏检问题,新增一个更小的检测头,提升网络对小目标的感知力,并在Neck端引入GSConv和Slim-neck,减轻模型复杂度并保持精度;最后,使用MPDIoU损失函数解决CIoU损失函数的局限性,以提高模型检测准确率.实验结果表明,相较于原始YOLOv8算法,该算法在水面小目标上平均准确率mAP@0.5提升了4.6%,mAP@0.5:0.95提升了2.2%,并且改进后的算法检测速度达到86f/s,能有效实现对水面小目标快速、准确的检测.展开更多
遥感图像的道路分割任务是遥感应用领域的一个研究热点,一直受到广泛的关注。由于遥感图像天然具备背景复杂、目标密集等特性,全局语义信息的构建对于准确提取遥感图像中道路是至关重要的。因此,基于Transformer模型进行优化,提出了基...遥感图像的道路分割任务是遥感应用领域的一个研究热点,一直受到广泛的关注。由于遥感图像天然具备背景复杂、目标密集等特性,全局语义信息的构建对于准确提取遥感图像中道路是至关重要的。因此,基于Transformer模型进行优化,提出了基于空间可分离注意力的跨尺度令牌嵌入Transformer遥感道路提取模型Cross-RoadFormer。具体而言,针对图像中道路尺度不统一的问题,设计了跨尺度编码层,将不同尺度的特征编码作为一个令牌嵌入整体,作为Transformer的输入,解决了Transformer跨尺度交互的问题;此外,提出了一种空间可分离注意力,其中,局部分组注意力获取细粒度、短距离信息,全局采样注意力捕获长距离、全局上下文信息,在保证道路提取准确度的前提下,降低了模型的计算量。在Massachusetts数据集和DeepGlobe数据集上的实验表明,提出的Cross-RoadFormer都实现了更高的IoU(intersection over union),分别为68.40%和58.04%,展现了该方法的优越性。展开更多
文摘针对水面目标检测中的噪声干扰和小目标的漏检问题,提出一种改进YOLOv8的水面小目标检测算法YOLOv8-WSSOD(YOLOv8-water surface small object detection).首先,为降低水面复杂环境在主干网络下采样过程中产生的噪声干扰,提出基于BiFormer双层路由注意力机制构建的C2fBF(C2f-BiFormer)模块,在特征提取过程中保留细粒度的上下文特征信息;其次,针对水面小目标的漏检问题,新增一个更小的检测头,提升网络对小目标的感知力,并在Neck端引入GSConv和Slim-neck,减轻模型复杂度并保持精度;最后,使用MPDIoU损失函数解决CIoU损失函数的局限性,以提高模型检测准确率.实验结果表明,相较于原始YOLOv8算法,该算法在水面小目标上平均准确率mAP@0.5提升了4.6%,mAP@0.5:0.95提升了2.2%,并且改进后的算法检测速度达到86f/s,能有效实现对水面小目标快速、准确的检测.
文摘遥感图像的道路分割任务是遥感应用领域的一个研究热点,一直受到广泛的关注。由于遥感图像天然具备背景复杂、目标密集等特性,全局语义信息的构建对于准确提取遥感图像中道路是至关重要的。因此,基于Transformer模型进行优化,提出了基于空间可分离注意力的跨尺度令牌嵌入Transformer遥感道路提取模型Cross-RoadFormer。具体而言,针对图像中道路尺度不统一的问题,设计了跨尺度编码层,将不同尺度的特征编码作为一个令牌嵌入整体,作为Transformer的输入,解决了Transformer跨尺度交互的问题;此外,提出了一种空间可分离注意力,其中,局部分组注意力获取细粒度、短距离信息,全局采样注意力捕获长距离、全局上下文信息,在保证道路提取准确度的前提下,降低了模型的计算量。在Massachusetts数据集和DeepGlobe数据集上的实验表明,提出的Cross-RoadFormer都实现了更高的IoU(intersection over union),分别为68.40%和58.04%,展现了该方法的优越性。