利用深度学习对声呐图像进行目标检测是近年来的研究热点,然而声呐图像存在目标尺度分布集中、数据获取难等问题,导致检测效果难以满足需求。针对该问题,提出了一种基于可变尺度先验框的目标检测方法。首先,考虑到声呐图像中目标的尺度...利用深度学习对声呐图像进行目标检测是近年来的研究热点,然而声呐图像存在目标尺度分布集中、数据获取难等问题,导致检测效果难以满足需求。针对该问题,提出了一种基于可变尺度先验框的目标检测方法。首先,考虑到声呐图像中目标的尺度分布具有其特殊性,基于先验统计生成可变尺度先验框。其次,为了解决声呐图像稀缺的难题,采用数据增强的方法对训练集进行扩充。最后,探索了模型的轻量化,通过删减模型的大目标检测层,在不降低模型精度的同时简化模型结构。为了评估算法的有效性,以前视声呐图像为例进行了综合试验,平均精度(mean average precision,mAP)@0.75和mAP@0.5:0.95分别达0.585和0.559,较原Yolov5网络分别提升了5.8%和3.1%,同时每秒10亿次浮点运算次数下降到14.9。结果表明,所提算法具有更高的精度和更轻量化的模型结构。展开更多
文摘利用深度学习对声呐图像进行目标检测是近年来的研究热点,然而声呐图像存在目标尺度分布集中、数据获取难等问题,导致检测效果难以满足需求。针对该问题,提出了一种基于可变尺度先验框的目标检测方法。首先,考虑到声呐图像中目标的尺度分布具有其特殊性,基于先验统计生成可变尺度先验框。其次,为了解决声呐图像稀缺的难题,采用数据增强的方法对训练集进行扩充。最后,探索了模型的轻量化,通过删减模型的大目标检测层,在不降低模型精度的同时简化模型结构。为了评估算法的有效性,以前视声呐图像为例进行了综合试验,平均精度(mean average precision,mAP)@0.75和mAP@0.5:0.95分别达0.585和0.559,较原Yolov5网络分别提升了5.8%和3.1%,同时每秒10亿次浮点运算次数下降到14.9。结果表明,所提算法具有更高的精度和更轻量化的模型结构。