街道场景视频实例分割是无人驾驶技术研究中的关键问题之一,可为车辆在街道场景下的环境感知和路径规划提供决策依据.针对现有方法存在多纵横比锚框应用单一感受野采样导致边缘特征提取不充分以及高层特征金字塔空间细节位置信息匮乏的...街道场景视频实例分割是无人驾驶技术研究中的关键问题之一,可为车辆在街道场景下的环境感知和路径规划提供决策依据.针对现有方法存在多纵横比锚框应用单一感受野采样导致边缘特征提取不充分以及高层特征金字塔空间细节位置信息匮乏的问题,本文提出锚框校准和空间位置信息补偿视频实例分割(Anchor frame calibration and Spatial position information compensation for Video Instance Segmentation,AS-VIS)网络.首先,在预测头3个分支中添加锚框校准模块实现同锚框纵横比匹配的多类型感受野采样,解决目标边缘提取不充分问题.其次,设计多感受野下采样模块将各种感受野采样后的特征融合,解决下采样信息缺失问题.最后,应用多感受野下采样模块将特征金字塔低层目标区域激活特征映射嵌入到高层中实现空间位置信息补偿,解决高层特征空间细节位置信息匮乏问题.在Youtube-VIS标准库中提取街道场景视频数据集,其中包括训练集329个视频和验证集53个视频.实验结果与YolactEdge检测和分割精度指标定量对比表明,锚框校准平均精度分别提升8.63%和5.09%,空间位置信息补偿特征金字塔平均精度分别提升7.76%和4.75%,AS-VIS总体平均精度分别提升9.26%和6.46%.本文方法实现了街道场景视频序列实例级同步检测、跟踪与分割,为无人驾驶车辆环境感知提供有效的理论依据.展开更多
锚框结构的舰船目标检测算法存在预设锚框与真实目标框难以精准匹配的问题,设计了一种基于合成孔径雷达(Synthetic Aperture Radar,SAR)图像的无锚框实时舰船目标检测算法。该算法以YOLOX-Nano(You Only Look Once X-Nano)框架为基础,...锚框结构的舰船目标检测算法存在预设锚框与真实目标框难以精准匹配的问题,设计了一种基于合成孔径雷达(Synthetic Aperture Radar,SAR)图像的无锚框实时舰船目标检测算法。该算法以YOLOX-Nano(You Only Look Once X-Nano)框架为基础,在骨干网络单元嵌入改进Ghost模块和挤压激励(Squeeze and Excitation,SE)模块。路径聚合网络(Path Aggregation Network,PANet)与改进Ghost模块和自适应空间特征融合(Adaptively Spatial Feature Fusion,ASFF)模块集成后提高了模型的特征表达能力。以输入图像分辨率为320×320像素为基准,相较于单发多框检测器(Single Shot MultiBox Detector,SSD)和YOLOv3-tiny(You Only Look Once v3-tiny)模型,实验结果显示本文算法在合成孔径雷达舰船检测数据集(SAR Ship Detection Dataset,SSDD)上平均正确率达到94.5%,参数量为0.87×10^(6),浮点计算量为0.61×10^(9),能够实现高精度和低复杂度的SAR图像舰船目标检测。展开更多
文摘街道场景视频实例分割是无人驾驶技术研究中的关键问题之一,可为车辆在街道场景下的环境感知和路径规划提供决策依据.针对现有方法存在多纵横比锚框应用单一感受野采样导致边缘特征提取不充分以及高层特征金字塔空间细节位置信息匮乏的问题,本文提出锚框校准和空间位置信息补偿视频实例分割(Anchor frame calibration and Spatial position information compensation for Video Instance Segmentation,AS-VIS)网络.首先,在预测头3个分支中添加锚框校准模块实现同锚框纵横比匹配的多类型感受野采样,解决目标边缘提取不充分问题.其次,设计多感受野下采样模块将各种感受野采样后的特征融合,解决下采样信息缺失问题.最后,应用多感受野下采样模块将特征金字塔低层目标区域激活特征映射嵌入到高层中实现空间位置信息补偿,解决高层特征空间细节位置信息匮乏问题.在Youtube-VIS标准库中提取街道场景视频数据集,其中包括训练集329个视频和验证集53个视频.实验结果与YolactEdge检测和分割精度指标定量对比表明,锚框校准平均精度分别提升8.63%和5.09%,空间位置信息补偿特征金字塔平均精度分别提升7.76%和4.75%,AS-VIS总体平均精度分别提升9.26%和6.46%.本文方法实现了街道场景视频序列实例级同步检测、跟踪与分割,为无人驾驶车辆环境感知提供有效的理论依据.
文摘锚框结构的舰船目标检测算法存在预设锚框与真实目标框难以精准匹配的问题,设计了一种基于合成孔径雷达(Synthetic Aperture Radar,SAR)图像的无锚框实时舰船目标检测算法。该算法以YOLOX-Nano(You Only Look Once X-Nano)框架为基础,在骨干网络单元嵌入改进Ghost模块和挤压激励(Squeeze and Excitation,SE)模块。路径聚合网络(Path Aggregation Network,PANet)与改进Ghost模块和自适应空间特征融合(Adaptively Spatial Feature Fusion,ASFF)模块集成后提高了模型的特征表达能力。以输入图像分辨率为320×320像素为基准,相较于单发多框检测器(Single Shot MultiBox Detector,SSD)和YOLOv3-tiny(You Only Look Once v3-tiny)模型,实验结果显示本文算法在合成孔径雷达舰船检测数据集(SAR Ship Detection Dataset,SSDD)上平均正确率达到94.5%,参数量为0.87×10^(6),浮点计算量为0.61×10^(9),能够实现高精度和低复杂度的SAR图像舰船目标检测。