基于Transformer的车道预测LSTR(Lane Shape Prediction with Transformers)算法在检测车道线时存在缺少捕捉局部特征的能力和多头注意力机制中头数多余的问题.本文提出了改进LSTR算法的车道线检测方法,首先在最后一个编码器中前馈网络...基于Transformer的车道预测LSTR(Lane Shape Prediction with Transformers)算法在检测车道线时存在缺少捕捉局部特征的能力和多头注意力机制中头数多余的问题.本文提出了改进LSTR算法的车道线检测方法,首先在最后一个编码器中前馈网络的后面引入CBAM(Convolutional Block Attention Module)注意力机制模块,充分利用通道和空间上的信息,捕捉特征图中更多的细节;然后对解码器中的掩码多头注意力机制进行剪枝,使用掩码单头注意力机制来进行替换,以便更多关注前一时刻的车道线信息.改进后的LSTR算法在TuSimple数据集上准确度为96.31%,明显高于PolyLaneNet(Lane Estimation via Deep Polynomial Regression)等算法,在CULane数据集上比原始算法的F1评分上升了2.11%.展开更多
UFLD(ultra fast structure aware deep lane detection)是一种轻量化车道线检测模型,为提升模型的检测精度,对模型进行改进。引入CAM(channel attention mechanism)使模型能更关注携带重要车道线信息的特征通道和像素;为了感知车道线...UFLD(ultra fast structure aware deep lane detection)是一种轻量化车道线检测模型,为提升模型的检测精度,对模型进行改进。引入CAM(channel attention mechanism)使模型能更关注携带重要车道线信息的特征通道和像素;为了感知车道线的细节信息,引入ASPP(atrous spatial pyramid pooling)扩大卷积过程的感受野,提高模型分割精度;搭建引入CAM和ASPP后的改进模型,并在改进的模型上进行实验。实验结果表明:在TuSimple数据集上以ResNet18为主干网络的模型检测精度由95.81%提升至95.98%,以ResNet34为主干网络的模型检测精度由95.84%提升至96.12%;在CULane数据集上,无论是以ResNet18还是以ResNet34为主干网络模型,其平均精度均有不同程度的提高。展开更多
文摘基于Transformer的车道预测LSTR(Lane Shape Prediction with Transformers)算法在检测车道线时存在缺少捕捉局部特征的能力和多头注意力机制中头数多余的问题.本文提出了改进LSTR算法的车道线检测方法,首先在最后一个编码器中前馈网络的后面引入CBAM(Convolutional Block Attention Module)注意力机制模块,充分利用通道和空间上的信息,捕捉特征图中更多的细节;然后对解码器中的掩码多头注意力机制进行剪枝,使用掩码单头注意力机制来进行替换,以便更多关注前一时刻的车道线信息.改进后的LSTR算法在TuSimple数据集上准确度为96.31%,明显高于PolyLaneNet(Lane Estimation via Deep Polynomial Regression)等算法,在CULane数据集上比原始算法的F1评分上升了2.11%.
文摘UFLD(ultra fast structure aware deep lane detection)是一种轻量化车道线检测模型,为提升模型的检测精度,对模型进行改进。引入CAM(channel attention mechanism)使模型能更关注携带重要车道线信息的特征通道和像素;为了感知车道线的细节信息,引入ASPP(atrous spatial pyramid pooling)扩大卷积过程的感受野,提高模型分割精度;搭建引入CAM和ASPP后的改进模型,并在改进的模型上进行实验。实验结果表明:在TuSimple数据集上以ResNet18为主干网络的模型检测精度由95.81%提升至95.98%,以ResNet34为主干网络的模型检测精度由95.84%提升至96.12%;在CULane数据集上,无论是以ResNet18还是以ResNet34为主干网络模型,其平均精度均有不同程度的提高。