基于Transformer的车道预测LSTR(Lane Shape Prediction with Transformers)算法在检测车道线时存在缺少捕捉局部特征的能力和多头注意力机制中头数多余的问题.本文提出了改进LSTR算法的车道线检测方法,首先在最后一个编码器中前馈网络...基于Transformer的车道预测LSTR(Lane Shape Prediction with Transformers)算法在检测车道线时存在缺少捕捉局部特征的能力和多头注意力机制中头数多余的问题.本文提出了改进LSTR算法的车道线检测方法,首先在最后一个编码器中前馈网络的后面引入CBAM(Convolutional Block Attention Module)注意力机制模块,充分利用通道和空间上的信息,捕捉特征图中更多的细节;然后对解码器中的掩码多头注意力机制进行剪枝,使用掩码单头注意力机制来进行替换,以便更多关注前一时刻的车道线信息.改进后的LSTR算法在TuSimple数据集上准确度为96.31%,明显高于PolyLaneNet(Lane Estimation via Deep Polynomial Regression)等算法,在CULane数据集上比原始算法的F1评分上升了2.11%.展开更多
文摘基于Transformer的车道预测LSTR(Lane Shape Prediction with Transformers)算法在检测车道线时存在缺少捕捉局部特征的能力和多头注意力机制中头数多余的问题.本文提出了改进LSTR算法的车道线检测方法,首先在最后一个编码器中前馈网络的后面引入CBAM(Convolutional Block Attention Module)注意力机制模块,充分利用通道和空间上的信息,捕捉特征图中更多的细节;然后对解码器中的掩码多头注意力机制进行剪枝,使用掩码单头注意力机制来进行替换,以便更多关注前一时刻的车道线信息.改进后的LSTR算法在TuSimple数据集上准确度为96.31%,明显高于PolyLaneNet(Lane Estimation via Deep Polynomial Regression)等算法,在CULane数据集上比原始算法的F1评分上升了2.11%.