-
题名结合视锥变换和RGB体素图的半监督三维目标检测
- 1
-
-
作者
汪岩
袁甜甜
胡彬
李尧
-
机构
天津理工大学聋人工学院
天津大学微电子学院
-
出处
《红外与激光工程》
EI
CSCD
北大核心
2024年第8期250-261,共12页
-
基金
天津市成像与感知微电子技术重点实验室开放基金项目(H20230328)。
-
文摘
基于LiDAR、可见光等多模态传感器的高精度三维目标检测是自动驾驶领域的关键技术。为了提高目标检测的精度和方位感知能力,降低模型对于标注数据的依赖,结合视锥变换方法优化了三维点云方向特征提取策略,提出了一种基于视锥变换和半监督学习架构的三维目标检测技术。具体而言,基于通道注意力模块优化视锥体对远距离目标的感知能力,提出了RGB体素模块提升遮挡目标的识别精度。首先通过深度网络从RGB图像中提取纹理信息,将其与激光雷达的距离信息融合,以保持三维空间特征的完整性。其次,通过特征融合模块提取体素空间特征的权重。最后,采用自适应伪标签方法降低对标注样本的依赖,并基于群体投票方法进一步降低误报率。实验结果表明,该方法在KITTI数据集上取得了令人满意的成果,行人和车辆目标检测的准确率分别达到了56.30%和75.88%。该研究为未来在复杂的场景中实现高效的三维目标检测提供了思路,并为进一步优化自动驾驶的多模态数据融合技术奠定了基础。
-
关键词
三维目标检测
RGB体素特征
视锥变换
半监督学习
KITTI数据集
-
Keywords
3D object detection
RGB voxel feature
frustum transformation
semi-supervised learning
KITTI dataset
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-