-
题名车路两端纯视觉鸟瞰图感知研究综述
- 1
-
-
作者
周松燃
卢烨昊
励雪巍
傅本尊
王井东
李玺
-
机构
浙江大学工程师学院
浙江大学计算机科学与技术学院
百度
-
出处
《中国图象图形学报》
CSCD
北大核心
2024年第5期1169-1187,共19页
-
基金
国家自然科学基金项目(U20A20222)
国家杰出青年科学基金项目(62225605)
百度研究基金项目(152218PC10747)。
-
文摘
纯视觉鸟瞰图(bird's-eye-view,BEV)感知是国内外自动驾驶领域的前沿方向与研究热点,旨在通过相机2D图像信息,生成3D空间中周围道路环境俯视视角下的特征表示。该领域在单车智能方向上迅速发展,并实现大量落地部署。但由于车端相机的安装高度受限,不可避免地面临着远距离感知不稳定、存在驾驶盲区等实际问题,单车智能仍存在着一定的安全性风险。路端摄像头部署在红绿灯杆等高处基础设施上,能够有效扩展智能车辆的感知范围,补充盲区视野。因此,车路协同逐渐成为当前自动驾驶的发展趋势。据此,本文从相机部署端和相机视角出发,将纯视觉BEV感知技术划分为车端单视角感知、车端环视视角感知和路端固定视角感知三大方向。在每一方向中,从通用处理流程入手梳理其技术发展脉络,针对主流数据集、BEV映射模型和任务推理输出三大模块展开综述。此外,本文还介绍了相机成像系统的基本原理,并对现有方法从骨干网络使用统计、GPU(graphics processing unit)类型使用统计和模型性能统计等角度进行了定量分析,从可视化对比角度进行了定性分析。最后,从场景多元、尺度多样分布等技术挑战和相机几何参数迁移能力差、计算资源受限等部署挑战两方面揭示了当前纯视觉BEV感知技术亟待解决的问题。并从车路协同、车车协同、虚拟现实交互和统一多任务基座大模型4个方向对本领域的发展进行了全面展望。希望通过对纯视觉BEV感知现有研究以及未来趋势的总结为相关领域研究人员提供一个全面的参考以及探索的方向。
-
关键词
自动驾驶感知
纯视觉bev感知
路端固定视角感知
车端移动视角感知
多视角图像融合
-
Keywords
autonomous driving perception
pure camera-based bev perception
infrastructure-side perception
vehicleside perception
multi-view image fusion
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-