期刊文献+
共找到106篇文章
< 1 2 6 >
每页显示 20 50 100
多模态融合的三维目标检测方法研究
1
作者 田枫 宗内丽 +5 位作者 刘芳 卢圆圆 刘超 姜文文 赵玲 韩玉祥 《计算机工程与应用》 CSCD 北大核心 2024年第13期113-123,共11页
针对点云稀疏性与无序性导致基于纯点云的检测算法容易出现远小目标漏检和误检的问题,提出一种融合图像特征与点云体素特征的多模态三维目标检测算法。在图像特征提取阶段,提出一种轻量级深度残差网络,减少图像特征通道数,使其与点云体... 针对点云稀疏性与无序性导致基于纯点云的检测算法容易出现远小目标漏检和误检的问题,提出一种融合图像特征与点云体素特征的多模态三维目标检测算法。在图像特征提取阶段,提出一种轻量级深度残差网络,减少图像特征通道数,使其与点云体素特征相一致,提高点云和图像特征的融合能力;在体素特征与图像特征融合阶段,提出一种双次特征融合网络,在保留原始体素特征结构信息的基础上将图像特征和体素特征进行融合,使点云具备丰富的语义信息,提高远小目标检测精度。在KITTI数据集上实验结果显示,与基线模型相比,对小汽车、骑行者与行人的3D平均检测精度分别提高了0.76个百分点、2.30个百分点、3.43个百分点。实验结果验证了所提方法对于解决远小目标误检和漏检问题的有效性。 展开更多
关键词 三维目标检测 深度残差网络 体素特征 图像特征 特征融合 双次特征融合网络
下载PDF
基于多通道交叉注意力融合的三维目标检测算法
2
作者 鲁斌 杨振宇 +2 位作者 孙洋 刘亚伟 王明晗 《智能系统学报》 CSCD 北大核心 2024年第4期885-897,共13页
针对现有单阶段三维目标检测算法对点云下采样特征利用方式单一、特征对长程上下文信息的聚合程度无法满足算法性能提升需求的问题,本文提出了基于多通道交叉注意力融合的单阶段三维目标检测算法。首先,设计通道交叉注意力模块用于融合... 针对现有单阶段三维目标检测算法对点云下采样特征利用方式单一、特征对长程上下文信息的聚合程度无法满足算法性能提升需求的问题,本文提出了基于多通道交叉注意力融合的单阶段三维目标检测算法。首先,设计通道交叉注意力模块用于融合下采样特征,可基于交叉注意力机制在通道层面上增强多尺度特征对不同感受野下长程空间信息的表达能力;然后,提出级联特征激励模块,结合原始下采样特征对通道交叉注意力加权特征进行级联激励,提升算法对关键空间特征的学习能力。在公共自动驾驶数据集KITTI上进行了大量实验并与主流算法对比,本文算法作为单阶段目标检测算法,在车辆类别3个难度级别上的检测准确率分别为91.34%、79.85%和75.98%,较基线算法分别提升了4.83%、3.26%和3.32%。实验结果证明了本文算法及所提模块在三维目标检测任务上的有效性和先进性。 展开更多
关键词 三维点云 自动驾驶 激光雷达 深度学习 三维目标检测 柱体素 交叉注意力 单阶段算法
下载PDF
图像语义特征引导与点云跨模态融合的三维目标检测方法
3
作者 李辉 王俊印 +3 位作者 程远志 刘健 赵国伟 陈双敏 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第5期734-749,共16页
受到场景的复杂性和目标尺度变化、遮挡等影响,三维目标检测仍面临着诸多挑战.虽然跨模态特征融合图像和激光点云信息能够有效地提升三维目标检测性能,但在融合效果和检测性能上仍有待提升,为此,提出图像语义特征引导与点云跨模态融合... 受到场景的复杂性和目标尺度变化、遮挡等影响,三维目标检测仍面临着诸多挑战.虽然跨模态特征融合图像和激光点云信息能够有效地提升三维目标检测性能,但在融合效果和检测性能上仍有待提升,为此,提出图像语义特征引导与点云跨模态融合的三维目标检测方法.首先设计图像语义特征学习网络,采用双分支自注意力并行计算方式,实现全局语义特征增强,降低目标错误分类;然后提出图像语义特征引导的局部融合模块,采用元素级数据拼接将检索的图像局部语义特征引导融合点云数据,更好地解决跨模态信息融合存在的语义对齐问题;提出多尺度再融合网络,设计融合特征与激光雷达点云交互模块,学习融合特征和不同分辨率特征间的再融合,提高网络的检测性能;最后采用4种任务损失实现anchor-free的三维目标检测.在KITTI和nuScenes数据集中与其他方法进行对比,针对三维目标检测准确率达87.15%,并且实验结果表明,文中方法优于对比方法,具有更优的三维检测性能. 展开更多
关键词 三维目标检测 跨模态 语义特征 点云 无锚
下载PDF
全局信息感知与局部特征融合的高效三维目标检测
4
作者 鲁斌 王明晗 +1 位作者 孙洋 杨振宇 《系统仿真学报》 CAS CSCD 北大核心 2024年第11期2616-2630,共15页
针对基于点云的三维目标检测中存在的特征提取能力不足和检测头分类与回归不一致问题,提出基于SECOND网络的ResCST架构。该模型在三维稀疏卷积层中引入残差连接,结合SwinTransformer捕捉长距离依赖关系的能力和卷积神经网络获取局部特... 针对基于点云的三维目标检测中存在的特征提取能力不足和检测头分类与回归不一致问题,提出基于SECOND网络的ResCST架构。该模型在三维稀疏卷积层中引入残差连接,结合SwinTransformer捕捉长距离依赖关系的能力和卷积神经网络获取局部特征的优势,提出CNNSwinTransformer混合模型,有效提升特征表达能力;提出RCIoU方法,并将其应用于回归和分类分支,实现了分类与回归任务的联合优化。实验结果表明,在自动驾驶数据集KITTI汽车类别检测中,该模型在简单、中等和困难难度级别下的三维检测精度分别达到了91.21%、82.97%和80.28%。所提方法对困难目标检测效果提升明显,可达到每秒25帧的推理速度。所提出的ResCST架构在精度与速率之间取得了较好的平衡。 展开更多
关键词 三维目标检测 点云 特征融合 注意力机制 车辆检测 体素化 自动驾驶
下载PDF
基于伪点云特征增强的多模态三维目标检测方法
5
作者 孔德明 李晓伟 杨庆鑫 《计算机学报》 EI CAS CSCD 北大核心 2024年第4期759-775,共17页
环境感知是自动驾驶汽车落地的关键技术之一,它对于提高自动驾驶汽车的安全性和可靠性至关重要.三维目标检测是其中的一项核心任务,旨在识别和定位三维空间中的物体,为后续决策提供重要的信息.点云和图像是该任务最常用的输入数据,点云... 环境感知是自动驾驶汽车落地的关键技术之一,它对于提高自动驾驶汽车的安全性和可靠性至关重要.三维目标检测是其中的一项核心任务,旨在识别和定位三维空间中的物体,为后续决策提供重要的信息.点云和图像是该任务最常用的输入数据,点云由三维空间中不规则分布的点组成,而图像则是由二维空间上规则分布的像素组成.因此,点云和图像之间难以进行有效的融合.而伪点云作为一种点云表征的图像信息,近几年受到了该领域学者的广泛关注.现阶段基于伪点云的三维目标检测方法还存在伪点云特征提取粗糙和相应感兴趣区域(Region-of-Intersts,RoI)特征表征能力差的问题.本文针对上述问题开展研究,分别提出细粒度注意力卷积和多尺度分组稀疏卷积.细粒度注意力卷积将规则图像处理中常用的深度可分离卷积引入不规则点云的处理流程,并在此基础上嵌入通道和分组注意力机制,进行精细的特征提取,增强伪点云特征;多尺度分组稀疏卷积将格网池化后的Ro I特征分组,进行差异化特征学习,获取不同尺度的Ro I特征,增强伪点云Ro I格网特征的表征能力.基于此,本文在SFD(Sparse Fuse Dense)网络的伪点云特征提取流程中引入细粒度注意力卷积,同时在其伪点云Ro I特征学习流程中引入多尺度分组稀疏卷积,构建SFD++多模态三维目标检测网络.在权威KITTI自动驾驶数据集上的实验结果表明,SFD++每秒可以处理8.33帧数据,其精度在简单、中等和困难的三维汽车检测上达到95.74%、88.80%和86.04%,比次优SFD的精度高出0.15%、0.84%和0.58%.除此之外,一系列消融和补充实验结果验证了所提出卷积的有效性和相关参数设置的合理性. 展开更多
关键词 自动驾驶 三维目标检测 伪点云 注意力机制 深度可分离卷积 组卷积
下载PDF
融合体素图注意力的三维目标检测算法
6
作者 鲁斌 孙洋 杨振宇 《智能系统学报》 CSCD 北大核心 2024年第3期598-609,共12页
目前基于点云的三维目标检测方法未能充分利用点云局部几何特征,导致对点云稀疏的目标检测效果不佳。为此,本文提出基于原始点云体素图注意力的两阶段三维目标检测算法(voxel graph attention region-CNN,VGT-RCNN)。通过多尺度体素特... 目前基于点云的三维目标检测方法未能充分利用点云局部几何特征,导致对点云稀疏的目标检测效果不佳。为此,本文提出基于原始点云体素图注意力的两阶段三维目标检测算法(voxel graph attention region-CNN,VGT-RCNN)。通过多尺度体素特征插值计算网格中心点特征;在多尺度非空体素特征上构造局部图;通过图注意力机制对体素特征进行加权平均,充分提取并利用目标的局部几何特征完成检测。该算法主要针对当前二阶段算法在进行特征聚合时对不同体素特征的重要性考虑不足进行改进,引入可学习的权重矩阵,动态学习体素特性的权重,提高局部特征表达能力。本文在流行的KITTI自动驾驶数据集上进行了充分测试,取得了具有竞争力的检测效果,尤其是在对点云稀疏的汽车目标检测上,准确率有较大提高。本文还对检测效果进行了可视化分析。 展开更多
关键词 点云 三维目标检测 图注意力 特征插值 多尺度特征 激光雷达 体素化 车辆检测
下载PDF
基于边卷积与瓶颈注意力的点云三维目标检测 被引量:1
7
作者 简英杰 杨文霞 +1 位作者 方玺 韩欢 《计算机科学》 CSCD 北大核心 2024年第5期162-171,共10页
点云数据的高度稀疏特性使当前大部分基于点云的三维目标检测算法对点云的局部特征学习不足,且点云数据包含的部分无效信息会干扰目标检测。针对以上问题,提出了一种基于边卷积与瓶颈注意力的三维目标检测模型。首先,构建多层边卷积(Edg... 点云数据的高度稀疏特性使当前大部分基于点云的三维目标检测算法对点云的局部特征学习不足,且点云数据包含的部分无效信息会干扰目标检测。针对以上问题,提出了一种基于边卷积与瓶颈注意力的三维目标检测模型。首先,构建多层边卷积(Edge Convolution,EdgeConv),针对点云中的每个点,通过寻找特征空间上与其最接近的K个点,以构建K-近邻图结构,并学习点云的多尺度局部特征;其次,设计适用于三维点云数据的瓶颈注意力模块(Bottleneck Attention Module,BAM),每个BAM包括一个通道注意力模块和一个空间注意力模块,用于增强对目标检测有价值的点云信息,提升网络模型的表征能力。网络以VoteNet为基线,多层边卷积和BAM模块依次加入PointNet++网络和投票模块之间。模型在SUN RGB-D和ScanNetV2公共数据集上进行实验,并与13个当前先进的三维目标检测算法进行对比。实验结果表明,对于SUN RGB-D数据集,所提模型在交并比(Intersection over Union,IoU)为0.5时的平均精确率mAP@0.5达到了最高,并在床、椅子、办公桌等6个对象类别(共10个类别)达到最优准确率(AP@0.25);对于ScanNetV2数据集,模型的mAP@0.25和mAP@0.5均达到最优,并在椅子、沙发、照片等10个对象类别(共18个类别)达到了最优准确率(AP@0.25)。与基线VoteNet相比,所提模型在两个数据集上的mAP@0.25分别提升了6.5%和12.9%,消融实验证明了所加入的边卷积模块和瓶颈注意力模块的有效性。 展开更多
关键词 三维目标检测 点云 边卷积 瓶颈注意力模块 VoteNet SUN RGB-D数据集 ScanNetV2数据集
下载PDF
结合视锥变换和RGB体素图的半监督三维目标检测
8
作者 汪岩 袁甜甜 +1 位作者 胡彬 李尧 《红外与激光工程》 EI CSCD 北大核心 2024年第8期250-261,共12页
基于LiDAR、可见光等多模态传感器的高精度三维目标检测是自动驾驶领域的关键技术。为了提高目标检测的精度和方位感知能力,降低模型对于标注数据的依赖,结合视锥变换方法优化了三维点云方向特征提取策略,提出了一种基于视锥变换和半监... 基于LiDAR、可见光等多模态传感器的高精度三维目标检测是自动驾驶领域的关键技术。为了提高目标检测的精度和方位感知能力,降低模型对于标注数据的依赖,结合视锥变换方法优化了三维点云方向特征提取策略,提出了一种基于视锥变换和半监督学习架构的三维目标检测技术。具体而言,基于通道注意力模块优化视锥体对远距离目标的感知能力,提出了RGB体素模块提升遮挡目标的识别精度。首先通过深度网络从RGB图像中提取纹理信息,将其与激光雷达的距离信息融合,以保持三维空间特征的完整性。其次,通过特征融合模块提取体素空间特征的权重。最后,采用自适应伪标签方法降低对标注样本的依赖,并基于群体投票方法进一步降低误报率。实验结果表明,该方法在KITTI数据集上取得了令人满意的成果,行人和车辆目标检测的准确率分别达到了56.30%和75.88%。该研究为未来在复杂的场景中实现高效的三维目标检测提供了思路,并为进一步优化自动驾驶的多模态数据融合技术奠定了基础。 展开更多
关键词 三维目标检测 RGB体素特征 视锥变换 半监督学习 KITTI数据集
下载PDF
基于红外与激光雷达融合的鸟瞰图空间三维目标检测算法 被引量:1
9
作者 王五岳 徐召飞 +3 位作者 曲春燕 林颖 陈玉峰 廖键 《光子学报》 EI CAS CSCD 北大核心 2024年第1期66-77,共12页
结合MEMS激光雷达和红外相机的优势,设计了一种简单轻量、易于扩展、易于部署的可分离融合感知系统实现三维目标检测任务,将激光雷达和红外相机分别设置成独立的分支,两者不仅能独立工作也能融合工作,提升了模型的部署能力。模型使用鸟... 结合MEMS激光雷达和红外相机的优势,设计了一种简单轻量、易于扩展、易于部署的可分离融合感知系统实现三维目标检测任务,将激光雷达和红外相机分别设置成独立的分支,两者不仅能独立工作也能融合工作,提升了模型的部署能力。模型使用鸟瞰图空间作为两种不同模态的统一表示,相机分支和雷达分支分别将二维空间和三维空间统一到鸟瞰图空间下,融合分支使用门控注意力融合机制将来自不同分支的特征进行融合。通过实际场景测试验证了算法的有效性。 展开更多
关键词 多传感器融合 激光雷达 红外相机 鸟瞰图 三维目标检测
下载PDF
基于强语义关键点采样的三维目标检测方法 被引量:1
10
作者 车运龙 袁亮 孙丽慧 《计算机工程与应用》 CSCD 北大核心 2024年第9期254-260,共7页
目标检测算法中关键信息的特征提取是影响算法精度的重要因素。针对当前三维目标检测算法中存在的关键点采样困难、特征提取不充分等问题,借鉴PV-RCNN三维目标检测网络,提出一种基于强语义关键点采样的三维目标检测方法SSPS-RCNN(strong... 目标检测算法中关键信息的特征提取是影响算法精度的重要因素。针对当前三维目标检测算法中存在的关键点采样困难、特征提取不充分等问题,借鉴PV-RCNN三维目标检测网络,提出一种基于强语义关键点采样的三维目标检测方法SSPS-RCNN(strong semantic point sampling RCNN)。在关键点采样阶段,该算法采用语义加权点采样和提案区域点过滤相融合的方法,获得更具特征代表性的采样关键点,以提升采样点中前景点的比例;在不增加网络结构的基础上,将语义信息重新加权关键点特征,以进一步细化关键点的特征贡献提升算法精度。在KITTI数据集上的实验结果表明该算法与现有主流算法相比,对减少物体检测中的漏检与错检问题和整体检测精度提升,表现出良好的稳定性和鲁棒性。 展开更多
关键词 深度学习 激光雷达 三维目标检测 特征融合
下载PDF
基于高斯滤波的双目相机三维目标检测Pseudo-LiDAR改进算法研究
11
作者 李艳明 苏建强 +1 位作者 刘鹏 张丽杰 《光学技术》 CAS CSCD 北大核心 2024年第6期713-720,共8页
Pseudo-LiDAR算法作为双目相机三维目标检测的通用算法之一,因其低成本的立体视觉方案及出色的适应性被广泛应用于在自动驾驶、机器人等领域。但该算法在预测物体边缘会产生过多畸变点从而导致目标与背景之间过渡区域估计误差大;且深度... Pseudo-LiDAR算法作为双目相机三维目标检测的通用算法之一,因其低成本的立体视觉方案及出色的适应性被广泛应用于在自动驾驶、机器人等领域。但该算法在预测物体边缘会产生过多畸变点从而导致目标与背景之间过渡区域估计误差大;且深度估计网络采用四分支结构,计算量大影响运行速度。对以上问题,将Pseudo-LiDAR算法中的Spatial Pyramid Pooling(SPP)四分支结构优化为单分支结构,提高运行速度;创新性构造高斯置信度滤波模块,滤除过渡区域误差大的数据;引入PointVoxel-RCNN(PV-RCNN)作为Pseudo-LiDAR算法中的三维目标检测网络,提升检测精度。在KITTI数据集上的实验结果表明,相较于原算法,在简单、中等和困难等级下的车辆目标三维检测平均精度分别提升了22.36%、26.48%和28.55%。 展开更多
关键词 三维目标检测 双目相机 高斯置信度 Pseudo-LiDAR算法
下载PDF
基于中心修正网络和分耦检测头的三维目标检测算法
12
作者 涂雅培 高瑜翔 +1 位作者 吴美霖 唐芷宣 《传感器与微系统》 CSCD 北大核心 2024年第5期141-144,148,共5页
本文提出一种基于中心修正网络和分耦检测头的三维目标检测算法。首先,采用三通道图像块表现形式处理三维输入信息,使用二维检测框滤除背景点,减少数据量;然后,采用基于CSP Darknet模块的中心修正网络将得到的图像块中心对齐到目标坐标... 本文提出一种基于中心修正网络和分耦检测头的三维目标检测算法。首先,采用三通道图像块表现形式处理三维输入信息,使用二维检测框滤除背景点,减少数据量;然后,采用基于CSP Darknet模块的中心修正网络将得到的图像块中心对齐到目标坐标系下的真实中心;最后,使用基于1×1卷积的分耦检测头分别对参数化三维包围框的类别和残差值进行分类和回归。实验结果表明,改进的检测算法在KITTI数据集的简单、中等、困难3种模式下的3D平均精度较同类型算法分别提高了2.82,5.54和3.81,取得了较好的检测结果。 展开更多
关键词 CSP Darknet模块 分耦检测 三维目标检测
下载PDF
基于点云的自动驾驶下三维目标检测
13
作者 杨咏嘉 钟良琪 闫胜业 《计算机工程与设计》 北大核心 2024年第4期1093-1099,共7页
针对当前三维目标检测算法对行人、骑行人等小目标检测效果不佳的缺点,提出一种改进PV-RCNN的三维目标检测算法。改进关键点下采样方式,通过滤除背景及离群点提高关键点在目标上的命中率;设计多尺度区域建议网络,尺度匹配的特征图提高... 针对当前三维目标检测算法对行人、骑行人等小目标检测效果不佳的缺点,提出一种改进PV-RCNN的三维目标检测算法。改进关键点下采样方式,通过滤除背景及离群点提高关键点在目标上的命中率;设计多尺度区域建议网络,尺度匹配的特征图提高边界框的生成质量;使用加入方向感知的DIoU损失函数优化边界框的回归。实验结果表明,与基准网络相比,算法在KITTI测试集的车辆、行人和骑行人的mAP分别提高了0.77%、6.33%和2.05%,有效提高了网络性能。 展开更多
关键词 深度学习 三维目标检测 特征金字塔 原始点云 交并比损失函数 特征融合 点云下采样
下载PDF
基于GCR-PointPillars的点云三维目标检测
14
作者 伍新月 惠飞 金鑫 《现代电子技术》 北大核心 2024年第11期168-174,共7页
针对PointPillars算法中存在识别与定位不准确的问题,提出一种GCR-PointPillars三维目标检测模型,该模型首先在Pillar特征网络中引入全局注意力机制,学习点云特征之间的相关性,增强伪图特征的全局信息交互能力;其次,基于ConvNeXt V2重... 针对PointPillars算法中存在识别与定位不准确的问题,提出一种GCR-PointPillars三维目标检测模型,该模型首先在Pillar特征网络中引入全局注意力机制,学习点云特征之间的相关性,增强伪图特征的全局信息交互能力;其次,基于ConvNeXt V2重新构建特征提取网络,提取更加丰富的语义信息,从而有效提升网络的学习能力;最后引入RDIoU来联合引导分类和回归任务,有效缓解分类和回归不一致的问题。文中模型在KITTI数据集中与基准网络相比,汽车类别在简单、中等、困难三种难度级别下分别提高了2.69%、4.29%、4.84%,并且推理速度达到25.8 f/s。实验结果表明,文中模型在保持实时性速度的同时,检测效果也有明显提升。 展开更多
关键词 三维目标检测 注意力机制 ConvNeXt V2 损失函数 激光雷达点云 自动驾驶
下载PDF
基于改进PointPillars的激光点云三维目标检测
15
作者 王家琦 吴叶兰 +1 位作者 郝凤桐 张峻景 《信息技术与信息化》 2024年第2期58-61,共4页
针对复杂场景下三维目标检测算法对小目标物体识别精度不高、容易出现错检漏检问题,提出一种基于改进PointPillars的三维目标检测算法,利用锥形点云获取物体的边界信息,抑制环境噪声造成的干扰;设计一种空间自注意力模块,捕获点云支柱... 针对复杂场景下三维目标检测算法对小目标物体识别精度不高、容易出现错检漏检问题,提出一种基于改进PointPillars的三维目标检测算法,利用锥形点云获取物体的边界信息,抑制环境噪声造成的干扰;设计一种空间自注意力模块,捕获点云支柱间的全局上下文信息和空间信息,扩大点云特征感知范围,提升小目标物体识别在复杂场景下的鲁棒性;改进主干网络的下采样模块,采用ConvNeXt v2模块增强网络的特征提取能力。在KITTI数据集上的测试结果表明,相比PointPillars原始网络,改进算法在汽车、行人、骑行者类别上的平均检测精度分别提升了3.73%、5.89%、5.7%,证明了所提出方法的有效性。 展开更多
关键词 三维目标检测 PointPillars 注意力机制 点云支柱 ConvNeXt v2
下载PDF
基于自注意力机制的自动驾驶场景三维目标检测
16
作者 魏明洋 刘学渊 +2 位作者 张慧蒙 曹文博 段小勇 《大众汽车》 2024年第2期37-39,共3页
本文针对汽车在自动驾驶场景下通过激光雷达进行环境感知时,三维目标检测对物体识别准确度不高和较小目标容易丢失的问题,提出了一种基于改进Pointpillars算法的三维目标检测方法。首先定义了一个TransformerBlock,是一个包含多头注意... 本文针对汽车在自动驾驶场景下通过激光雷达进行环境感知时,三维目标检测对物体识别准确度不高和较小目标容易丢失的问题,提出了一种基于改进Pointpillars算法的三维目标检测方法。首先定义了一个TransformerBlock,是一个包含多头注意力机制的Transformer模块,然后将这个模块引入进行特征提取的Backbone中,实现了在网络特征提取阶段就可以通过自注意力机制来对上下文语义进行丰富以及获得全局特征,让算法的特征提取能力更强。在公开数据集KITTI上进行验证,实验结果表明:改进后的方法具有更高的检测精度,相比较于原网络,在3D场景下汽车类别在简单难度上检测精度提升了8.39%,自行车类别在中等难度上检测精度提升了8.66%,在其他类别上检测精度也均有一定的提升,证明了该方法的有效性。 展开更多
关键词 自动驾驶 深度学习 三维目标检测 自注意力机制 激光雷达
下载PDF
基于自适应加权融合激光雷达和相机的三维目标检测方法
17
作者 董钰婷 官磊 《计算机应用》 CSCD 北大核心 2024年第S01期250-255,共6页
基于激光雷达和相机融合的三维目标检测技术广泛应用于自动驾驶领域,然而大部分融合方法只是简单组合不同传感器,忽略了不同传感器的感知能力随环境的变化而变化的问题,从而难以精确检测出行人等分辨率较低的目标。针对这一问题,提出一... 基于激光雷达和相机融合的三维目标检测技术广泛应用于自动驾驶领域,然而大部分融合方法只是简单组合不同传感器,忽略了不同传感器的感知能力随环境的变化而变化的问题,从而难以精确检测出行人等分辨率较低的目标。针对这一问题,提出一种基于自适应加权融合激光雷达和相机的三维目标检测方法。首先,使用ResNet50+RPN主干网络提取图像的多尺度语义特征,同时,使用动态体素特征编码器将原始点云数据聚合成点云特征;其次,利用自注意力和交叉注意力融合语义特征和点云特征,自适应地为两者的特征图分配权重;最后,将融合后的点特征通过单阶段检测器SECOND(Sparsely Embedded CONvolutional Detection)进行目标边界框回归和分类预测,并且将检测结果在KITTI数据集上验证。实验结果表明,在简单、中等和困难三种难度级别下,该多模态融合方法相较于原始SECOND模型,对汽车和行人的检测精度均有较大的提升,其中行人的检测精度提升最明显;同时,与许多主流的三维目标检测网络相比,所提方法具有更高的精度。 展开更多
关键词 激光雷达 多模态融合 三维目标检测 注意力机制 自动驾驶 深度学习
下载PDF
自动驾驶场景下的图像三维目标检测研究进展
18
作者 周燕 许业文 +3 位作者 蒲磊 徐雪妙 刘翔宇 周月霞 《计算机科学》 CSCD 北大核心 2024年第11期133-147,共15页
二维目标检测技术由于缺乏对物理世界尺寸、深度等信息的描述,在自动驾驶场景中应用还存在较大的局限性。许多研究者结合自动驾驶实际需要,在图像三维目标检测上做了许多探索。为了对该领域进行全面研究,文中对近年来国内外发表的相关... 二维目标检测技术由于缺乏对物理世界尺寸、深度等信息的描述,在自动驾驶场景中应用还存在较大的局限性。许多研究者结合自动驾驶实际需要,在图像三维目标检测上做了许多探索。为了对该领域进行全面研究,文中对近年来国内外发表的相关文献进行综述,介绍了基于图像的三维目标检测以及图像与点云融合的三维目标检测两类方法,并根据网络对输入数据的不同处理方式,对两类方法进一步细分,阐述了各个类别中的代表性方法,对各类方法的优劣进行总结,对比并分析了各算法的性能。此外,详细介绍了自动驾驶场景下三维目标检测的相关数据集和评价指标。最后,对图像三维目标检测领域中存在的挑战和困难进行了分析,并对未来可能的研究方向进行了展望。 展开更多
关键词 图像三维目标检测 深度学习 自动驾驶 多模态融合 计算机视觉
下载PDF
融合点云增强的多传感器三维目标检测方法
19
作者 王昕灿 郭志阳 +1 位作者 赫钰涛 张迁 《火力与指挥控制》 CSCD 北大核心 2024年第6期122-127,134,共7页
三维目标检测是自动驾驶环境感知中不可缺少的功能模块。相机传感器丰富的图像纹理信息可以弥补激光雷达点云的稀疏问题,提出一种即插即用的RI-Fusion模块实现激光雷达与相机的有效融合。通过球面坐标变换将点云转换为紧凑的范围视图表... 三维目标检测是自动驾驶环境感知中不可缺少的功能模块。相机传感器丰富的图像纹理信息可以弥补激光雷达点云的稀疏问题,提出一种即插即用的RI-Fusion模块实现激光雷达与相机的有效融合。通过球面坐标变换将点云转换为紧凑的范围视图表示,基于注意力机制将距离图像与相应的相机图像进行集成,将原始距离图像与融合特征相连接以保留点云的信息,并将融合结果投影到空间点云中。特征增强后的点云可以输入到基于激光雷达的三维目标检测器中。在KITTI三维目标检测基准上进行实验,结果表明,提出的融合方法能够显著增强多个基于激光雷达的三维目标检测器,且针对行人与骑行者等小目标可以获得更高的检测精度。 展开更多
关键词 三维目标检测 多传感器 融合 点云
下载PDF
基于体素化的变电站场景三维目标检测
20
作者 王大伟 胡帆 +3 位作者 张娜 杨罡 鲁霁原 张兴忠 《计算机工程与应用》 CSCD 北大核心 2024年第11期328-335,共8页
针对变电站三维场景中目标特征提取不充分引起的检测精度低的问题,提出一种基于体素化的变电站场景三维目标检测模型AugSecond。该模型基于Second网络结构设计,在体素特征编码阶段引入三重注意力机制,关注多维注意力以增强目标关键信息... 针对变电站三维场景中目标特征提取不充分引起的检测精度低的问题,提出一种基于体素化的变电站场景三维目标检测模型AugSecond。该模型基于Second网络结构设计,在体素特征编码阶段引入三重注意力机制,关注多维注意力以增强目标关键信息,降低无关特征信息干扰;设计非对称稀疏卷积网络,使用非对称卷积提高卷积核表征能力,并融合多尺度特征以丰富目标几何信息;同时对位置回归损失进行优化,使用CIoU Loss进一步考虑包围框之间的几何相关性以加快网络收敛速度。在自建电力场景数据集和公开数据集实验表明,相比基准模型,Aug-Second模型显著提升识别精度并具备实时性推理速度,证明了所提模型的有效性。 展开更多
关键词 体素化 三维目标检测 三重注意力 非对称稀疏卷积
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部