期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Contextual Transformer的自动驾驶单目3D目标检测
1
作者 厍向阳 颜唯佳 董立红 《计算机工程与应用》 CSCD 北大核心 2024年第19期178-189,共12页
针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构... 针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构以提取特征。设计多尺度空间感知模块(MSP),通过尺度空间响应操作改善浅层特征的丢失情况,嵌入沿水平和竖直两个空间方向的坐标注意力机制(CA),使用softmax函数生成各尺度的重要性软权重。在偏移损失中采用Huber损失函数代替L1损失函数。实验结果表明:在KITTI自动驾驶数据集上,相较于RTM3D算法,该算法在简单、中等、困难三个难度级别下,AP3D分别提升了4.84、3.82、5.36个百分点,APBEV分别提升了4.75、6.26、3.56个百分点。 展开更多
关键词 自动驾驶 单目3D目标检测 contextual transformer 多尺度感知 坐标注意力机制
下载PDF
融合MobileNet与Contextual Transformer的人脸识别研究 被引量:1
2
作者 陈经纬 熊继平 程汉权 《智能计算机与应用》 2024年第3期61-66,共6页
FaceNet作为人脸识别的一大跨越,以其高精度、低硬件配置等优势被广泛应用于各个人脸识别相关领域。本文开源了首个餐厅支付场景下的中国人脸数据集CN-Face,该数据集拥有13000人的人脸图像,总计100000张。此外,本文以CA-SIA-WebFace作... FaceNet作为人脸识别的一大跨越,以其高精度、低硬件配置等优势被广泛应用于各个人脸识别相关领域。本文开源了首个餐厅支付场景下的中国人脸数据集CN-Face,该数据集拥有13000人的人脸图像,总计100000张。此外,本文以CA-SIA-WebFace作为训练集,利用改进后的MobileNet主干网络,采取不同的注意力机制添加方法,改变激活函数并且融入Contextual Transformer模块,大大降低了参数量和识别速度,显著提升了人脸识别精度。相较于原版FaceNet,在LFW测试集下,准确率达到98.79%,提升了2.74%,在CN-Face数据集中准确率达到95.22%,提升了1.35%。 展开更多
关键词 ECA注意力机制 人脸识别 FaceNet 深度学习 contextual transformer
下载PDF
面向船闸船舶的在线多目标跟踪技术研究
3
作者 仇耀宗 李琳 +1 位作者 郭皓捷 于清泽 《装备环境工程》 CAS 2024年第3期73-79,共7页
目的 满足船闸船舶在线跟踪要求,改善由于复杂背景、遮挡等因素导致轨迹不连续和身份变更的问题,提出一种增强上下文联系和上下文注意力的多目标跟踪方法。方法 基于设计的在线系统,采集连续帧图像,改进FairMOT多目标跟踪模型。首先,通... 目的 满足船闸船舶在线跟踪要求,改善由于复杂背景、遮挡等因素导致轨迹不连续和身份变更的问题,提出一种增强上下文联系和上下文注意力的多目标跟踪方法。方法 基于设计的在线系统,采集连续帧图像,改进FairMOT多目标跟踪模型。首先,通过在骨干网络设计基于Bottleneck和Contextual Transformer的上下文建模模块,以加强上下文联系,增强场景理解的能力。其次,在迭代聚合后的特征图上应用全局上下文注意力,提高定位船舶目标的能力。结果 相对于原生的Fair MOT方法,设计上下文建模模块后,多目标跟踪准确度指标MOTA提高2.1%,继续添加全局上下文注意力MOTA,共计提高3.5%,同时在多项指标中取得了最佳表现。结论 改进的Fair MOT方法不仅拥有更强的轨迹保持能力,而且在身份维持方面更胜一筹。 展开更多
关键词 在线多目标跟踪 船闸船舶 改进FairMOT 上下文联系 contextual transformer 上下文注意力
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部