期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于可变形注意力机制的多模态3D目标检测算法
1
作者 韩邦彦 田青 《软件工程》 2024年第10期29-33,共5页
3D目标检测是自动驾驶技术的基础,融合激光点云和图像等模态的信息可以有效地提高目标检测的准确性和鲁棒性。文章改进了现有融合激光点云和图像等模态信息的3D目标检测网络,提出了一种新的并行融合模块,用于同时维护两种模态下的特征信... 3D目标检测是自动驾驶技术的基础,融合激光点云和图像等模态的信息可以有效地提高目标检测的准确性和鲁棒性。文章改进了现有融合激光点云和图像等模态信息的3D目标检测网络,提出了一种新的并行融合模块,用于同时维护两种模态下的特征信息,减少信息损失。此外,利用掩码特征增强模块,提高受遮挡物体的检测能力。在KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute)数据集上进行了验证,实验结果表明,相比于基准网络,该方法有效提高了3D目标检测的性能,平均精度达到了77.41%,同时优于目前大多数的先进方法。 展开更多
关键词 3D目标检测 多模态融合 可变形注意力机制
下载PDF
基于可变形注意力Transformer的场景文本检测
2
作者 刘恒 陈姚节 许晓峰 《计算机与数字工程》 2023年第9期2060-2066,2136,共8页
目前在场景文本检测领域中,基于深度学习的检测算法已经取代了传统的文本检测算法。针对在深度学习算法中基于分割的方法和基于边界框回归的两类方法被广泛的应用在文本检测当中的情形,提出了基于可变形注意力Transformer的场景文本检... 目前在场景文本检测领域中,基于深度学习的检测算法已经取代了传统的文本检测算法。针对在深度学习算法中基于分割的方法和基于边界框回归的两类方法被广泛的应用在文本检测当中的情形,提出了基于可变形注意力Transformer的场景文本检测算法。首先,在采用ResNet残差网络作为骨干网络的基础上引入了Transformer编解码结构,以此将检测的目标聚焦至文本上;然后,在Transformer编解码结构中添加了可变形注意力机制,有利于让模型只关注参考点附近少量的关键采样点,降低高分辨率特征图的计算复杂度,缓解小目标文本检测困难的问题。通过在ICDAR 2013、ICDAR 2015、MSRA-TD 500与论文的场景文本数据集上的实验结果表明,与传统的深度学习主流方法相比,从F1score与Ap等实验指标上验证了算法的有效性与先进性。 展开更多
关键词 文本检测 TRANSFORMER 可变形注意力机制 深度学习
下载PDF
基于单目RGB图像的三维手部姿态估计方法
3
作者 杨冰 徐楚阳 +1 位作者 姚金良 向学勤 《浙江大学学报(工学版)》 北大核心 2025年第1期18-26,共9页
现有的三维手部姿态估计方法大多基于Transformer技术,未充分利用高分辨率下的局部空间信息,为此提出基于改进FastMETRO的三维手部姿态估计方法.引入可变形注意力机制,使得编码器的设计不再受限于图像特征序列长度;引入交错更新多尺度... 现有的三维手部姿态估计方法大多基于Transformer技术,未充分利用高分辨率下的局部空间信息,为此提出基于改进FastMETRO的三维手部姿态估计方法.引入可变形注意力机制,使得编码器的设计不再受限于图像特征序列长度;引入交错更新多尺度特征编码器来融合多尺度特征,强化生成手部姿态;引入图卷积残差模块来挖掘网格顶点间的显式语义联系.为了验证所提方法的有效性,在数据集FreiHAND、HO3D V2和HO3D V3上开展训练及评估实验.结果表明,所提方法的回归精度优于现有先进方法,在FreiHAND、HO3D V2、HO3D V3上的普鲁克对齐-平均关节点误差分别为5.8、10.0、10.5 mm. 展开更多
关键词 三维手部姿态估计 TRANSFORMER 可变形注意力机制 交错更新多尺度特征编码器 神经网络
下载PDF
基于改进YOLOv8n的雨天场景中飞机铆钉检测方法
4
作者 夏正洪 杨磊 +2 位作者 刘璐 何琥 钟吉飞 《中国安全生产科学技术》 北大核心 2025年第1期195-201,共7页
为解决雨天场景中飞机表面附着与铆钉大小、形状相似的水滴而导致机务工程师在绕机检查过程中易出现铆钉误检的问题,提出1种基于改进YOLOv8n的飞机铆钉小目标检测方法。首先,改进C2f层,融入动态蛇形卷积,以捕捉复杂多变的全局形态特征;... 为解决雨天场景中飞机表面附着与铆钉大小、形状相似的水滴而导致机务工程师在绕机检查过程中易出现铆钉误检的问题,提出1种基于改进YOLOv8n的飞机铆钉小目标检测方法。首先,改进C2f层,融入动态蛇形卷积,以捕捉复杂多变的全局形态特征;其次,在主干网络中嵌入可变形注意力机制,自适应调整对不同区域的关注度;然后,增加1个160×160的小目标检测层,提高小目标的检测能力;最后,使用斯库拉交并比(SIoU)边界框损失函数,提升模型训练速度和推理准确性,基于自建的飞机铆钉和雨滴数据集进行消融实验和对比实验。研究结果表明:本文所提算法在雨天场景下的铆钉检测精确度、召回率、mAP值分别较YOLOv8n提升7.4,4.0,7.8百分点,较其他主流算法也有显著提升。研究结果可为特殊天气下的飞机铆钉检测提供理论基础。 展开更多
关键词 航空安全 小目标检测 飞机铆钉 动态蛇形卷积 可变形注意力机制
下载PDF
基于深度学习的竹笋细粒度识别技术
5
作者 段成鑫 赵霞 《软件工程》 2024年第12期30-33,共4页
为了提升不同环境中竹笋细粒度的自动化识别精度,提高生产管理效率,文章提出了一种基于YOLOv8的目标检测改进模型。该模型融合了BiFPN(Bidirectional Feature Pyramid Network),这一架构在图像目标检测和分割任务中表现出色,同时在C2f... 为了提升不同环境中竹笋细粒度的自动化识别精度,提高生产管理效率,文章提出了一种基于YOLOv8的目标检测改进模型。该模型融合了BiFPN(Bidirectional Feature Pyramid Network),这一架构在图像目标检测和分割任务中表现出色,同时在C2f模块中添加DAT(Vision Transformer with Deformable Attention),引入了可变形注意力机制,进一步提升了模型的性能。实验结果表明,改进后的算法模型对春笋和冬笋识别的平均精度均值(Mean Average Precision,mAP)分别为81.4%和94.7%,相较于原有模型,分别提升了0.9百分点和3.9百分点。改进后的算法模型在竹笋细粒度识别方面展现出较高的精度,为未来竹笋产业的高度智能化提供了技术支撑。 展开更多
关键词 细粒度识别 目标检测 可变形注意力机制 多尺度特征 YOLOv8
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部