InternDiffuseDet:结合可变形卷积和扩散模型的目标检测方法

InternDiffuseDet:Object Detection Method Combining Deformable Convolution and Diffusion Model

下载PDF

导出

摘要针对现有目标检测中存在的漏检和误检、特征提取能力有限、处理复杂场景时检测精度不高等问题,基于DiffusionDet进行改进,提出了一种结合可变形卷积和扩散模型的目标检测方法。以模型在进入检测头之前需要更多且优质的特征图为核心思想,在主干网络中引入InternImage和DCNv3可变形卷积算子提升模型的感受野和非线性建模能力。对中间层的FPN特征金字塔进行改进,设计了一种基于选择性加权的特征金字塔CS-FPN;利用深度可分离卷积实现通道和区域的分离,同时采用CARAFE算子替代传统的上采样操作,提高分辨率和语义信息的传递;随后利用SGE注意力机制对特征图进行重组,以确保特征图在扩散的过程中保留更多的层次化信息。在特征图进入检测头之前,进行DDIM的扩散操作,获得不同时刻的特征图,以扩充检测特征图的数量。最后在目标框匹配和损失函数方面采用EIOU算法以处理目标框之间的位置偏移和尺度差异。实验数据显示,在COCO数据集和道路检测数据集上,改进后的模型在相同的实验环境下比原有模型分别提升了3.8和3.6个百分点。实验结果表明该方法在提高目标检测的准确性和鲁棒性方面具有一定的潜力,并为解决现实场景中的目标检测问题提供了新的思路和方法。 The paper focuses on the topic of object detection and aims to address issues such as missed detections,limited feature extraction capability,and low detection accuracy in complex scenes.Building upon DiffusionDet,a modified approach is proposed that combines deformable convolutions and diffusion models for object detection.The core idea is to increase the quantity and quality of feature maps before entering the detection head.This is achieved by introducing InternImage and DCNv3 deformable convolution operators into the backbone network,enhancing the receptive field and non-linear modeling capability of the model.An improved feature pyramid network(CS-FPN)based on selective weighting is proposed to enhance the intermediate FPN feature pyramids.Channel and spatial separations are achieved using depthwise separable convolutions,with the traditional upsampling operation being replaced by the CARAFE operator to improve resolution and semantic information transfer.Following that,the SGE attention mechanism is employed to reassemble the feature maps,ensuring the preservation of hierarchical information during diffusion.Prior to entering the detection head,the DDIM diffusion operation is performed to obtain feature maps at different time steps,thereby augmenting the quantity of detection feature maps.Finally,the EIOU algorithm is introduced in target box matching and loss functions to handle position deviations and scale differences between target boxes.Experimental results on the COCO dataset and road detection dataset demonstrate that the improved model is 3.8 and 3.6 percentage points higher than the original model,respectively,in the same experimental settings.These results indicate the potential of the proposed method to enhance the accuracy and robustness of object detection,providing new insights and approaches for addressing object detection challenges in real-world scenarios.

作者袁志祥高永奇 YUAN Zhixiang;GAO Yongqi(School of Computer Science and Technology,Anhui University of Technology,Ma’anshan,Anhui 243032,China)

机构地区安徽工业大学计算机科学与技术学院

出处《计算机工程与应用》 CSCD 北大核心 2024年第12期203-215,共13页 Computer Engineering and Applications

基金国家自然科学基金(61806005) 安徽高校协同创新项目(GXXT-2020-012) 安徽省高校科学研究重点项目(KJ2021A0373) 安徽省高校优秀青年人才支持计划项目(gxyqZD2022032)。

关键词 DiffusionDet 可变形卷积扩散模型特征金字塔损失函数 DiffusionDet deformable convolution diffusion model feature pyramid loss function

分类号 U495 [交通运输工程—交通运输规划与管理] TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1赵珊,郑爱玲,刘子路,高雨.通道分离双注意力机制的目标检测算法[J].计算机科学与探索,2023,17(5):1112-1125. 被引量：10
2贾天豪,彭力,戴菲菲.引入残差学习与多尺度特征增强的目标检测器[J].计算机科学与探索,2023,17(5):1102-1111. 被引量：11
3崔振东,李宗民,杨树林,刘玉杰,李华.基于语义分割引导的三维目标检测[J].图学学报,2022,43(6):1134-1142. 被引量：4

二级参考文献10

1吴天舒,张志佳,刘云鹏,裴文慧,陈红叶.基于改进SSD的轻量化小目标检测算法[J].红外与激光工程,2018,47(7):37-43. 被引量：56
2陈飞,章东平.基于多尺度特征融合的Faster-RCNN道路目标检测[J].中国计量大学学报,2018,29(4):393-397. 被引量：12
3Juanping ZHAO,Weiwei GUO,Zenghui ZHANG,Wenxian YU.A coupled convolutional neural network for small and densely clustered ship detection in SAR images[J].Science China(Information Sciences),2019,62(4):107-122. 被引量：14
4冀中,孔乾坤,王建.一种双注意力模型引导的目标检测算法[J].激光与光电子学进展,2020,57(6):115-122. 被引量：6
5鞠默然,罗江宁,王仲博,罗海波.融合注意力机制的多尺度目标检测算法[J].光学学报,2020,40(13):126-134. 被引量：44
6宋云博,陈冬艳,郝赟,付先平.基于级联卷积神经网络的高效目标检测方法[J].计算机工程与应用,2021,57(5):139-145. 被引量：11
7许德刚,王露,李凡.深度学习的典型目标检测算法研究综述[J].计算机工程与应用,2021,57(8):10-25. 被引量：190
8陈彦如.轻量级深度可分离混合卷积神经网络的目标检测算法[J].电子技术与软件工程,2021(9):156-159. 被引量：1
9陈维婧,周萍,杨海燕,杨青,陈睿.通道-空间联合注意力机制的显著性检测模型[J].计算机工程与应用,2021,57(19):214-219. 被引量：8
10李文涛,彭力.多尺度通道注意力融合网络的小目标检测算法[J].计算机科学与探索,2021,15(12):2390-2400. 被引量：14

共引文献20

1张阳婷,黄德启,王东伟,贺佳佳.基于深度学习的目标检测算法研究与应用综述[J].计算机工程与应用,2023,59(18):1-13. 被引量：30
2齐向明,柴蕊,高一萌.重构SPPCSPC与优化下采样的小目标检测算法[J].计算机工程与应用,2023,59(20):158-166. 被引量：9
3徐守坤,顾佳楠,庄丽华,李宁,石林,刘毅.基于两阶段计算Transformer的小目标检测[J].计算机科学与探索,2023,17(12):2967-2983. 被引量：1
4许晓阳,高重阳.改进YOLOv7-tiny的轻量级红外车辆目标检测算法[J].计算机工程与应用,2024,60(1):74-83. 被引量：2
5许德刚,王再庆,邢奎杰,郭奕欣.改进YOLOv6的遥感图像目标检测算法[J].计算机工程与应用,2024,60(3):119-128. 被引量：1
6彭晏飞,赵涛,陈炎康,袁晓龙.基于上下文信息与特征细化的无人机小目标检测算法[J].计算机工程与应用,2024,60(5):183-190. 被引量：1
7徐洪俊,唐自强,张锦东,朱沛华.钢材表面缺陷检测的YOLOv5s算法优化研究[J].计算机工程与应用,2024,60(7):306-314.
8史涛,崔杰,李松.优化改进YOLOv8实现实时无人机车辆检测的算法[J].计算机工程与应用,2024,60(9):79-89. 被引量：2
9窦智,高浩然,刘国奇,常宝方.轻量化YOLOv8的小样本钢板缺陷检测算法[J].计算机工程与应用,2024,60(9):90-100. 被引量：1
10于俊伟,郭园森,张自豪,母亚双.弱监督显著性目标检测研究进展[J].计算机工程与应用,2024,60(10):1-15.

1王洋,郭杜杜,王庆庆,周飞,秦音.基于改进DeepLabV3+的无人机高速公路护栏检测[J].激光与光电子学进展,2024,61(4):230-238.
2黄海新,蔡明启,王钰瑶.基于图卷积神经网络的点云语义分割综述[J].计算机科学,2024,51(S01):31-37. 被引量：1
3刘培刚,薛开欣,袁昊,李宗民.基于局部感知的点云语义分割方法[J].科学技术与工程,2024,24(15):6329-6337.
4李京南.基于匹配追踪算法的地震数据提高分辨率方法[J].石油物探,2024,63(3):571-577.
5由晓东,杜可欣.基于适老化需求的老年保健食品包装设计研究[J].食品安全导刊,2024(4):160-162.
6文小爽,徐源音,吴昊,张露.结合离散余弦变换与离散小波变换的无损彩色图像加密算法[J].软件导刊,2024,23(5):162-167.
7周乐照,尹丝雨,郑林晔.基于雷达径向风的台风位置快速识别人工智能算法研究[J].海峡科学,2024(3):12-17.
8薛野,赵苏城,龚屹,蓝加达.苏北盆地溱潼凹陷高密度三维地震与效果[J].中国科技论文,2024,19(5):529-539.
9Muriithi Jackson Githinji,Paul Mwangi Njogu,Zipporah Nganga,Mohamed Karama.Levels of Polycyclic Aromatic Hydrocarbons (PAHs) in Healthcare Waste Incinerators’ Bottom Ash from Five County Hospitals in Kenya[J].Journal of Environmental Protection,2024,15(3):318-337.

计算机工程与应用

2024年第12期

浏览历史

内容加载中请稍等...

InternDiffuseDet:结合可变形卷积和扩散模型的目标检测方法

参考文献3

二级参考文献10

共引文献20

相关作者

相关机构

相关主题

浏览历史