重参数化增强的双模态实时目标检测模型

Re-parameterization Enhanced Dual-modal Realtime Object Detection Model

下载PDF

导出

摘要无人机高空航拍的目标普遍尺寸小、特征弱,而且受复杂天候条件影响大,导致基于可见光或红外单模态图像的目标检测漏检、误检率较高。对此,提出了重参数化增强的双模态实时目标检测模型DM-YOLO。首先,采用通道拼接的方法融合可见光和红外图像,以极低的成本融合双模态图像的互补信息。其次,提出更加高效的重参数化模块并基于此构建了更加强大的骨干网RepCSPDarkNet,有效增强了骨干网对双模态图像的特征提取能力。然后,提出了多层次特征融合模块,通过多感受野卷积和注意力机制融合弱小目标的多尺度特征信息,增强了弱小目标的多尺度特征表示。最后,删除了对弱小目标检测基本不起作用的特征金字塔深层检测层,在检测精度保持不变的情况下,减小了模型规模。实验结果表明,在大规模的双模态图像数据集DroneVehicle上,DM-YOLO的检测精度比基准YOLOv5s高出2.45%,且优于规模相当的YOLOv6和YOLOv7模型,有效提高了复杂光照条件下目标检测的准确性和鲁棒性,同时检测速度达到82 FPS,可满足实时检测的需求。 The objects captured by drones at high altitudes are generally small and have weak features,and they are greatly affec-ted by complex weather conditions.Object detection based on visible or infrared images often has high rates of missed detection and false detection.To address this problem,this paper proposes a dual-modal realtime object detection model DM-YOLO with reparameterization enhancement.Firstly,the visible and infrared images are effectively fused by channel concatenation,which makes efficient use of the complementary information in the dual-modal images at a very low cost.Secondly,a more efficient reparameterization module is proposed and a more powerful backbone network RepCSPDarkNet is constructed based on it,which effectively improves the feature extraction capability of the backbone network for dual-modal images.Then,a multi-level feature fusion module is proposed to enhance the multiscale feature representation of weak and small objects by fusing multi-scale feature information of weak and small objects with multi-receptive field dilated convolution and attention mechanism.Finally,the deep feature layer of the feature pyramid is removed,which reduces the model size while maintaining the detection accuracy.Experimental results on the large-scale dual-modal image dataset DroneVehicle show that,the detection accuracy of DM-YOLO is 2.45%higher than that of the baseline YOLOv5s,and is better than that of the YOLOv6 and YOLOv7 models.Furthermore,it effectively improves the accuracy and robustness of object detection under complex weather conditions,while achieving a detection speed of 82 frames per second,which can meet the requirements of realtime detection.

作者李允臣张睿王家宝李阳王梓祺陈瑶 LI Yunchen;ZHANG Rui;WANG Jiabao;LI Yang;WANG Ziqi;CHEN Yao(College of Command and Control Engineering,Army Engineering University of PLA,Nanjing 210007,China)

机构地区陆军工程大学指挥控制工程学院

出处《计算机科学》 CSCD 北大核心 2024年第9期162-172,共11页 Computer Science

基金江苏省高校自然科学研究基金(BK20200581)。

关键词重参数化双模态实时目标检测多尺度特征注意力机制 Reparameterization Dual modality Real-time object detection Multiscale features Attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1吴泽,缪小冬,李伟文,虞浒.基于红外可见光融合的低能见度道路目标检测算法[J].红外技术,2022,44(11):1154-1160. 被引量：4
2杨艳红,钟宝江,田宏伟.DS-YOLOv4-tiny救援机器人目标检测模型[J].计算机仿真,2022,39(1):387-393. 被引量：11
3谢溥轩,崔金荣,赵敏.基于改进YOLOv5的电动车头盔佩戴检测算法[J].计算机科学,2023,50(S01):410-415. 被引量：7
4牛为华,殷苗苗.基于改进YOLO v5的道路小目标检测算法[J].传感技术学报,2023,36(1):36-44. 被引量：16

二级参考文献27

1余汪洋,陈祥光,董守龙,吴磊.基于小波变换的图像融合算法研究[J].北京理工大学学报,2014,34(12):1262-1266. 被引量：27
2郝旭政,柴争义.一种改进的深度残差网络行人检测方法[J].计算机应用研究,2019,36(5):1569-1572. 被引量：21
3贾硕,张文昌,吴航,陈炜,张永梅.救援机器人研究现状及其发展趋势[J].医疗卫生装备,2019,40(8):90-95. 被引量：31
4吴伟浩,李青.基于改进Yolo v3的电连接器缺陷检测[J].传感技术学报,2020,33(2):299-307. 被引量：12
5李章维,胡安顺,王晓飞.基于视觉的目标检测方法综述[J].计算机工程与应用,2020,56(8):1-9. 被引量：57
6刘颖,刘红燕,范九伦,公衍超,李莹华,王富平,卢津.基于深度学习的小目标检测研究与应用综述[J].电子学报,2020,48(3):590-601. 被引量：91
7赵永强,饶元,董世鹏,张君毅.深度学习目标检测方法综述[J].中国图象图形学报,2020,25(4):629-654. 被引量：221
8张为,魏晶晶.嵌入DenseNet结构和空洞卷积模块的改进YOLO v3火灾检测算法[J].天津大学学报（自然科学与工程技术版）,2020,53(9):976-983. 被引量：28
9罗会兰,陈鸿坤.基于深度学习的目标检测研究综述[J].电子学报,2020,48(6):1230-1239. 被引量：143
10顾恭,徐旭东.改进YOLOv3的车辆实时检测与信息识别技术[J].计算机工程与应用,2020,56(22):173-184. 被引量：26

共引文献33

1李文.神经网络中梯度消失的解决办法[J].电脑知识与技术,2023,19(10):19-21.
2蒋平山,柯张镭,孙亚欣,邓健.基于改进YOLOv5的防疫巡检机器人设计与实现[J].无线电工程,2023,53(6):1416-1420. 被引量：2
3胡文骏,杨莉琼,肖宇峰,何宏森.识别安全帽佩戴的轻量化网络模型[J].计算机工程与应用,2023,59(13):149-155. 被引量：1
4鲁佳儒,胡文勋,肖运虹.基于改进YOLOv5的人脸疲劳检测[J].信息与电脑,2023,35(7):111-114. 被引量：1
5高文俊,张海峰.基于改进YOLOv4风机叶片缺陷检测方法[J].农业装备与车辆工程,2023,61(8):94-98. 被引量：3
6刘晨熙,杨亚会,周奎,张友兵,代加喜.局部遮挡条件下的人脸识别算法[J].湖北汽车工业学院学报,2023,37(3):44-47.
7江祥奎,杜遥遥,胡浩昌.一种改进YOLOv5s小目标无人机实时检测算法[J].西安邮电大学学报,2023,28(3):88-96. 被引量：1
8齐芳平,石晔,崔志威,王辉,朱澈.基于改进YOLOv5的巡更安全风险识别方法研究[J].上海节能,2023(12):1876-1881.
9崔光珍,孙启迪,肖艳秋,高红霞.基于多传感器融合的城市道路目标检测方法[J].计算机仿真,2023,40(10):193-199. 被引量：1
10冀金金,荆有波.面向无依托供电场景的小目标检测轻量级模型[J].计算机工程与设计,2024,45(1):159-167.

1龙伍丹,彭博,胡节,申颖,丁丹妮.基于加强特征提取的道路病害检测算法[J].计算机应用,2024,44(7):2264-2270.
2陈世威,艾灵玉.基于YOLOv5的目标建筑物虚实融合技术[J].科技创新与应用,2024,14(27):185-188.
3张睿,李允臣,王家宝,陈瑶,王梓祺,李阳.多尺度特征融合的双模态目标检测方法[J].计算机工程与应用,2024,60(17):233-242.
4胡昭华,李昱辉.基于改进YOLOX的遥感目标检测算法[J].激光与光电子学进展,2024,61(12):294-305. 被引量：1
5赵精华.大规模异构算力资源池应用管理系统构建策略分析[J].通信世界,2024(16):44-48.
6惠记庄,王锦豪,周涛,张雅倩,丁凯.人机协同装配多目标检测的改进YOLOv7算法[J].机械科学与技术,2024,43(8):1418-1426.
7刘悦,杨桦,王青正.面向复杂光照环境的车道线检测方法[J].激光杂志,2024,45(6):94-99.
8李志良,李梦霞,董勇,李龙.基于改进YOLO v8的轻量化玉米害虫识别方法[J].江苏农业科学,2024,52(14):196-206.
9黄亮,郝颖明.不均匀光照下的合作目标图像分割方法[J].计算机应用,2024,44(S01):229-234.
10王瑞琳,王立,贺盈波.基于小波和动态互补滤波的图像与事件融合方法[J].工程科学学报,2024,46(11):2076-2084.

计算机科学

2024年第9期

浏览历史

内容加载中请稍等...

重参数化增强的双模态实时目标检测模型

参考文献4

二级参考文献27

共引文献33

相关作者

相关机构

相关主题

浏览历史