基于双模态图像关联式融合的行人实时检测

Real-Time Pedestrian Detection Based on Dual-Modal Relevant Image Fusion

导出

摘要为解决行人检测任务中低能见度场景下单模态图像漏检率高和现有双模态图像融合检测速度低等问题,提出了一种基于双模态图像关联式融合的轻量级行人检测网络。网络模型基于YOLOv7-Tiny设计,主干网络嵌入关联式融合模块RAMFusion用以提取和聚合双模态图像互补特征;将特征提取部分的1×1卷积替换为带有空间感知能力的坐标卷积;引入Soft-NMS改善结群行人漏检问题;嵌入注意力机制模块来提升模型检测精度。在公开的红外与可见光行人数据集LLVIP上的消融实验表明:与其他融合方法相比,所提方法行人漏检率降低、检测速度显著提高;与YOLOv7-Tiny相比,改进后的模型检测精度提高了2.4%,每秒检测帧数达到124 frame/s,能够满足低能见度行人实时检测需求。 In order to solve the problems of high missing detection rate of singlemodel images and low detection speed of existing dualmodel image fusion in pedestrian detection tasks under low visibility scenes,a lightweight pedestrian detection network based on dualmodel relevant image fusion is proposed.The network model is designed based on YOLOv7-Tiny,and the backbone network is embedded with RAMFusion,which is used to extract and aggregate dualmodel image complementary features.The 1×1 convolution of feature extraction is replaced by coordinate convolution with spatial awareness.SoftNMS is introduced to improve the pedestrian omission in the cluster.The attention mechanism module is embedded to improve the accuracy of model detection.The ablation experiments in public infrared and visible pedestrian dataset LLVIP show that compared with other fusion methods,the missing detection rate of pedestrians is reduced and the detection speed of the proposed method is significantly increased.Compared with YOLOv7-Tiny,the detection accuracy of the improved model is increased by 2.4%,and the detection frames per second is up to 124 frame/s,which can meet the requirements of realtime pedestrian detection in lowvisibility scenes.

作者毕程程黄妙华刘若璎王量子 Bi Chengcheng;Huang Miaohua;Liu Ruoying;Wang Liangzi(Hubei Key Laboratory of Advanced Technology for Automotive Components,Wuhan University of Technology,Wuhan 430070,Hubei,China;Hubei Collaborative Innovation Center for Automotive Components Technology,Wuhan University of Technology,Wuhan 430070,Hubei,China;Hubei Research Center for New Energy&Intelligent Connected Vehicle,Wuhan University of Technology,Wuhan 430070,Hubei,China)

机构地区武汉理工大学现代汽车零部件技术湖北省重点实验室武汉理工大学汽车零部件技术湖北省协同创新中心武汉理工大学湖北省新能源与智能网联车工程技术研究中心

出处《激光与光电子学进展》 CSCD 北大核心 2024年第8期453-460,共8页 Laser & Optoelectronics Progress

基金国家重点研发计划(2018YFE0105500)。

关键词行人检测红外与可见光图像关联式融合轻量化网络注意力机制 YOLOv7-Tiny pedestrian detection infrared and visible images relevant fusion lightweight network attention mechanism YOLOv7-Tiny

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1刘子龙,沈祥飞.融合Lite-HRNet的Yolo v5双模态自动驾驶小目标检测方法[J].汽车工程,2022,44(10):1511-1520. 被引量：7
2孙颖,侯志强,杨晨,马素刚,范九伦.基于双模态融合网络的目标检测算法[J].光子学报,2023,52(1):195-207. 被引量：6
3何自芬,陈光晨,陈俊松,张印辉.多尺度特征融合轻量化夜间红外行人实时检测[J].中国激光,2022,49(17):115-124. 被引量：20
4邵延华,张铎,楚红雨,张晓强,饶云波.基于深度学习的YOLO目标检测综述[J].电子与信息学报,2022,44(10):3697-3708. 被引量：195
5罗艳,张重阳,田永鸿,郭捷,孙军.深度学习行人检测方法综述[J].中国图象图形学报,2022,27(7):2094-2111. 被引量：20

二级参考文献14

1刘学,李范鸣,刘士建.改进的SSD红外图像行人检测算法[J].电光与控制,2020,27(1):42-46. 被引量：16
2于博,马书浩,李红艳,李春庚,安居白.远红外车载图像实时行人检测与自适应实例分割[J].激光与光电子学进展,2020,57(2):286-296. 被引量：9
3赵斌,王春平,付强,陈一超.基于深度注意力机制的多尺度红外行人检测[J].光学学报,2020,40(5):41-52. 被引量：22
4罗会兰,陈鸿坤.基于深度学习的目标检测研究综述[J].电子学报,2020,48(6):1230-1239. 被引量：152
5李成跃,姚剑敏,林志贤,严群,范保青.基于改进YOLO轻量化网络的目标检测方法[J].激光与光电子学进展,2020,57(14):37-45. 被引量：31
6赵斌,王春平,付强.显著性背景感知的多尺度红外行人检测方法[J].电子与信息学报,2020,42(10):2524-2532. 被引量：5
7白玉,侯志强,刘晓义,马素刚,余旺盛,蒲磊.基于可见光图像和红外图像决策级融合的目标检测算法[J].空军工程大学学报（自然科学版）,2020,21(6):53-59. 被引量：21
8苗壮,张湧,陈瑞敏,李伟华.基于关键点的快速红外目标检测方法[J].光学学报,2020,40(23):130-138. 被引量：9
9李玉华,刘全程,李天华,吴彦强,牛子孺,侯加林.基于Jetson Nano处理器的大蒜鳞芽朝向调整装置设计与试验[J].农业工程学报,2021,37(7):35-42. 被引量：12
10邹梓吟,盖绍彦,达飞鹏,李昱.基于注意力机制的遮挡行人检测算法[J].光学学报,2021,41(15):149-157. 被引量：27

共引文献241

1邹剑,陈征,刘长龙,张乐,张玺亮,蓝飞,王威.基于YOLOv5s-CBAM的海上平台注水流程现场漏液智能检测[J].系统仿真技术,2024,20(2):175-179.
2刘颖,刘穗君,胡冰,褚十.基于机器视觉的烟梗关键参数检测算法[J].数字技术与应用,2024,42(3):203-207.
3徐亮,何伟,叶尔达·叶尔丁达拉,李楠楠.无人机智能巡检混凝土裂缝方法和机制研究[J].水利水电技术（中英文）,2024,55(S01):249-256.
4王铮帅,邱联奎,李迎港.复杂环境下的YOLOv5s烟火检测方法[J].电子测量技术,2023,46(24):149-156. 被引量：3
5吕昌,尹和,邵叶秦.基于结构重参数化的目标检测模型[J].电子测量技术,2023,46(18):114-121. 被引量：1
6王鑫杰,王吉平.YOLO目标检测算法综述[J].广西物理,2024,45(2):50-53. 被引量：1
7王建玲.基于图像识别的塔式起重机异常预警方法及应用[J].河南工学院学报,2022,30(6):8-12. 被引量：1
8林创鲁,叶亮,李刚,李丽宁.基于深度学习的自动扶梯乘客异常行为识别方法研究[J].自动化与信息工程,2022,43(6):1-6. 被引量：6
9赵康迪,单玉刚,袁杰,赵元龙.基于实例分割的玉米虫害检测研究[J].河南农业科学,2022,51(12):153-161. 被引量：1
10任进,李文邦,郭昱汝.基于无人机平台的多目标跟踪算法[J].无线电工程,2023,53(1):34-39. 被引量：7

1刁娜.荀子“能群”思想的“四维”分析[J].江汉论坛,2024(3):82-87.
2杨松,雷财林,暨育雄,娄刃.基于车辆互扰的高速公路车群识别方法研究[J].公路与汽运,2024,40(2):20-26. 被引量：1
3张廷廷.浅谈小学生数学语言表达能力的培养[J].中国科技经济新闻数据库教育,2016(11):48-48.
4周晨亮.守护雨燕守护家园[J].人民画报,2023(2):84-85.
5马亚恒,韩赛,张魁,周阳阳,薛雯婷,贺春玲.灰喜鹊繁殖策略和取食行为研究现状[J].陕西林业科技,2023,51(6):111-114. 被引量：1
6钱旭.试论小学语文群文阅读的教学方法[J].中文科技期刊数据库（文摘版）教育,2019(4):69-69.
7南泽仁.无边无际的玉米地[J].延河,2023(4):25-31.
8秃噜豆,煤渣少女(绘图).“明察秋毫”放大镜[J].课堂内外（初中版）,2024(19):36-38.
9陈容娟,贾仲益.合宗共济:贺州“过山瑶”的家屋社会及其结群逻辑[J].原生态民族文化学刊,2024,16(3):121-134. 被引量：1
10周新庆.邻地铁深大基坑群坑降水统筹设计及运行管理[J].城市道桥与防洪,2024(5):222-226.

激光与光电子学进展

2024年第8期

浏览历史

内容加载中请稍等...

基于双模态图像关联式融合的行人实时检测

参考文献5

二级参考文献14

共引文献241

相关作者

相关机构

相关主题

浏览历史