混合采样下多级特征聚合的视频目标检测算法

Video object detection algorithm based on multi-level feature aggregation under mixed sampler

下载PDF

导出

摘要针对现有基于深度学习的视频目标检测算法无法同时满足精度和效率要求的问题,在单阶段检测器YOLOX-S的基础上,提出基于混合加权采样和多级特征聚合注意力的视频目标检测算法.混合加权参考帧采样(MWRS)策略采用加权随机采样操作和局部连续采样操作,充分利用有效的全局信息与帧间局部信息.多级特征聚合注意力模块(MFAA)基于自注意力机制,对YOLOX-S提取的分类特征进行细化,使得网络从不同层次的特征中学到更加丰富的特征信息.实验结果表明,所提算法在ImageNet VID数据集上的检测精度均值AP50达到77.8%,平均检测速度为11.5 ms/帧,在检测图片上的目标分类和定位效果明显优于YOLOX-S,表明所提算法达到了较高的精度,具有较快的检测速度. A video object detection algorithm which was built upon the YOLOX-S single-stage detector based on mixed weighted reference-frame sampler and multi-level feature aggregation attention was proposed aiming at the problems of existing deep learning-based video object detection algorithms failing to simultaneously meet accuracy and efficiency requirements.Mixed weighted reference-frame sampler(MWRS)included weighted random sampling and local consecutive sampling to fully utilize effective global information and inter-frame local information.Multilevel feature aggregation attention(MFAA)module refined the classification features extracted by YOLOX-S based on self-attention mechanism,encouraging the network to learn richer feature information from multi-level features.The experimental results demonstrated that the proposed algorithm achieved an average precision AP50 of 77.8%on the ImageNet VID dataset with an average detection speed of 11.5 milliseconds per frame.The object classification and location performance are significantly better than that of YOLOX-S,indicating that the proposed algorithm achieves higher accuracy and faster detection speed.

作者秦思怡盖绍彦达飞鹏 QIN Siyi;GAI Shaoyan;DA Feipeng(School of Automation,Southeast University,Nanjing 210096,China;Key Laboratory of Measurement and Control of Complex Engineering Systems,Ministry of Education,Southeast University,Nanjing 210096,China)

机构地区东南大学自动化学院东南大学复杂工程系统测量与控制教育部重点实验室

出处《浙江大学学报（工学版）》 EI CAS CSCD 北大核心 2024年第1期10-19,共10页 Journal of Zhejiang University：Engineering Science

基金江苏省前沿引领技术基础研究专项项目(BK20192004C) 江苏省高校优势学科建设工程资助项目。

关键词机器视觉视频目标检测特征聚合注意力机制 YOLOX machine vision video object detection feature aggregation attention mechanism YOLOX

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1史钰祜,张起贵.基于局部注意的快速视频目标检测方法[J].计算机工程,2022,48(5):314-320. 被引量：1
2李凯,林宇舜,吴晓琳,廖飞宇.基于多尺度融合与注意力机制的小目标车辆检测[J].浙江大学学报（工学版）,2022,56(11):2241-2250. 被引量：7
3于楠晶,范晓飚,邓天民,冒国韬.基于多头自注意力的复杂背景船舶检测算法[J].浙江大学学报（工学版）,2022,56(12):2392-2402. 被引量：5
4张娜,戚旭磊,包晓安,吴彪,涂小妹,金瑜婷.基于优化预测定位的单阶段目标检测算法[J].浙江大学学报（工学版）,2022,56(4):783-794. 被引量：6
5蔡强,李韩玉,李楠,刘新亮.基于时序信息和注意力机制的视频目标检测[J].计算机仿真,2021,38(12):380-385. 被引量：1

二级参考文献18

1高文,汤洋,朱明.复杂背景下目标检测的级联分类器算法研究[J].物理学报,2014,63(9):148-156. 被引量：9
2陈滨,赵建军,王毅.关于摄像运动目标图像优化检测仿真研究[J].计算机仿真,2017,34(5):371-375. 被引量：2
3刘玉杰,曹先知,李宗民,李华.结合关联特征和卷积神经网络的视频目标检测[J].华南理工大学学报（自然科学版）,2018,46(12):26-33. 被引量：3
4徐诚极,王晓峰,杨亚东.Attention-YOLO:引入注意力机制的YOLO检测算法[J].计算机工程与应用,2019,55(6):13-23. 被引量：67
5裴伟,许晏铭,朱永英,王鹏乾,鲁明羽,李飞.改进的SSD航拍目标检测方法[J].软件学报,2019,30(3):738-758. 被引量：61
6赵谦,薛改样,杨新花.基于视觉注意机制的行人目标检测[J].计算机仿真,2019,36(7):411-414. 被引量：5
7王浩,单文静,方宝富.基于多层上下文卷积神经网络的目标检测算法[J].模式识别与人工智能,2020,33(2):113-120. 被引量：8
8李航,朱明.基于深度卷积神经网络的小目标检测算法[J].计算机工程与科学,2020,42(4):649-657. 被引量：25
9梁鸿,李洋,邵明文,李传秀,张兆雷.基于残差网络和改进特征金字塔的油田作业现场目标检测算法[J].科学技术与工程,2020,20(11):4442-4450. 被引量：5
10齐亮,李邦昱,陈连凯.基于改进的Faster R-CNN船舶目标检测算法[J].中国造船,2020,61(S01):40-51. 被引量：6

共引文献15

1张世友,毕振波,王子豪,谭逸柯.基于人工智能的海洋牧场养殖区船舶闯入检测[J].农村经济与科技,2023,34(19):54-56.
2倪慧洋.基于视频信息的港口滞留船舶检测研究[J].舰船科学技术,2023,45(7):186-189. 被引量：1
3王慧薷,王传旭,刘豪,张浩.基于双分支通道空间依赖和非对称权重共享卷积的目标检测优化结构[J].计算机应用研究,2023,40(5):1565-1570.
4薛珊,卢涛,吕琼莹,曹国华.基于多尺度融合和轻量化网络的无人机目标检测算法[J].湖南大学学报（自然科学版）,2023,50(8):82-93. 被引量：1
5于飞,徐斌,王荣浩,韩合权.基于改进YOLOv8的旋转链板检测算法[J].制造业自动化,2023,45(9):212-216. 被引量：2
6刘珂琪,董绵绵,郜辉,吕志刚,郭宝亿,庞敏.基于光照感知权重融合的多模态行人检测算法[J].激光与光电子学进展,2023,60(16):137-147.
7艾青林,杨佳豪,崔景瑞.基于自适应增殖数据增强与全局特征融合的小目标行人检测[J].浙江大学学报（工学版）,2023,57(10):1933-1944.
8李涛,张煜培,赵知劲.基于多头自注意力机制的协作频谱感知算法[J].电子技术应用,2023,49(11):88-93.
9涂小妹,包晓安,吴彪,金瑜婷,张庆琪.三维坐标注意力路径聚合网络的目标检测算法[J].计算机科学与探索,2023,17(12):2984-2998.
10秦云飞,崔晓龙,程林,樊继东.融合多层次浅层信息的航拍小目标检测[J].计算机系统应用,2024,33(2):176-187.

1杨婉琪,李智琪,李福生,吕树彬,樊佳婧.基于CARS和1D-CNN联合的XRF土壤重金属超标分析方法研究[J].光谱学与光谱分析,2024,44(3):670-674.
2张恒,梁太波,宋效东,江鸿,郭文孟,戴华鑫,翟振,冯长春,张艳玲.基于高光谱成像的烟田土壤pH估测[J].西南农业学报,2023,36(12):2771-2779.
3艾璟,余金凤,王佳,王星星,王振中.基于QbD理念优化救必应药材的炮制工艺[J].中国中药杂志,2024,49(2):403-411.
4张美玲,陈勇杰,王敏娟,李民赞,郑立华.一个预测紫叶生菜花青素含量的高光谱深度学习模型[J].光谱学与光谱分析,2024,44(3):865-871.
5孙通,李翰林,孔令飞,范郑欣.光源光斑直径对苹果霉心病近红外检测的影响[J].农业工程学报,2023,39(24):298-305. 被引量：1

浙江大学学报（工学版）

2024年第1期

浏览历史

内容加载中请稍等...

混合采样下多级特征聚合的视频目标检测算法

参考文献5

二级参考文献18

共引文献15

相关作者

相关机构

相关主题

浏览历史