视频动作定位中密集特征金字塔主干网络被引量：1

Dense Feature Pyramid Backbone Network in Video Action Location

下载PDF

导出

摘要针对视频动作定位算法中金字塔层数增加时间分辨率降低,导致细节特征不完整,进而影响预测结果不准确的问题,提出密集连接型特征金字塔主干网络。视频图像输入特征金字塔主干网络中,密集连接金字塔提取帧级特征和层级特征,实现特征提取阶段参考层、基础层特征与深层特征联系;帧级特征和层级特征通过预测阶段、动作起止时间及标签信息;预测阶段输出融合光流信息输出、动作起止时间及标签预测结果。在THUMOS14数据集的检测结果与AFSD相比,平均精度均值(mAP)提高0.4%,准确定位动作在视频中的起止时间和类别,可应用于智能监控等场景。 The number of pyramid layers increases and the time resolution decreases in the video action location algorithm,resulting in incomplete detail features,which affects the accuracy of prediction results.Aiming at the problem,this paper proposes a densely connected feature pyramid backbone network.The video image is input into the backbone network of the feature pyramid,and the pyramid is densely connected to extract the frame level features and hierarchical features,so as to realize the connection between the reference layer,foundation layer features and deep features in the feature extraction stage.Frame level and hierarchical features output start and end time of actions and label information in the prediction stage,and the fused optical flow information and label prediction results are also output.On the THUMOS14 dataset,compared with AFSD,the mean average precision(mAP)is improved by 0.4%.It can accurately locate the start and end time and category of actions in the video,and can be applied to intelligent monitoring and other scenes.

作者佟明蔚毛琳杨大伟 TONG Ming-wei;MAO Lin;YANG Da-wei(School of Electromechanical Engineering,Dalian Minzu University,Dalian Liaoning 116605,China)

机构地区大连民族大学机电工程学院

出处《大连民族大学学报》 2022年第5期412-417,共6页 Journal of Dalian Minzu University

基金国家自然科学基金项目(61673084) 辽宁省自然科学基金项目(20170540192,20180550866,2020-MZLH-24)。

关键词时序动作定位密集连接特征金字塔特征融合 temporal action localization dense connection feature pyramid feature fusion

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1胡琼,秦磊,黄庆明.基于视觉的人体动作识别综述[J].计算机学报,2013,36(12):2512-2524. 被引量：123
2毛琳,李雪萌,杨大伟,张汝波.金字塔频率特征融合目标检测网络[J].计算机辅助设计与图形学学报,2021,33(2):207-214. 被引量：9

二级参考文献9

1Kishore K. Reddy,Mubarak Shah.Recognizing 50 human action categories of web videos[J].Machine Vision and Applications.2013(5)
2Chris Ellis,Syed Zain Masood,Marshall F. Tappen,Joseph J. LaViola,Rahul Sukthankar.Exploring the Trade-off Between Accuracy and Observational Latency in Action Recognition[J].International Journal of Computer Vision.2013(3)
3Rongrong Ji,Hongxun Yao,Xiaoshuai Sun.Actor-independent action search using spatiotemporal vocabulary with appearance hashing[J].Pattern Recognition.2010(3)
4Juan Carlos Niebles,Hongcheng Wang,Li Fei-Fei.Unsupervised Learning of Human Action Categories Using Spatial-Temporal Words[J].International Journal of Computer Vision.2008(3)
5Ivan Laptev.On Space-Time Interest Points[J].International Journal of Computer Vision (-).2005(2-3)
6黎洪松,李达.人体运动分析研究的若干新进展[J].模式识别与人工智能,2009,22(1):70-78. 被引量：38
7詹毅,李声杰,李梦.图像插值的自适应邻域滤波方法[J].计算机工程,2015,41(2):224-227. 被引量：3
8张冬明,靳国庆,代锋,袁庆升,包秀国,张勇东.基于深度融合的显著性目标检测算法[J].计算机学报,2019,42(9):2076-2086. 被引量：34
9张思宇,张轶.基于多尺度特征融合的小目标行人检测[J].计算机工程与科学,2019,41(9):1627-1634. 被引量：16

共引文献130

1钟媛媛,侯庭毅,郭胜福,刘增建.冰箱产线中的AI应用及综合性检测分析[J].家电科技,2022(S01):778-781.
2范银行,赵海峰,张少杰.基于3D卷积残差网络的人体动作识别算法[J].计算机应用研究,2020,37(S02):300-301. 被引量：4
3朱文和.基于高斯平滑的视频时序检测算法[J].大众标准化,2021(2):253-254.
4雷庆,李绍滋,陈锻生.一种结合姿态和场景的图像中人体行为分类方法[J].小型微型计算机系统,2015,36(5):1098-1103. 被引量：4
5周莉莉,姜枫.基于FAST和BRIEF的图像匹配算法[J].计算机工程与设计,2015,36(5):1269-1273. 被引量：21
6刘雨娇,范勇,高琳,酉霞.基于时空深度特征的人体行为识别算法[J].计算机工程,2015,41(5):259-263. 被引量：10
7刘琮,许维胜,吴启迪.时空域深度卷积神经网络及其在行为识别上的应用[J].计算机科学,2015,42(7):245-249. 被引量：24
8王刘涛,王建玺,鲁书喜.基于Adaboost关键帧选择的多尺度人体动作识别方法[J].重庆邮电大学学报（自然科学版）,2015,27(4):549-555. 被引量：5
9黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：390
10王茜,苏荔,黄庆明.融合视觉感知特性的视频编码率失真优化[J].计算机辅助设计与图形学学报,2015,27(10):1851-1858.

同被引文献1

1郑文堂,邓蓉,肖红波,田淑敏.我国生猪产业发展历程及未来发展趋势分析[J].现代化农业,2015(5):48-51. 被引量：4

引证文献1

1闫凯,高悦,戴百生,孙红敏,尹艳玲,沈维政.基于无锚时序动作定位的群养生猪争斗行为检测研究[J].智能化农业装备学报（中英文）,2023,4(1):17-25. 被引量：1

二级引证文献1

1杨亮,王辉,陈睿鹏,盛清凯,袁震,熊本海.猪专用传感器研究进展[J].智能化农业装备学报（中英文）,2023,4(2):22-34. 被引量：1

1王烁宇,崔庆森.基于YOLOv5s网络模型的口罩佩戴检测系统[J].信息记录材料,2022,23(8):94-96. 被引量：1
2刘欢,胡天天.需求理论视角下长期护理保险服务包体系研究[J].广西职业师范学院学报,2022,34(3):16-24.
3刘丽伟,侯德彪,侯阿临,梁超,郑贺伟.基于SimAM-YOLOv4的自动驾驶目标检测算法[J].长春工业大学学报,2022,43(3):244-250. 被引量：4
4吴俊峰,高龙,王超,徐从安,闫文君.基于多尺度3D-2D卷积神经网络的高光谱图像分类[J].海军航空大学学报,2022,37(5):361-367. 被引量：1
5尹宋麟,谭飞,周晴,鲜阳.基于改进YOLOv4模型的交通标志检测[J].无线电工程,2022,52(11):2087-2093. 被引量：9
6朱松豪,赵云斌,焦淼.融合空间相关性和局部特征转换器的遮挡行人重识别[J].南京邮电大学学报（自然科学版）,2022,42(5):62-73. 被引量：1
7马依琳,陶慧玲,董启文,王晔.基于Transformer的多特征融合的航空发动机剩余使用寿命预测[J].华东师范大学学报（自然科学版）,2022(5):219-232.
8朱新龙,崔国华,陈赛旋,杨琳.基于改进Mask R−CNN算法对堆叠汽车零件的实例分割方法[J].上海工程技术大学学报,2022,36(2):168-175. 被引量：2
9朱文博,夏林聪,陈龙,吴晨睿,陈红光.基于改进YOLOv5的O型密封圈缺陷检测方法[J].上海理工大学学报,2022,44(5):440-448. 被引量：2
10夏正洪,魏汝祥,屠佳,李彦冬.通航机场场面运动目标检测方法[J].科学技术与工程,2022,22(29):13114-13119.

大连民族大学学报

2022年第5期

浏览历史

内容加载中请稍等...

视频动作定位中密集特征金字塔主干网络被引量：1

参考文献2

二级参考文献9

共引文献130

同被引文献1

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

视频动作定位中密集特征金字塔主干网络 被引量：1

参考文献2

二级参考文献9

共引文献130

同被引文献1

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

视频动作定位中密集特征金字塔主干网络被引量：1