-
题名视频识别深度学习网络综述
被引量:6
- 1
-
-
作者
钱文祥
衣杨
-
机构
中山大学计算机学院
广州新华学院信息科学学院
广东省大数据分析与处理重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2022年第S02期341-350,共10页
-
基金
广州市科技计划项目(202002030273,202102080656)
广州新华学院重点学科项目(2020XZD02)
-
文摘
视频识别是计算机视觉领域中最重要的任务之一,受到了研究者的广泛关注。视频识别指从视频片段中提取特征,并依据特征识别视频动作。相比于静态图片,视频的各帧间存在较大的关联性。如何高效地使用来自时空等不同维度的特征信息准确地识别视频,是当前研究的重点。以视频识别技术为研究对象,首先介绍了视频识别研究的背景信息及常用数据集。然后,详细地梳理了视频识别方法的演变过程;回顾了基于时空兴趣点、密集轨迹、改进的密集轨迹等传统的视频识别方法,以及近年来提出的可用于视频识别的深度学习网络框架。其中,分别介绍了基于2D卷积神经网络的视频识别框架、基于3D卷积神经网络的视频框架、伪3D卷积神经网络,以及基于Transformer结构的网络,介绍了这些框架的演变,并总结了它们的实现细节及特点;评测了各网络在不同视频识别数据集上的表现情况,分析了各网络的适用场景。最后,展望了视频识别网络框架未来的研究趋势。视频识别任务可以自动、高效地识别出视频所属的类别,基于深度学习的视频识别具有广泛的实用价值。
-
关键词
视频识别
改进的密集轨迹
深度学习
双流网络
卷积神经网络
深度自注意力网络
-
Keywords
Video recognition
Improved dense trajectory
Deep learning
Two-stream network
Convolutional neural network
Deep self-attention network
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-