-
题名基于时空注意力金字塔卷积的动作识别
- 1
-
-
作者
冯雨威
吴丽君
-
机构
福州大学物理与信息工程学院
-
出处
《网络安全与数据治理》
2023年第2期76-82,88,共8页
-
文摘
动作识别算法需要从视频中提取空间和时域特征,对计算存储资源要求较高。基于2D CNN的网络更为轻量,但从视频中提取时域特征的能力较弱,动作识别性能通常受到限制。S-TPNet提出时空金字塔模块以获取图像序列的时间粒度特征,有效提升了基于2D CNN的动作识别网络的性能。基于S-TPNet,设计了时空注意力模型以凸显空间和时间上的重要特征。为降低输入数据量,通常抽取局部视频帧作为输入,为降低采样帧与整体视频之间的不稳定差异,设计了自适应等间隔采样策略。实验表明,在未预训练的情况下,本网络在UCF-101和HMDB-51数据集上分别将Top-1精度提高了5.1%和3.3%,并且不会大幅增加所需参数。
-
关键词
时空注意力
动作识别
自适应采样
2D
CNN
时空金字塔
-
Keywords
spatial-temporal attention
action recognition
adaptive sampling
2D CNN
spatial-temporal pyramid
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-