-
题名时空特征金字塔模块下的视频行为识别
被引量:4
- 1
-
-
作者
龚苏明
陈莹
-
机构
江南大学轻工过程先进控制教育部重点实验室
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第9期2061-2067,共7页
-
基金
国家自然科学基金(61573168)。
-
文摘
目前用于视频行为识别的主流2D卷积神经网络方法无法提取输入帧之间的相关信息,导致网络无法获得输入帧间的时空特征信息进而难以提升识别精度。针对目前主流方法存在的问题,提出了通用的时空特征金字塔模块(STFPM)。STFPM由特征金字塔和空洞卷积金字塔两部分组成,并能直接嵌入到现有的2D卷积神经网络中构成新的行为识别网络——时空特征金字塔网络(STFP-Net)。针对多帧图像输入,STFP-Net首先提取每帧输入的单独空域特征信息,并将这些特征信息记为原始特征;然后,所设计的STFPM利用矩阵转换操作对原始特征构建特征金字塔;其次,利用空洞卷积金字塔对构建的原始特征金字塔提取具有时空关联性的时序特征;接着,将原始特征与时序特征进行加权融合并传递给后续深层网络;最后,利用全连接对网络输出特征进行分类识别。与Baseline相比,STFP-Net引入了可忽略不计的额外参数和计算量。实验结果表明,与近些年主流方法相比,STFP-Net在主流数据库UCF101和HMDB51上的分类准确度具有明显提升。
-
关键词
行为识别
2D卷积网络
时空特征
特征金字塔
空洞卷积金字塔
-
Keywords
action recognition
2D convolution network
spatio-temporal features
feature pyramid
dilated convolution pyramid
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名改进通道注意力机制下的人体行为识别网络
被引量:13
- 2
-
-
作者
陈莹
龚苏明
-
机构
江南大学轻工过程先进控制教育部重点实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2021年第12期3538-3545,共8页
-
基金
国家自然科学基金(61573168)。
-
文摘
针对现有通道注意力机制对各通道信息直接全局平均池化而忽略其局部空间信息的问题,该文结合人体行为识别研究提出了两种改进通道注意力模块,即矩阵操作的时空(ST)交互模块和深度可分离卷积(DS)模块。ST模块通过卷积和维度转换操作提取各通道时空加权信息数列,经卷积得到各通道的注意权重;DS模块首先利用深度可分离卷积获取各通道局部空间信息,然后压缩通道尺寸使其具有全局的感受野,接着通过卷积操作得到各通道注意权重,进而完成通道注意力机制下的特征重标定。将改进后的注意力模块插入基础网络并在常见的人体行为识别数据集UCF101和HDBM51上进行实验分析,实现了准确率的提升。
-
关键词
行为识别
通道注意力
时空特征
深度可分离卷积
-
Keywords
Action recognition
Channel attention
Spatiotemporal feature
Depth-wise-Separable(DS)convolution
-
分类号
TN911.73
[电子电信—通信与信息系统]
TP391.4
[自动化与计算机技术—计算机应用技术]
-