-
题名基于ResNeXt的人体动作识别
被引量:8
- 1
-
-
作者
蒋圣南
陈恩庆
郑铭耀
段建康
-
机构
郑州大学信息工程学院
-
出处
《图学学报》
CSCD
北大核心
2020年第2期277-282,共6页
-
基金
国家自然科学基金项目(U1804152,61806180)。
-
文摘
人体动作识别是计算机视觉领域的核心研究方向之一,在很多场合都有应用。深度卷积神经网络在静态图像识别方面已取得了巨大成功,并逐渐扩展到视频内容识别领域,但应用依然面临很大挑战。为此提出一种基于ResNeXt深度神经网络模型用于视频中的人体动作识别,主要包括:①使用新型ResNeXt网络结构代替原有的各种卷积神经网络结构,并使用RGB和光流2种模态的数据,使模型可充分地利用视频中动作外观及时序信息;②将端到端的视频时间分割策略应用于ResNeXt网络模型,同时将视频分为K段实现对视频序列的长范围时间结构进行建模,并通过测试得到最优视频分段值K,使模型能更好地区分存在子动作共享现象的相似动作,解决某些由于子动作相似而易发生的误判问题。通过在动作识别数据集UCF101和HMDB51上进行的测试表明,该模型和方法的动作识别准确率性能优于目前文献中的一些模型和方法的性能。
-
关键词
动作识别
ResNeXt
视频时间分割
数据增强
多模态
-
Keywords
action recognition
ResNeXt
video temporal segmentation
data enhancement
multimodal
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-