-
题名基于深度学习的群体动作识别综述
- 1
-
-
作者
严锐
葛晓静
黄捧
舒祥波
唐金辉
-
机构
南京大学计算机软件新技术国家重点实验室
南京理工大学计算机科学与工程学院
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第11期2552-2578,共27页
-
基金
国家资助博士后研究人员计划(GZB20230302)
江苏省卓越博士后计划(2023ZB256)
+1 种基金
国家自然科学基金(62302208,61925204,62222207,62072245)
江苏省自然科学基金(BK20211520)资助。
-
文摘
不同于传统的简单动作识别,群体动作识别需要理解场景中由若干人物的单人动作和他们之间的交互动作构成的复杂语义.近年来,群体动作识别在公共安全监控、体育视频分析和社会角色理解等领域的研究与应用引起了学者们的广泛关注.但是现有能够帮助学者们快速了解研究概况的中文文献很少且用于归纳和分析的依据较为笼统.为此,本文旨在综述近十年来基于深度学习的群体动作识别的研究进展.首先,本文介绍了群体动作识别的问题与定义,总结了现有解决方案的核心流程和该研究的关键挑战.然后,本文针对现有研究中的两个核心内容,即个体动作特征的提取及其关联建模,对现有文献作出了归纳与分析.具体而言,本文介绍并总结了群体动作研究中常用的人体行为特征,并将现有关联建模类型归纳为三类,即线性关联、序列关联和图关联.此外,本文还列举了现有的十二种可用于群体动作研究的视频数据集,并在三个常用数据集上对目前流行的方法进行了对比与分析.最后,本文研判了几个更具挑战的未来研究趋势.综上,本文剖析了群体动作识别的核心研究思路及未来研究趋势,有助于相关研究人员快速了解群体动作识别的研究概况.
-
关键词
视频理解
动作识别
群体动作识别
深度学习
注意力机制
递归神经网络
图模型
-
Keywords
video understanding
action recognition
group activity recognition
deep learning
attention mechanism
recurrent neural network
graph model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-