-
题名基于深度学习的群体动作识别综述
- 1
-
-
作者
严锐
葛晓静
黄捧
舒祥波
唐金辉
-
机构
南京大学计算机软件新技术国家重点实验室
南京理工大学计算机科学与工程学院
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第11期2552-2578,共27页
-
基金
国家资助博士后研究人员计划(GZB20230302)
江苏省卓越博士后计划(2023ZB256)
+1 种基金
国家自然科学基金(62302208,61925204,62222207,62072245)
江苏省自然科学基金(BK20211520)资助。
-
文摘
不同于传统的简单动作识别,群体动作识别需要理解场景中由若干人物的单人动作和他们之间的交互动作构成的复杂语义.近年来,群体动作识别在公共安全监控、体育视频分析和社会角色理解等领域的研究与应用引起了学者们的广泛关注.但是现有能够帮助学者们快速了解研究概况的中文文献很少且用于归纳和分析的依据较为笼统.为此,本文旨在综述近十年来基于深度学习的群体动作识别的研究进展.首先,本文介绍了群体动作识别的问题与定义,总结了现有解决方案的核心流程和该研究的关键挑战.然后,本文针对现有研究中的两个核心内容,即个体动作特征的提取及其关联建模,对现有文献作出了归纳与分析.具体而言,本文介绍并总结了群体动作研究中常用的人体行为特征,并将现有关联建模类型归纳为三类,即线性关联、序列关联和图关联.此外,本文还列举了现有的十二种可用于群体动作研究的视频数据集,并在三个常用数据集上对目前流行的方法进行了对比与分析.最后,本文研判了几个更具挑战的未来研究趋势.综上,本文剖析了群体动作识别的核心研究思路及未来研究趋势,有助于相关研究人员快速了解群体动作识别的研究概况.
-
关键词
视频理解
动作识别
群体动作识别
深度学习
注意力机制
递归神经网络
图模型
-
Keywords
video understanding
action recognition
group activity recognition
deep learning
attention mechanism
recurrent neural network
graph model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多模态多粒度图卷积网络的老年人日常行为识别
被引量:3
- 2
-
-
作者
丁静
舒祥波
黄捧
姚亚洲
宋砚
-
机构
南京理工大学计算机科学与工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2023年第5期2350-2364,共15页
-
基金
科技创新2030“新一代人工智能”重大项目课题(2018AAA0102001)
国家自然科学基金(62072245,61932020,62102182,61976116)。
-
文摘
随着人口老龄化问题日益严重,人们对家庭环境中老年人的安全问题越来越重视.目前,国内外一些研究机构正在试图研究通过家用摄像头对老年人的日常行为进行智能化看护,实现对一些危险行为的预警、报警与报备.为了助推这些技术的产业化,主要研究如何自动识别出老年人的日常行为,如“喝水”“洗手”“读书”“看报”等.通过对老年人的日常行为视频的调研发现,老年人的日常行为语义具有非常明显的细粒度特性,如“喝水”与“吃药”两种行为的语义高度相似,且只有少量的关键帧能准确体现出其类别语义.为了有效解决老年人行为识别问题,提出一种新的多模态多粒度图卷积网络(multimodal and multi-granularity graph convolutional networks,MM-GCN),通过利用图卷积网络分别从人体骨骼点(“点”)和人体骨架(“线”)、关键帧(“面”)和视频提名段(“段”)两种模态对老年人行为进行建模,捕捉“点-线-面-段”这4种颗粒度对象下的语义信息.最后,在目前最大规模的老年人日常行为数据集ETRI-Activity3D(11万+视频段、50+行为类别)上进行老年人行为识别性能评测,相比于当前最好的方法,提出的MM-GCN方法取得了最高的识别性能.此外,为了验证MM-GCN方法对常规人体行为识别任务的鲁棒性能,在业界标准的NTU RGB+D数据集上进行实验,MM-GCN方法也表现出了很不错的性能.
-
关键词
老年人行为识别
图卷积网络
多模态
多粒度
-
Keywords
elderly activity recognition
graph convolutional network(GCN)
multimodal
multi-granularity
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名《傲慢与偏见》中的If句的考察
- 3
-
-
作者
黄捧
-
机构
西安电子科技大学外国语学院
-
出处
《艺术品鉴》
2015年第8期342-342,共1页
-
文摘
If句是一个有原型和非原型组成的原型范畴。本文利用语料库语言学的手法,对《傲慢与偏见》if句进行全数统计、分类和分析。结果显示:必要条件为if句的原型用法,其它用法为if句的非原型用法,各类用法间的界限是模糊的,存在家族相似性。
-
关键词
《傲慢与偏见》
if句
语料库语言学
原型理论
-
分类号
H314
[语言文字—英语]
-