-
题名基于深度学习的群体动作识别综述
- 1
-
-
作者
严锐
葛晓静
黄捧
舒祥波
唐金辉
-
机构
南京大学计算机软件新技术国家重点实验室
南京理工大学计算机科学与工程学院
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第11期2552-2578,共27页
-
基金
国家资助博士后研究人员计划(GZB20230302)
江苏省卓越博士后计划(2023ZB256)
+1 种基金
国家自然科学基金(62302208,61925204,62222207,62072245)
江苏省自然科学基金(BK20211520)资助。
-
文摘
不同于传统的简单动作识别,群体动作识别需要理解场景中由若干人物的单人动作和他们之间的交互动作构成的复杂语义.近年来,群体动作识别在公共安全监控、体育视频分析和社会角色理解等领域的研究与应用引起了学者们的广泛关注.但是现有能够帮助学者们快速了解研究概况的中文文献很少且用于归纳和分析的依据较为笼统.为此,本文旨在综述近十年来基于深度学习的群体动作识别的研究进展.首先,本文介绍了群体动作识别的问题与定义,总结了现有解决方案的核心流程和该研究的关键挑战.然后,本文针对现有研究中的两个核心内容,即个体动作特征的提取及其关联建模,对现有文献作出了归纳与分析.具体而言,本文介绍并总结了群体动作研究中常用的人体行为特征,并将现有关联建模类型归纳为三类,即线性关联、序列关联和图关联.此外,本文还列举了现有的十二种可用于群体动作研究的视频数据集,并在三个常用数据集上对目前流行的方法进行了对比与分析.最后,本文研判了几个更具挑战的未来研究趋势.综上,本文剖析了群体动作识别的核心研究思路及未来研究趋势,有助于相关研究人员快速了解群体动作识别的研究概况.
-
关键词
视频理解
动作识别
群体动作识别
深度学习
注意力机制
递归神经网络
图模型
-
Keywords
video understanding
action recognition
group activity recognition
deep learning
attention mechanism
recurrent neural network
graph model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种自适应遗传算法的聚类分析及应用
被引量:5
- 2
-
-
作者
舒祥波
-
机构
武汉科技大学信息科学与工程学院
-
出处
《信息技术》
2011年第4期190-192,196,共4页
-
文摘
针对传统的聚类算法在聚类划分问题上还存在着划分效果能力较差等问题,在确保GA算法全局性能和收敛速度的前提下,设计了一种与进化代数相关联的交叉概率和与个体适应度相关联的变异概率。将该算法应用到图像聚类,实验仿真结果表明,对比于k均值聚类算法,该算法具有较好的聚类划分效果。
-
关键词
遗传算法
聚类分析
交叉概率
变异概率
-
Keywords
genetic algorithm
clustering analysis
crossover probability
mutation probability
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于多模态多粒度图卷积网络的老年人日常行为识别
被引量:3
- 3
-
-
作者
丁静
舒祥波
黄捧
姚亚洲
宋砚
-
机构
南京理工大学计算机科学与工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2023年第5期2350-2364,共15页
-
基金
科技创新2030“新一代人工智能”重大项目课题(2018AAA0102001)
国家自然科学基金(62072245,61932020,62102182,61976116)。
-
文摘
随着人口老龄化问题日益严重,人们对家庭环境中老年人的安全问题越来越重视.目前,国内外一些研究机构正在试图研究通过家用摄像头对老年人的日常行为进行智能化看护,实现对一些危险行为的预警、报警与报备.为了助推这些技术的产业化,主要研究如何自动识别出老年人的日常行为,如“喝水”“洗手”“读书”“看报”等.通过对老年人的日常行为视频的调研发现,老年人的日常行为语义具有非常明显的细粒度特性,如“喝水”与“吃药”两种行为的语义高度相似,且只有少量的关键帧能准确体现出其类别语义.为了有效解决老年人行为识别问题,提出一种新的多模态多粒度图卷积网络(multimodal and multi-granularity graph convolutional networks,MM-GCN),通过利用图卷积网络分别从人体骨骼点(“点”)和人体骨架(“线”)、关键帧(“面”)和视频提名段(“段”)两种模态对老年人行为进行建模,捕捉“点-线-面-段”这4种颗粒度对象下的语义信息.最后,在目前最大规模的老年人日常行为数据集ETRI-Activity3D(11万+视频段、50+行为类别)上进行老年人行为识别性能评测,相比于当前最好的方法,提出的MM-GCN方法取得了最高的识别性能.此外,为了验证MM-GCN方法对常规人体行为识别任务的鲁棒性能,在业界标准的NTU RGB+D数据集上进行实验,MM-GCN方法也表现出了很不错的性能.
-
关键词
老年人行为识别
图卷积网络
多模态
多粒度
-
Keywords
elderly activity recognition
graph convolutional network(GCN)
multimodal
multi-granularity
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于类别注意实例归一化机制的人脸年龄合成
被引量:2
- 4
-
-
作者
舒祥波
施成龙
孙运莲
唐金辉
-
机构
南京理工大学计算机科学与工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2022年第7期2716-2728,共13页
-
基金
科技创新2030——“新一代人工智能”重大项目(2018AAA0102001)
国家自然科学基金(61732007,62072245,61702265,62076131)
-
文摘
近年来,生成对抗网络(generative adversarial network,GAN)家族已在人脸年龄合成任务上取得了巨大的成功.然而,通过研究发现,在解决人脸年龄合成的问题时,即使是善于利用年龄先验信息的条件生成对抗网络(conditional generative adversarial network,CGAN),重要的人脸年龄相关信息在一程度上也会被丢弃.这是导致以CGAN为代表的GAN家族在人脸年龄合成上的性能到达瓶颈期的一个重要因素.为此,提出了一种类别注意实例归一化机制(class-aware instance normalization,CAIN).该机制能够灵活地嵌入到CGAN中,形成一种新的生成对抗网络模型,即CAIN-GAN.CAIN-GAN能够充分利用人脸年龄先验信息来进一步提高人脸年龄合成性能.在公开数据集上的实验结果表明,与其他几种GAN家族的方法对比,CAIN-GAN方法仅通过利用人脸年龄相关信息就能对人脸年龄合成性能进行提升.
-
关键词
生成对抗网络
人脸年龄合成
归一化机制
-
Keywords
generation adversarial network
face age synthesis
normalization mechanism
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于全局-局部卷积神经网络的阻生牙分类
被引量:6
- 5
-
-
作者
杨鎏
舒祥波
-
机构
电子科技大学信息与软件工程学院
四川大学华西口腔医院
南京理工大学计算机科学与工程学院
-
出处
《计算机应用》
CSCD
北大核心
2019年第A01期250-253,共4页
-
文摘
为了解决因牙齿位于口腔的局部区域,且阻生牙与正常牙之间的视觉差异性非常微小导致的观察口腔CT图片可能出现的误判的问题,提出了一种新的全局局部卷积神经网络模型(GL-CNN)。首先从全局图像与局部区域分别学习口腔CT图像中能够带有阻生牙判别信息的特征描述,然后将这两种学习到的特征进行整合来训练一个支持向量机(SVM)分类器。为了验证GL-CNN的性能,在收集的口腔CT图像数据集上用提出的GL-CNN方法与基准方法进行阻生牙分类对比实验,实验结果表明了GL-CNN方法具有更高的分类精度。
-
关键词
阻生牙分类
卷积神经网络
图像分类
深度学习
支持向量机分类器
-
Keywords
impacted tooth classification
Convolutional Neural Network (CNN)
image classification
deep learning
Support Vector Machine (SVM) classifier
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名大数据:看不见的朋友
- 6
-
-
作者
唐金辉
舒祥波
李泽超
-
机构
南京理工大学计算机科学与工程学院
-
出处
《科教导刊(电子版)》
2018年第36期284-284,共1页
-
文摘
在日常生活中,当我们每天清晨起床,打开手机微博,会发现全是社会热点新闻;出门用滴滴打车,会看到整个城市交通实时的拥堵情况;一路上,依托于平安城市的联网监控保护着我们所有人的周身安全;中午吃饭打开美团,会找到全市最好吃的餐馆;放学回家休息打开抖音微视等视频分享APP,会推荐给我们感兴趣的小视频;假期出门旅行,我们通过人脸识别系统安全而快速地出境。大家不禁会问,是谁像知心的朋友在服务着我们与保护着我们?这一切背后的技术是什么呢?
-
关键词
大数据
经济发展互联网技术分析
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-