-
题名一致性对比采样网络的弱监督时序动作定位
- 1
-
-
作者
陶应诚
黎鑫
徐浩
王冠
景圣恩
-
机构
合肥工业大学计算机与信息学院
-
出处
《计算机科学与应用》
2024年第2期183-199,共17页
-
文摘
弱监督时序动作定位使用视频级标签,不需要高成本的动作实例标签,具有重要的研究价值。弱监督时序动作定位的难点在于,视频中的前景片段被淹没在背景片段中,难以得到精确的前景样本用于训练模型。关注于分析背景和前景片段在时间类激活序列上的差异,提出一致性对比采样网络。该网络使用多头注意力模块来增强行为特征。为了缓解前景样本被背景样本干扰的问题,该网络设计了易混淆样本的随机采样策略,用于学习前景采样的提议分布。为了促进前景分布的收敛,该网络联合考虑多阶段的前景采样规则,设计多阶段一致性采样模块。此外,针对前景和背景过渡区域的前景样本和背景样本较为相似,难以区分的问题,该网络设计对比采样模块,并联合考虑多阶段一致性采样,用于挖掘出困难前景样本,并使用对比学习优化困难前景样本的特征。在THUMOS 14和Activity v1.3数据集上进行实验验证。实验结果表明,提出的方法达到现有弱监督时序动作定位方法的性能。
-
关键词
时序动作定位
弱监督方法
一致性前景采样
对比采样
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名由粗到精的高保真单目三维人脸重建
- 2
-
-
作者
景圣恩
高添
陶应诚
彭梦昊
侍亚东
王冠
-
机构
合肥工业大学计算机与信息学院
-
出处
《计算机科学与应用》
2024年第4期255-267,共13页
-
文摘
针对现有单目三维人脸重建方法在细节刻画和身份信息保持方面的不足,本文提出了一种由粗到精的三维人脸重建框架。该框架首先利用从二维人脸图片中提取的特征参数生成初始三维人脸模型,并设计多尺度身份特征提取器捕获个性化特征。然后,通过自适应加权策略筛选对重建任务最具贡献的特征信息。在精细重建阶段,本文关注人脸的几何细节重建,将身份和表情编码融入几何细节生成网络中,以生成具有特定身份和表情信息的几何细节。最后,利用可微分渲染器将三维人脸模型渲染为二维人脸图像,进行自监督训练。在CelebA和AFLW2000-3D数据集上的实验结果表明,本文提出的框架能够从单幅图像中重建出更加真实、自然且具有高度个性化特征的三维人脸模型,在细节刻画和身份信息保持方面均优于现有方法,具有广阔的应用前景。
-
关键词
三维人脸重建
三维形变模型
自监督学习
人脸渲染
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于时空采样的视频行为识别
- 3
-
-
作者
王冠
彭梦昊
陶应诚
徐浩
景圣恩
-
机构
合肥工业大学计算机与信息学院
-
出处
《人工智能与机器人研究》
2024年第2期300-312,共13页
-
文摘
视频特征包含了行为执行时的时间、空间冗余信息。该信息和行为类别无关,会干扰行为识别,造成行为类别的错误判断。本文提出了一种基于时空采样的视频行为识别模型。模型包括关键帧采样和Token采样的视频Transformer。关键帧采样过程,通过量化相邻帧间的像素差异,识别出包含显著变化的关键帧,累积多个连续帧的更新概率处理两个关键帧间的可能存在的长时间间隔,引入一个可训练的采样概率阈值从而将更新概率二值化,增强对于关键帧的建模能力。因此该过程保证了视频关键信息的获取。本文认为不同的Token对识别任务的重要性会有所不同,因此在时空Transformer块中,本文采用一种数据依赖的Token采样策略,通过分层减少Token的数量有效降低空间冗余信息,同时也减少了模型计算量。最终通过全连接层完成视频行为识别。实验在ActivityNet-v1.3、Mini-Kinetics数据集上进行验证。实验表明,本文基于时空采样的视频行为识别方法,具有较小计算量的同时,能够达到现有行为识别方法的准确率。
-
关键词
视频行为识别
时空采样
视频Transformer
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-