-
题名任务感知双原型网络的人物交互少样本识别
被引量:1
- 1
-
-
作者
安平
冀中
刘西瑶
-
机构
天津大学电气自动化与信息工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2021年第11期2184-2192,共9页
-
基金
国家自然科学基金(61771329,61632018)。
-
文摘
人物交互(HOI)识别是计算机视觉领域的重要研究热点。随着深度学习在图像分类任务中的巨大成功,人物交互识别任务也取得重大进展,但样本不平衡和组合爆炸问题仍是制约当前人物交互识别任务性能的关键挑战。由此,将人物交互识别任务与少样本学习相结合,将人物交互识别任务定义为一个少样本任务,并提出了任务感知双原型网络(TDP-Net)来解决少样本人物交互任务。具体地,首先使用图方法为每个任务生成语义感知的任务表示作为任务的先验信息,并使用语义图注意力模块(SGA-Module)生成注意力权重,对特征图中不同区域进行不同重要程度的关注,以适应不同任务条件下的映射关系,实现在新任务中自动推理。此外,还设计了一个双路原型模块(DP-Module)以分别产生交互类别的动作类原型和物体类原型,并分别对动词和名词进行分类。通过分别为动作和物体建立类原型,有效地分离了动作和物体间复杂的视觉关系。同时由于人物交互类别之间具有相似性,可通过重新组合动作和物体类别将知识迁移到新的交互类别中。实验结果表明,该模型在人物交互少样本任务上的平均准确率比基线方法在两个实验设置上分别提高了3.2个百分点和15.7个百分点,验证了TDP-Net在少样本人物交互任务中的有效性。
-
关键词
计算机视觉
图像分类
人物交互(hoi)
少样本学习(FSL)
注意力机制
-
Keywords
computer vision
image classification
human-object interaction(hoi)
few-shot learning(FSL)
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-