期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Transformer的人物交互检测综述
1
作者 管尹凡 努尔古丽·艾子木把 王慧玲 《计算机科学与应用》 2024年第8期179-193,共15页
人物交互(HOI)检测旨在定位图像中的人和物体,并对它们之间的交互进行分类。实用的HOI检测系统执行以人为中心的场景理解,因此对许多应用具有巨大的潜在影响,如监视事件检测和机器人模仿学习。随着最近Transformer网络在目标检测方面的... 人物交互(HOI)检测旨在定位图像中的人和物体,并对它们之间的交互进行分类。实用的HOI检测系统执行以人为中心的场景理解,因此对许多应用具有巨大的潜在影响,如监视事件检测和机器人模仿学习。随着最近Transformer网络在目标检测方面的成功,基于Transformer的HOI检测方法已被积极开发,引领了近期HOI关系检测研究的进步。基于Transformer的HOI检测方法利用Transformer的自注意力机制来提取上下文语义信息和嵌入来表示HOI实例,成为HOI检测任务的新趋势。本文综述了现有方法的最新研究进展,并将其分为四类:早期端到端模型、利用DETR变体和改进骨干网络的模型、语言–图像预训练的模型以及基于DETR的两阶段模型。系统地阐述目前基于Transformer的HOI检测方法的发展现状,分析各种流派的优缺点,梳理该领域方法的发展脉络,最后对未来的研究方向进行展望。Human-Object Interaction (HOI) detection aims to localize humans and objects in an image and classify their interactions. Practical HOI detection systems enable human-centric scene understanding, thus holding significant potential impact on various applications such as surveillance event detection and robot imitation learning. With the recent success of Transformer networks in object detection, Transformer-based HOI detection methods have been actively developed, leading to advancements in recent research on HOI relation detection. Transformer-based HOI detection methods leverage the self-attention mechanism of Transformers to extract contextual semantic information and embeddings to represent HOI instances, becoming a new trend in HOI detection tasks. This paper reviews the latest research progress of existing methods, categorizing them into four types: early end-to-end models, models using variants of DETR and improved backbone networks, language-image pre-trained models, and two-stage models based on DETR. It systematically elaborates on the current development status of Transformer-based HOI detection methods, analyzes the advantages and disadvantages of various approaches, outlines the development trajectory of methods in this field, and finally provides prospects for future research directions. 展开更多
关键词 人物交互检测 TRANSFORMER 深度学习 目标检测
下载PDF
Conditional HOTR:基于Transformer的人物交互检测
2
作者 张诗凡 叶海波 《计算机技术与发展》 2023年第8期23-29,共7页
人物交互检测任务(HOI任务)旨在检测出图片中所有存在交互关系的人和物,最后得到<人,动作,物>这样形式的三元组。一般的方法包括两阶段和一阶段算法,最近一些工作提出的基于transformer的HOI检测方法使整个管道变得更加简单。对... 人物交互检测任务(HOI任务)旨在检测出图片中所有存在交互关系的人和物,最后得到<人,动作,物>这样形式的三元组。一般的方法包括两阶段和一阶段算法,最近一些工作提出的基于transformer的HOI检测方法使整个管道变得更加简单。对于已有的检测模型HOTR,旨在优化其内部transformer结构,使其更好地适应HOI检测任务。对于其中用于交互检测的交互解码器,根据其交互查询嵌入分别生成了人和物的参考点,并以此设计了交互点生成公式,然后利用交互点的信息设计了条件交互查询,将其作为位置嵌入与内容嵌入相加得到query,最后与key点乘进行注意力计算。这有助于transformer显式地定位与交互相关的区域,缩小搜索范围并缓解对内容嵌入的依赖。最终,在基准数据集V-COCO和HICO-DET上,mAP分别提升了2.13百分点和8.33百分点,并且精度在V-COCO数据集上达到了目前最优。 展开更多
关键词 人物交互检测 计算机视觉 TRANSFORMER 查询嵌入 交互
下载PDF
基于iCAN的加油站员工动作行为检测 被引量:1
3
作者 余雪源 《现代计算机》 2021年第4期78-82,共5页
为提升加油站的风险管控能力,在对加油站卸油口场景进行数据采集后,基于iCAN人物交互检测算法设计神经网络结构,将采集数据用于神经网络的权重训练,完成对加油站员工操作行为检测,同时结合AlphaPose产生的关键点信息,进一步提高人物交... 为提升加油站的风险管控能力,在对加油站卸油口场景进行数据采集后,基于iCAN人物交互检测算法设计神经网络结构,将采集数据用于神经网络的权重训练,完成对加油站员工操作行为检测,同时结合AlphaPose产生的关键点信息,进一步提高人物交互动作的检测精度。实验结果表明,使用基于深度学习的人物交互检测算法检测员工操作行为在泛化能力和准确性上都有极好表现,在减少人力成本的同时,为加油站风险管控提供一种智能化方法。 展开更多
关键词 人物交互检测 iCAN AlphaPose
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部