期刊文献+

基于自然语言查询的视觉目标跟踪方法综述

A review of visual object tracking by natural language specification
下载PDF
导出
摘要 基于自然语言查询的视觉目标跟踪方法是一个新兴的研究热点,旨在利用自然语言查询来锁定目标在视频帧中的位置。与需要手工标注矩形框的视觉目标跟踪方法不同,基于自然语言查询的视觉目标跟踪方法通过高级语义信息来指导跟踪器,旨在消除包含歧义性的手工标注矩形框,并将本地搜索与全局搜索有机地结合起来。因此,基于自然语言查询的视觉目标跟踪方法能够在实际场景中带来更灵活、稳健和准确的跟踪性能。综上所述,本文对基于自然语言查询的视觉目标跟踪方法进行综述,概述相关原理和模型改进的关键技术,总结不同网络结构的优缺点。 Visual object tracking by natural language specification is an emerging research hotspot,which aims to use natural language specification to locate the position of the target in video frames.Unlike visual object tracking methods that require manual annotation of rectangular boxes,visual object tracking method based on natural language query guides the tracker through advanced semantic information,aiming to eliminate ambiguous manual annotation of rectangular boxes and combine local search with global search.Therefore,tracking by natural language specification can bring more flexible,robust and accurate tracking performance in practical scenarios.In summary,this article reviews visual object tracking by natural language specification,outlines the key technologies of related principles and model improvements,and summarizes the advantages and disadvantages of different network structures.
作者 马丁 邬向前 MA Ding;WU Xiangqian(School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)
出处 《智能计算机与应用》 2024年第12期195-199,共5页 Intelligent Computer and Applications
基金 国家自然科学基金青年科学基金(20230197)。
关键词 自然语言查询 视觉目标跟踪 异质特征融合 natural language specification visual object tracking heterogeneous feature fusion
  • 引文网络
  • 相关文献
;
使用帮助 返回顶部