期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
结合双层路由感知和散射视觉变换的视觉-语言跟踪方法
1
作者
刘仲民
李振华
胡文瑾
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第11期4236-4246,共11页
针对视觉-语言关系建模中存在感受野有限和特征交互不充分问题,该文提出一种结合双层路由感知和散射视觉变换的视觉-语言跟踪框架(BPSVTrack)。首先,设计了一种双层路由感知模块(BRPM),通过将高效的加性注意力(EAA)与双动态自适应模块(D...
针对视觉-语言关系建模中存在感受野有限和特征交互不充分问题,该文提出一种结合双层路由感知和散射视觉变换的视觉-语言跟踪框架(BPSVTrack)。首先,设计了一种双层路由感知模块(BRPM),通过将高效的加性注意力(EAA)与双动态自适应模块(DDAM)并行结合起来进行双向交互来扩大感受野,使模型更加高效地整合不同窗口和尺寸之间的特征,从而提高模型在复杂场景中对目标的感知能力。其次,通过引入基于双树复小波变换(DTCWT)的散射视觉变换模块(SVTM),将图像分解为低频和高频信息,以此来捕获图像中目标结构和细粒度信息,从而提高模型在复杂环境下的鲁棒性和准确性。在OTB99,LaSOT,TNL2K 3个跟踪数据集上分别取得了86.1%,64.4%,63.2%的精度,在RefCOCOg数据集上取得了70.21%的准确率,在跟踪和定位方面的性能均优于基准模型。
展开更多
关键词
视觉-语言跟踪
双层路由感知
散射
视觉
变换
高效的加性注意力
双动态自适应
下载PDF
职称材料
题名
结合双层路由感知和散射视觉变换的视觉-语言跟踪方法
1
作者
刘仲民
李振华
胡文瑾
机构
兰州理工大学电气工程与信息工程学院
西北民族大学数学与计算机科学学院
甘肃省工业过程先进控制重点实验室
出处
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第11期4236-4246,共11页
基金
国家自然科学基金(62061042)
甘肃省自然科学基金(23JRRA796)
甘肃省工业过程先进控制重点实验室开发基金项目(2022KX10)。
文摘
针对视觉-语言关系建模中存在感受野有限和特征交互不充分问题,该文提出一种结合双层路由感知和散射视觉变换的视觉-语言跟踪框架(BPSVTrack)。首先,设计了一种双层路由感知模块(BRPM),通过将高效的加性注意力(EAA)与双动态自适应模块(DDAM)并行结合起来进行双向交互来扩大感受野,使模型更加高效地整合不同窗口和尺寸之间的特征,从而提高模型在复杂场景中对目标的感知能力。其次,通过引入基于双树复小波变换(DTCWT)的散射视觉变换模块(SVTM),将图像分解为低频和高频信息,以此来捕获图像中目标结构和细粒度信息,从而提高模型在复杂环境下的鲁棒性和准确性。在OTB99,LaSOT,TNL2K 3个跟踪数据集上分别取得了86.1%,64.4%,63.2%的精度,在RefCOCOg数据集上取得了70.21%的准确率,在跟踪和定位方面的性能均优于基准模型。
关键词
视觉-语言跟踪
双层路由感知
散射
视觉
变换
高效的加性注意力
双动态自适应
Keywords
Vision
-
Language Tracking(VLT)
Bi
-
level routing perception
Scattering vision transform
Efficient Additive Attention(EAA)
Dual dynamic adaptation
分类号
TN911.73 [电子电信—通信与信息系统]
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
结合双层路由感知和散射视觉变换的视觉-语言跟踪方法
刘仲民
李振华
胡文瑾
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部