期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于多模态RGB-T的显著性目标检测算法
1
作者 刘东 毕洪波 +2 位作者 任思琪 于鑫 张丛 《吉林大学学报(信息科学版)》 CAS 2024年第3期573-578,共6页
针对RGB(Red Green Blue)模态与热度模态信息表征形式不一致,特征信息无法有效挖掘、融合问题,提出了一种新的联合注意力强化网络-FCNet(Feature Sharpening and Cross-modal Feature Fusion Net)。首先,通过双维度注意力机制提升图像... 针对RGB(Red Green Blue)模态与热度模态信息表征形式不一致,特征信息无法有效挖掘、融合问题,提出了一种新的联合注意力强化网络-FCNet(Feature Sharpening and Cross-modal Feature Fusion Net)。首先,通过双维度注意力机制提升图像特征映射能力;然后,利用跨模态特征融合机制捕获目标区域;最后,利用逐层解码结构消除背景干扰,优化检测目标。实验结果表明,该优化改进算法运算参数更少、运算时间更短,且模型整体检测性能均优于现有多模态检测模型性能。 展开更多
关键词 多模态 RGB-热 特征锐化模块 跨模态融合机制
下载PDF
基于CNN特征的RGB-T目标跟踪算法
2
作者 刘莲 李福生 《计算机与数字工程》 2024年第2期432-435,共4页
针对单一图像源下目标跟踪鲁棒性差和跟踪精度低的问题,论文提出一种基于卷积神经网络(CNN)特征的RGB-T目标鲁棒性跟踪算法。首先,采用分层CNN特征对RGB图像和热红外图像进行编码。其次,基于SiamDW跟踪框架对目标进行跟踪。然后根据短... 针对单一图像源下目标跟踪鲁棒性差和跟踪精度低的问题,论文提出一种基于卷积神经网络(CNN)特征的RGB-T目标鲁棒性跟踪算法。首先,采用分层CNN特征对RGB图像和热红外图像进行编码。其次,基于SiamDW跟踪框架对目标进行跟踪。然后根据短时间内的跟踪结果对每个CNN特征的结果进行自适应融合并定位。最后,将RGB图像和热红外图像的结果进行融合并定位。实验表明,与现有的孪生跟踪算法相比,该算法在中心位置偏差和重叠率上表现更优,且在复杂情况下鲁棒性更好。 展开更多
关键词 目标跟踪 rgb-t 卷积神经网络 多特征自适应融合
下载PDF
基于深度学习的RGB-T目标跟踪技术综述 被引量:1
3
作者 张天路 张强 《模式识别与人工智能》 EI CSCD 北大核心 2023年第4期327-353,共27页
RGB-热红外(RGB-Thermal,RGB-T)模态目标跟踪旨在利用RGB和热红外数据的互补性实现目标的稳健跟踪.目前基于深度学习的RGB-T目标跟踪前沿成果较多,但缺少系统且全面的综述性文献.因此,文中首先阐述RGB-T目标跟踪面临的挑战,分析总结目... RGB-热红外(RGB-Thermal,RGB-T)模态目标跟踪旨在利用RGB和热红外数据的互补性实现目标的稳健跟踪.目前基于深度学习的RGB-T目标跟踪前沿成果较多,但缺少系统且全面的综述性文献.因此,文中首先阐述RGB-T目标跟踪面临的挑战,分析总结目前主流的基于深度学习的RGB-T目标跟踪算法.具体来说,根据采用的基线(Baseline)方法不同,将已有方法划分为基于多域网络(Multi-domain Network,MDNet)的目标跟踪算法,基于孪生网络(Siamese Network)的目标跟踪算法和基于判别式相关滤波(Discriminative Correlation Filter,DCF)的目标跟踪算法.然后,介绍RGB-T目标跟踪任务中常用的数据集和评价指标,并在常用数据集上对比已有算法.最后,指出RGB-T目标跟踪领域未来可能的发展方向. 展开更多
关键词 目标跟踪 RGB-热红外(rgb-t) 深度学习 多域网络 孪生网络 判别式相关滤波
下载PDF
基于RGB-T图像的双流残差扩张网络人群计数算法
4
作者 杨佩龙 陈树越 +1 位作者 杨尚瑜 王佳宏 《红外技术》 CSCD 北大核心 2023年第11期1177-1186,共10页
在人群计数中,针对尺度变化、行人分布不均以及夜间较差成像条件,提出了一种基于RGBT(RGB-Thermal)图像的多模态人群计数算法,称为双流残差扩张网络,它由前端特征提取网络、多尺度的残差扩张卷积模块和全局注意力模块所构成。其中,前端... 在人群计数中,针对尺度变化、行人分布不均以及夜间较差成像条件,提出了一种基于RGBT(RGB-Thermal)图像的多模态人群计数算法,称为双流残差扩张网络,它由前端特征提取网络、多尺度的残差扩张卷积模块和全局注意力模块所构成。其中,前端网络用来提取RGB特征和热特征,扩张卷积模块进一步提取不同尺度的行人特征信息,全局注意力模块用来建立全局特征之间的依赖关系。此外,还引入了一种新的多尺度差异性损失,以提高网络的计数性能。为评估该方法,在RGBT-CC(RGBT Crowd Counting)数据集和DroneRGBT数据集上进行了对比实验。实验结果表明,在RGBT-CC数据集上与CMCRL(Cross-modal Collaborative Representation Learning)算法相比该算法的GAME(0)(Grid Average Mean absolute Errors)和RMSE(Root Mean Squared Error)分别降低了0.8和3.49,在DroneRGBT数据集上与MMCCN(Multi-Modal Crowd Counting Network)算法比分别降低了0.34和0.17,表明具有较好的计数性能。 展开更多
关键词 人群计数 rgb-t图像 扩张卷积 全局注意力 多尺度差异性损失
下载PDF
融合深层差异特征的RGB-T巢式语义分割网络 被引量:2
5
作者 袁浩宾 赵涛 钟羽中 《计算机应用研究》 CSCD 北大核心 2022年第9期2850-2853,2860,共5页
针对现存可见光—红外(RGB-T)图像语义分割模型分割性能不高的问题,提出一种基于深层差异特征互补融合的巢式分割网络。具体来说,网络的编码和解码部分通过多级稠密中间路径相连形成一个嵌套形式的结构,编码器的深浅特征通过多级路径供... 针对现存可见光—红外(RGB-T)图像语义分割模型分割性能不高的问题,提出一种基于深层差异特征互补融合的巢式分割网络。具体来说,网络的编码和解码部分通过多级稠密中间路径相连形成一个嵌套形式的结构,编码器的深浅特征通过多级路径供解码器实现密集的多尺度特征复用,另一方面多模态深层特征通过特征差异性融合策略增强其语义表达能力。实验结果表明,所提网络在MFNet数据集上实现了65.8%的平均准确率和54.7%的平均交并比,与其他先进RGB-T分割模型相比,具有更优越的分割能力。 展开更多
关键词 rgb-t语义分割 巢式网络 特征复用 融合策略
下载PDF
基于跨模态特征增强的RGB-T行人检测算法研究 被引量:2
6
作者 王留洋 芮挺 +2 位作者 郑南 胡睿哲 蒋群艳 《兵器装备工程学报》 CSCD 北大核心 2022年第5期254-260,共7页
针对目标检测任务中目标受光照变化、遮挡等不利的影响,导致检准确率低、丢失率高的问题,提出了一种跨模态特征增强网络,用于RGB-T图像目标检测。构建双模态特征提取网络,用于可见光和热红外图像深度特征的提取;通过空间和通道注意力机... 针对目标检测任务中目标受光照变化、遮挡等不利的影响,导致检准确率低、丢失率高的问题,提出了一种跨模态特征增强网络,用于RGB-T图像目标检测。构建双模态特征提取网络,用于可见光和热红外图像深度特征的提取;通过空间和通道注意力机制对提取的双模态特征信息进行跨模态特征增强,提高2种模态特征信息的表征能力;对双模态特征进行像素信息融合,在特征层次上实现RGB-T图像的信息互补。在KAIST多谱行人检测数据集上的检测速度达到了47帧每秒(FPS),丢失率仅有5.17%。实验结果表明,跨模态特征增强算法能够有效融合可见光与红外特征,降低检测的丢失率。 展开更多
关键词 目标检测 rgb-t 注意力机制 跨模态 特征融合
下载PDF
热成像特征中期融合夜视密集人群计数
7
作者 任国印 吕晓琪 李宇豪 《应用光学》 CAS CSCD 北大核心 2022年第6期1088-1096,共9页
为了提高人群计数模型对尺度和光噪声的鲁棒性,设计了一种多模态图像融合网络。提出了一种针对夜间人群统计模型,并设计了一个子网络Rgb-T-net,网络融合了热成像特征和可见光图像的特征,增强了网络对热成像和夜间人群特征的判断能力。... 为了提高人群计数模型对尺度和光噪声的鲁棒性,设计了一种多模态图像融合网络。提出了一种针对夜间人群统计模型,并设计了一个子网络Rgb-T-net,网络融合了热成像特征和可见光图像的特征,增强了网络对热成像和夜间人群特征的判断能力。模型采用自适应高斯核对密度图进行回归,在Rgb-T-CC数据集上完成了夜视训练和测试。经验证网络平均绝对误差为18.16,均方误差为32.14,目标检测召回率为97.65%,计数性能和检测表现优于当前最先进的双峰融合方法。实验结果表明,所提出的多模态特征融合网络能够解决夜视环境下的计数与检测问题,消融实验进一步证明了融合模型各部分参数的有效性。 展开更多
关键词 夜视环境人群计数 RGB图像 热成像 rgb-t特征融合
下载PDF
Multi-modal visual tracking:Review and experimental comparison
8
作者 Pengyu Zhang Dong Wang Huchuan Lu 《Computational Visual Media》 SCIE EI CSCD 2024年第2期193-214,共22页
Visual object tracking has been drawing increasing attention in recent years,as a fundamental task in computer vision.To extend the range of tracking applications,researchers have been introducing information from mul... Visual object tracking has been drawing increasing attention in recent years,as a fundamental task in computer vision.To extend the range of tracking applications,researchers have been introducing information from multiple modalities to handle specific scenes,with promising research prospects for emerging methods and benchmarks.To provide a thorough review of multi-modal tracking,different aspects of multi-modal tracking algorithms are summarized under a unified taxonomy,with specific focus on visibledepth(RGB-D)and visible-thermal(RGB-T)tracking.Subsequently,a detailed description of the related benchmarks and challenges is provided.Extensive experiments were conducted to analyze the effectiveness of trackers on five datasets:PTB,VOT19-RGBD,GTOT,RGBT234,and VOT19-RGBT.Finally,various future directions,including model design and dataset construction,are discussed from different perspectives for further research. 展开更多
关键词 visual tracking object tracking multi-modal fusion rgb-t tracking RGB-D trackin
原文传递
多支路协同的RGB-T图像显著性目标检测 被引量:8
9
作者 蒋亭亭 刘昱 +1 位作者 马欣 孙景林 《中国图象图形学报》 CSCD 北大核心 2021年第10期2388-2399,共12页
目的显著性目标检测是机器视觉应用的基础,然而目前很多方法在显著性物体与背景相似、低光照等一些复杂场景得到的效果并不理想。为了提升显著性检测的性能,提出一种多支路协同的RGB-T(thermal)图像显著性目标检测方法。方法将模型主体... 目的显著性目标检测是机器视觉应用的基础,然而目前很多方法在显著性物体与背景相似、低光照等一些复杂场景得到的效果并不理想。为了提升显著性检测的性能,提出一种多支路协同的RGB-T(thermal)图像显著性目标检测方法。方法将模型主体设计为两条主干网络和三条解码支路。主干网络用于提取RGB图像和Thermal图像的特征表示,解码支路则分别对RGB特征、Thermal特征以及两者的融合特征以协同互补的方式预测图像中的显著性物体。在特征提取的主干网络中,通过特征增强模块实现多模图像的融合互补,同时采用适当修正的金字塔池化模块,从深层次特征中获取全局语义信息。在解码过程中,利用通道注意力机制进一步区分卷积神经网络(convolutional neural networks,CNN)生成的特征在不同通道之间对应的语义信息差异。结果在VT821和VT1000两个数据集上进行测试,本文方法的最大F-measure值分别为0.8437和0.8805,平均绝对误差(mean absolute error,MAE)值分别为0.0394和0.0322,相较于对比方法,提升了整体检测性能。结论通过对比实验表明,本文提出的方法提高了显著性检测的稳定性,在一些低光照场景取得了更好效果。 展开更多
关键词 rgb-t显著性目标检测 多模图像融合 多支路协同预测 通道注意力机制 金字塔池化模块(PPM)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部