期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
CMMCAN:Lightweight Feature Extraction and Matching Network for Endoscopic Images Based on Adaptive Attention
1
作者 Nannan Chong Fan Yang 《Computers, Materials & Continua》 SCIE EI 2024年第8期2761-2783,共23页
In minimally invasive surgery,endoscopes or laparoscopes equipped with miniature cameras and tools are used to enter the human body for therapeutic purposes through small incisions or natural cavities.However,in clini... In minimally invasive surgery,endoscopes or laparoscopes equipped with miniature cameras and tools are used to enter the human body for therapeutic purposes through small incisions or natural cavities.However,in clinical operating environments,endoscopic images often suffer from challenges such as low texture,uneven illumination,and non-rigid structures,which affect feature observation and extraction.This can severely impact surgical navigation or clinical diagnosis due to missing feature points in endoscopic images,leading to treatment and postoperative recovery issues for patients.To address these challenges,this paper introduces,for the first time,a Cross-Channel Multi-Modal Adaptive Spatial Feature Fusion(ASFF)module based on the lightweight architecture of EfficientViT.Additionally,a novel lightweight feature extraction and matching network based on attention mechanism is proposed.This network dynamically adjusts attention weights for cross-modal information from grayscale images and optical flow images through a dual-branch Siamese network.It extracts static and dynamic information features ranging from low-level to high-level,and from local to global,ensuring robust feature extraction across different widths,noise levels,and blur scenarios.Global and local matching are performed through a multi-level cascaded attention mechanism,with cross-channel attention introduced to simultaneously extract low-level and high-level features.Extensive ablation experiments and comparative studies are conducted on the HyperKvasir,EAD,M2caiSeg,CVC-ClinicDB,and UCL synthetic datasets.Experimental results demonstrate that the proposed network improves upon the baseline EfficientViT-B3 model by 75.4%in accuracy(Acc),while also enhancing runtime performance and storage efficiency.When compared with the complex DenseDescriptor feature extraction network,the difference in Acc is less than 7.22%,and IoU calculation results on specific datasets outperform complex dense models.Furthermore,this method increases the F1 score by 33.2%and accelerates runtime by 70.2%.It is noteworthy that the speed of CMMCAN surpasses that of comparative lightweight models,with feature extraction and matching performance comparable to existing complex models but with faster speed and higher cost-effectiveness. 展开更多
关键词 feature extraction and matching lightweighted network medical images ENDOSCOPIC attention
下载PDF
基于注意力与密集重参数化的目标检测算法
2
作者 陈志旺 雷春明 +2 位作者 吕昌昊 王婷 彭勇 《高技术通讯》 CAS 北大核心 2024年第3期233-247,共15页
针对目标检测任务中背景复杂、目标尺寸差异大等因素导致目标检测结果较差的问题,本文提出基于注意力和密集重参数化的目标检测算法。首先,基于CSP-DarkNet提出高效的特征提取网络,主要包括密集重参数化模块和CASA模块2个设计。前者利... 针对目标检测任务中背景复杂、目标尺寸差异大等因素导致目标检测结果较差的问题,本文提出基于注意力和密集重参数化的目标检测算法。首先,基于CSP-DarkNet提出高效的特征提取网络,主要包括密集重参数化模块和CASA模块2个设计。前者利用密集连接保留浅层特征,又通过重参数化结构降低网络复杂度;后者CASA模块用于获取需要的目标信息。其次,特征融合在特征金字塔(FPN)和路径聚合网络(PAN)的基础上,引入内容感知特征重组(CARAFE)进行上采样,有效解决了邻近插值法等未能捕捉丰富语义信息的问题;提出更高效的C3-G模块,获取丰富的梯度信息,增强模型表达能力和感知能力;同时,引入深度可分离卷积提升运算效率。最后,检测输出采用在更大范围上跨领域正负样本匹配策略扩充正样本数量,提升检测效果。该算法在MS COCO和PASCAL VOC数据集上的mAP@0.5分别达到了57.5%和83.0%,充分说明了本文算法的先进性。 展开更多
关键词 目标检测 重参数化 注意力机制 特征融合 上采样 正负样本匹配
下载PDF
融合梯度先验与全局聚合的立体匹配算法
3
作者 陶洋 欧双江 +1 位作者 唐函 周婉怡 《小型微型计算机系统》 CSCD 北大核心 2024年第4期865-872,共8页
现有基于学习的立体匹配算法具有一定局限性,通常特征提取部分使用的常规卷积倾向于捕捉外观信息,忽略了结构信息的提取,并且由于卷积感受野的限制,这些算法在弱纹理、重复纹理等病态区域性能较差.为此本文提出了一种融合梯度信息及全... 现有基于学习的立体匹配算法具有一定局限性,通常特征提取部分使用的常规卷积倾向于捕捉外观信息,忽略了结构信息的提取,并且由于卷积感受野的限制,这些算法在弱纹理、重复纹理等病态区域性能较差.为此本文提出了一种融合梯度信息及全局代价聚合的立体匹配网络模型(GFGANet).首先,设计了差分卷积残差组(CDC-ResBlock-Groups),显式编码结构信息提高特征表达,然后设计全局代价聚合模块(Trans-Hourglass),有效聚合代价体并捕获全局上下文,最后采用加窗视差回归降低了视差标签不平衡的影响,此外使用StereoDRNet的后处理进行视差细化.实验表明,所提方法在重复纹理,弱纹理区域表现优异,在SceneFlow中的端点误差(EPE)仅为0.645px,KITTI 2015上的误匹配率为2.04%,与基础模型PSMNet相比,性能显著提升. 展开更多
关键词 深度学习 立体匹配 特征融合 注意力机制
下载PDF
基于教师-学生模型的点云目标检测算法
4
作者 文峰 石明泽 +1 位作者 刘思萌 殷向阳 《沈阳理工大学学报》 CAS 2024年第5期49-56,共8页
针对现有点云目标检测算法对室外自动驾驶场景中遮挡物体检测精度低的问题,提出一种基于知识蒸馏和注意力增强的点云目标检测算法。以CIA-SSD模型为基础,设计了一种基于教师-学生模型的密集特征生成模块,提出基于交并比匹配策略的密集... 针对现有点云目标检测算法对室外自动驾驶场景中遮挡物体检测精度低的问题,提出一种基于知识蒸馏和注意力增强的点云目标检测算法。以CIA-SSD模型为基础,设计了一种基于教师-学生模型的密集特征生成模块,提出基于交并比匹配策略的密集数据生成方法,将稀疏特征转换为密集特征。密集特征生成模块位于学生模型中,学生模型在教师模型生成的软目标监督训练下,推断出完整的密集目标特征,实现目标特征的补全;在教师模型中设计空间注意力和通道注意力机制,增强密集目标点云,提升特征图的质量。在KITTI数据集上的验证实验结果表明:与SE-SSD模型和CIA-SSD模型相比,本文提出的算法保持了单阶段目标检测速度的优势,同时明显提升了检测精度。 展开更多
关键词 点云目标检测 CIA-SSD 教师-学生模型 密集特征模块 注意力机制 交并比匹配策略
下载PDF
基于特征增强和语义相关性匹配的图像文本检索方法 被引量:1
5
作者 陈佳 张鸿 《计算机应用》 CSCD 北大核心 2024年第1期16-23,共8页
为实现图像文本检索中图像与文本的精确语义连接,提出一种基于特征增强和语义相关性匹配(FESCM)的图像文本检索方法。首先,通过特征增强表示模块,引入多头自注意力机制增强图像区域特征和文本单词特征,以减少冗余信息对图像区域和文本... 为实现图像文本检索中图像与文本的精确语义连接,提出一种基于特征增强和语义相关性匹配(FESCM)的图像文本检索方法。首先,通过特征增强表示模块,引入多头自注意力机制增强图像区域特征和文本单词特征,以减少冗余信息对图像区域和文本单词对齐的干扰;其次,通过语义相关性匹配模块,不仅利用局部匹配捕获局部显著对象之间的对应相关性,还把图像背景信息融入图像全局特征,利用全局匹配实现精确的全局语义相关性;最后,通过局部匹配分数和全局匹配分数获取图像和文本的最终匹配分数。实验结果表明,基于FESCM的图像文本检索方法在Flickr8k和Flickr30k基准数据集上的召回率总值比扩展的视觉语义嵌入方法分别提升了5.7和7.5个百分点,在MS-COCO数据集比双流层次相似度推理方法提升了3.7个百分点。因此该方法可以有效提高图像文本检索的准确度,实现图像与文本的语义连接。 展开更多
关键词 图像文本检索 特征增强表示 多头自注意力机制 语义相关性匹配
下载PDF
具有跨尺度Transformer的高效多视图立体网络
6
作者 王思成 江浩 陈晓 《计算机工程》 CAS CSCD 北大核心 2024年第11期266-275,共10页
现有深度多视图立体(MVS)方法将Transformer引入级联网络,以实现高分辨率深度估计,从而实现高精确度和完整度的三维重建结果。然而,基于Transformer的方法受计算成本的限制,无法扩展到更精细的阶段。为此,提出一种新颖的跨尺度Transfor... 现有深度多视图立体(MVS)方法将Transformer引入级联网络,以实现高分辨率深度估计,从而实现高精确度和完整度的三维重建结果。然而,基于Transformer的方法受计算成本的限制,无法扩展到更精细的阶段。为此,提出一种新颖的跨尺度Transformer的MVS网络,在不增加额外计算的情况下处理不同阶段的特征表示。引入一种自适应匹配感知Transformer(AMT),在多个尺度上使用不同的交互式注意力组合。这种组合策略使所提网络能够捕捉图像内部的上下文信息,并增强图像之间的特征关系。此外,设计双特征引导聚合(DFGA),将粗糙的全局语义信息嵌入到更精细的代价体构建中,以进一步增强全局和局部特征的感知。同时,通过设计一种特征度量损失,用于评估变换前后的特征偏差,以减少特征错误匹配对深度估计的影响。实验结果表明,在DTU数据集中,所提网络的完整度和整体度量达到0.264、0.302,在Tanks and temples 2个大场景的重建平均值分别达到64.28、38.03。 展开更多
关键词 多视图立体 特征匹配 Transformer网络 注意力机制 三维重建
下载PDF
跨尺度点匹配结合多尺度特征融合的图像配准
7
作者 欧卓林 吕晓琪 谷宇 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1090-1102,共13页
图像配准在脑部疾病的计算机辅助诊疗和远程手术等方面具有重要作用。U-Net及其变体网络广泛应用于医学图像配准领域,在配准精确度和配准时间上取得了较好效果。然而,现有的配准模型在处理复杂图像形变时,难以学习到图像中微小结构的边... 图像配准在脑部疾病的计算机辅助诊疗和远程手术等方面具有重要作用。U-Net及其变体网络广泛应用于医学图像配准领域,在配准精确度和配准时间上取得了较好效果。然而,现有的配准模型在处理复杂图像形变时,难以学习到图像中微小结构的边缘特征,且忽视了不同尺度上下文信息的关联。针对上述问题,本文提出了一种基于跨尺度点匹配结合多尺度特征融合的配准模型。首先,在模型的编码结构中引入跨尺度点匹配模块,增强对图像突出区域特征的表达以及对微小结构边缘细节特征的把握;然后,在解码结构中对多尺度特征进行融合,形成更全面的特征描述;最后,在多尺度特征融合模块中融入注意力模块,突出空间和通道的信息。在3个脑部核磁共振(Magnetic Resonance,MR)数据集上的实验结果表明,以OASIS-3数据集为例,本文方法的配准精确度相较于Affine、SyN、VoxelMorph以及CycleMorph等方法,本文方法分别提升了23.5%、12.4%、0.9%和2.1%;ASD值相较于各方法分别降低了1.074、0.434、0.043和0.076。本文提出的模型能更好地把握图像的特征信息,提升配准的精确度,对医学图像配准的发展具有重要意义。 展开更多
关键词 医学图像配准 编码器-解码器结构 特征加权 特征匹配 注意力机制
下载PDF
基于GAANET的立体匹配算法
8
作者 宋昊 毛宽民 朱洲 《计算机科学》 CSCD 北大核心 2024年第4期229-235,共7页
端到端的立体匹配算法在计算时间和匹配效果上均有一定的优势,近年来在立体匹配任务中得到了广泛的应用。但特征提取的过程中存在特征冗余、信息丢失,以及多尺度特征融合不充分等问题,造成算法的计算量和复杂度偏高,也影响了匹配的精度... 端到端的立体匹配算法在计算时间和匹配效果上均有一定的优势,近年来在立体匹配任务中得到了广泛的应用。但特征提取的过程中存在特征冗余、信息丢失,以及多尺度特征融合不充分等问题,造成算法的计算量和复杂度偏高,也影响了匹配的精度。针对上述问题,在自适应聚合网络AANET的基础上,设计了更加适合立体匹配的特征提取模块,提出了改进的幽灵自适应聚合网络GAANET。采用G-Ghost阶段提取多尺度的特征,通过廉价操作生成部分特征,减少特征的冗余现象并有效保存浅层特征;采取高效的通道注意力机制,将不同的权重分配到每个通道中;采取改进的特征金字塔结构,缓解传统金字塔中的通道信息丢失并优化融合特征,为各个尺度的特征进行丰富的信息补充。在SceneFlow,KITTI2015和KITTI2012数据集上进行训练和评估,评估结果显示,与基础方法相比,所提改进算法的精度分别提升了0.92%,0.25%和0.20%,且参数量减少了13.75%,计算量减少了4.8%。 展开更多
关键词 立体匹配 特征提取 端到端立体匹配网络 注意力模块 深度学习
下载PDF
基于特征注意匹配CYCLEGAN的高速列车轮对轴承数据均衡化方法
9
作者 刘素艳 汪浩宁 +1 位作者 马增强 苑宗昊 《振动与冲击》 EI CSCD 北大核心 2024年第15期32-43,共12页
高速列车滚动轴承一旦发生故障就会停车检修,导致样本数据极度不平衡。数据集的不平衡性会对故障诊断结果的准确性和稳定性产生重要影响。针对该问题,提出一种基于特征注意匹配(feature attention matching, FAM)和循环生成对抗网络(cyc... 高速列车滚动轴承一旦发生故障就会停车检修,导致样本数据极度不平衡。数据集的不平衡性会对故障诊断结果的准确性和稳定性产生重要影响。针对该问题,提出一种基于特征注意匹配(feature attention matching, FAM)和循环生成对抗网络(cycle-consistent generative adversarial networks, CYCLEGAN)的轴承不平衡数据处理CYCLEGAN-FAM方法,该方法在CYCLEGAN的判别器中加入特征注意匹配模块,对从真实图像和生成图像中提取的特征进行对齐,从而提高生成样本的质量。试验表明,该方法能够生成与真实样本高度相似的生成样本,并随着不平衡数据集被逐渐平衡,故障诊断的准确率在凯斯西储大学4类和10类数据集上分别达到了99.8%和99.2%,在QPZZ-II四类和十类数据集上分别达到了99.4%和99.6%。 展开更多
关键词 生成对抗网络 特征注意力匹配(fam) 不均衡数据集 故障诊断
下载PDF
融合渐进式策略的轻量化特征点提取与匹配方法
10
作者 杨潞霞 任佳乐 +3 位作者 张红瑞 韩睿 崔耀文 马永杰 《液晶与显示》 CAS CSCD 北大核心 2024年第11期1544-1556,共13页
针对基于SuperPoint网络的特征匹配方法在光照、姿态、角度等挑战下,特征点提取准确率低、计算参数量大的问题,提出了一种融合渐进式策略的轻量化特征点提取与匹配方法。首先,利用深度可分离卷积对SuperPoint网络进行结构调整,以降低模... 针对基于SuperPoint网络的特征匹配方法在光照、姿态、角度等挑战下,特征点提取准确率低、计算参数量大的问题,提出了一种融合渐进式策略的轻量化特征点提取与匹配方法。首先,利用深度可分离卷积对SuperPoint网络进行结构调整,以降低模型参数计算量;其次,在特征提取部分搭建注意力模块增强网络在空间上的特征提取能力,并设计渐进式多尺度特征融合模块捕获目标细节,增强特征的表达能力;最后,利用SuperGlue算法对所得到的特征点进行匹配。在Hpatches数据集上进行实验分析,实验结果表明,所提算法在光照变换场景下匹配平均准确率(mAP)和特征点重复度(Rep)达到了86%和70%,在视角变换场景下mAP和Rep达到了78%和68%。所提算法不仅在特征匹配中表现出一定的优势,同时将其应用于视频拼接中也获得了较好的效果。 展开更多
关键词 特征点提取 特征点匹配 轻量化 注意力机制 渐进式多尺度特征融合
下载PDF
结合多尺度融合和图匹配的行人重识别
11
作者 李冬 张智 《计算机工程与设计》 北大核心 2024年第7期2180-2186,共7页
由于行人遮挡、视角变化等因素影响,传统的行人重识别并不能准确表达遮挡行人的信息。针对该问题,提出一种基于多尺度融合和图匹配的网络模型。分为提取不同尺度的特征和基于拓扑结构匹配图像两个部分,将主干网络分为两个子分支分别提... 由于行人遮挡、视角变化等因素影响,传统的行人重识别并不能准确表达遮挡行人的信息。针对该问题,提出一种基于多尺度融合和图匹配的网络模型。分为提取不同尺度的特征和基于拓扑结构匹配图像两个部分,将主干网络分为两个子分支分别提取全局特征并融合多个网络层面的局部特征;使用多头注意力机制学习相邻关键点的关系,基于拓扑结构匹配图像并预测相似度结果。使用ResNet-50作为主干网络,在Occluded-Duke数据集上的Rank-1和mAP分别是64.8%和59.9%,验证该模型在遮挡行人重识别中有一定程度的准确率提升。 展开更多
关键词 行人重识别 目标检测 局部特征 多尺度特征融合 图注意力机制 图匹配 卷积神经网络
下载PDF
基于深度学习与规则结合的海运货物邮件命名实体识别
12
作者 滕俊凯 张俊 《计算机应用与软件》 北大核心 2024年第4期119-128,共10页
针对海运货物邮件实体识别中存在识别精度不高、实体边界确定困难的问题,提出一种结合深度学习与规则匹配的识别方法。其中:深度学习方法是在BiLSTM-CRF(Bidirectional Long Short Term Memory-Conditional Random Field)模型的基础上... 针对海运货物邮件实体识别中存在识别精度不高、实体边界确定困难的问题,提出一种结合深度学习与规则匹配的识别方法。其中:深度学习方法是在BiLSTM-CRF(Bidirectional Long Short Term Memory-Conditional Random Field)模型的基础上添加词的字符级特征,并融入多头注意力机制以捕获邮件文本中长距离依赖;规则匹配方法则根据领域实体特点制定规则来完成识别。根据货物邮件特点将语料进行标注并划分为:货物名称、货物重量、装卸港口、受载期和佣金五个类别。在自建语料中设置多组对比实验,实验表明所提方法在海运货物邮件实体识别的F1值达到79.3%。 展开更多
关键词 命名实体识别 海运货物邮件 多头注意力机制 字符级特征 规则匹配
下载PDF
阅读理解中多项选择的三重匹配与对比正则算法
13
作者 马俊龙 姚迅 杨捷 《软件导刊》 2024年第5期38-43,共6页
多项选择由文章、问题和选项三部分组成,主要任务是根据文章和问题在多个选项中找出正确选项。已有一些算法对文章、问题和选项之间的匹配策略进行了一定程度的研究,但一般使用成对处理或双向匹配方法,无法充分融合文章、问题和选项。为... 多项选择由文章、问题和选项三部分组成,主要任务是根据文章和问题在多个选项中找出正确选项。已有一些算法对文章、问题和选项之间的匹配策略进行了一定程度的研究,但一般使用成对处理或双向匹配方法,无法充分融合文章、问题和选项。为此,提出一种三重匹配策略(TM),使用对比正则(CR)方法对答案进行区分处理,将文章、问题和答案三者中任意一个元素与其它元素进行匹配,以吸收其他两者的语义信息。实验表明,通过CR捕捉并强化正确答案和错误答案之间的差异,能让模型更好地识别正确与错误答案,以期为该领域的研究人员提供参考与借鉴。 展开更多
关键词 三重匹配 对比正则 注意力 深度学习 特征融合
下载PDF
线性注意力机制优化的光学与SAR影像匹配方法
14
作者 何巧 《遥感信息》 CSCD 北大核心 2024年第5期171-178,共8页
针对光学与SAR影像间存在非线性辐射畸变导致匹配正确率低的问题,提出线性注意力机制优化的光学与SAR影像匹配方法。该方法利用SuperPoint的描述分支将融合像素级的梯度方向直方图特征进行特征图维度重构,在维度层面增强特征的语义识别... 针对光学与SAR影像间存在非线性辐射畸变导致匹配正确率低的问题,提出线性注意力机制优化的光学与SAR影像匹配方法。该方法利用SuperPoint的描述分支将融合像素级的梯度方向直方图特征进行特征图维度重构,在维度层面增强特征的语义识别能力;在特征匹配阶段,利用线性注意力机制对SuperGlue算法进行优化,同时采用单样本分类准确性约束、全样本全局一致性约束以及局部范围结构一致等多种约束,构建多尺度损失函数进行训练,增强不同尺度下错误匹配的特征区分。利用6组光学与SAR遥感影像进行实验对比,结果表明,该方法相比HOPC、AWOG、CMM-Net及SuperGlue方法,匹配正确率、匹配效率均有较大提升。 展开更多
关键词 影像匹配 灰度信息 特征融合 线性注意力机制 多尺度损失函数
下载PDF
基于红外影像层次旋转匹配的飞行器定位方法
15
作者 李清格 杨小冈 +5 位作者 卢瑞涛 范继伟 唐彬 张震宇 王思宇 宿爽 《红外与激光工程》 EI CSCD 北大核心 2024年第5期240-252,共13页
基于图像匹配的飞行器自主视觉定位技术是飞行器导航制导、态势感知和自主决策的关键技术之一。针对红外遥感影像在大角度旋转下飞行器匹配定位失效的问题,提出了一种基于层次结构强化的特征点旋转匹配定位方法。该方法通过融合深度特... 基于图像匹配的飞行器自主视觉定位技术是飞行器导航制导、态势感知和自主决策的关键技术之一。针对红外遥感影像在大角度旋转下飞行器匹配定位失效的问题,提出了一种基于层次结构强化的特征点旋转匹配定位方法。该方法通过融合深度特征点提取与层次结构强化的旋转匹配定位技术,有效实现了飞行器匹配定位。首先设计了一个集成残差连接编码器的RBN-SuperPoint深度特征点提取模型,用于检测和描述待匹配图像中的深度特征点。其次构建了基于线性注意力和置信度分类器的L-LightGlue自适应匹配算法,利用L-LightGlue进行特征点粗匹配,生成单应性变换矩阵。随后采用层次结构强化的旋转匹配策略,根据粗匹配得到的单应性变换矩阵对图像进行旋转处理,消除图像间的角度差异,并进行精确匹配。再通过将结果映射至原图像,得到旋转校正后的特征点匹配结果和对应的单应性变换矩阵。最后利用图像间变换关系确定飞行器在图像中的位置,完成视觉定位。实验结果表明:RBN-SuperPoint可以高效提取大量均匀分布的特征点,所提基于L-LightGlue的匹配定位算法的匹配准确率最高可达98.57%,平均定位误差仅为4.08 pixel。 展开更多
关键词 红外遥感影像 特征点检测 旋转匹配 线性注意力 飞行器视觉定位
下载PDF
基于SE-Hardnet网络的无人机图像目标匹配算法
16
作者 苏文博 房群忠 +1 位作者 徐保树 张程硕 《沈阳工业大学学报》 CAS 北大核心 2024年第5期693-701,共9页
针对无人机对目标进行匹配定位过程中,面临图像旋转变化及视角尺寸过小导致的图像特征提取困难等问题,提出了一种融合候选区域检测与SE-Hardnet特征提取网络的无人机目标图像匹配算法。通过Edge Boxes算法检测候选区域,结合SE-Hardnet... 针对无人机对目标进行匹配定位过程中,面临图像旋转变化及视角尺寸过小导致的图像特征提取困难等问题,提出了一种融合候选区域检测与SE-Hardnet特征提取网络的无人机目标图像匹配算法。通过Edge Boxes算法检测候选区域,结合SE-Hardnet网络进行特征提取,实现了目标图像的精确匹配。实验结果表明,所提算法在图像发生角度、尺寸变化时,具有更高的匹配正确率和鲁棒性,在近距离条件下图片数据集中的匹配正确率比现阶段图像匹配算法高8%~11%。为无人机目标定位提供了一种可行和有效的手段。 展开更多
关键词 图像匹配 候选区域检测 Edge Boxes算法 特征提取 注意力机制 SE-Hardnet网络 相似性度量 无人机目标定位
下载PDF
基于特征增强的多方位农业问句语义匹配 被引量:3
17
作者 王奥 吴华瑞 朱华吉 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期201-210,共10页
农业问句文本数据具有专业名词多、特征稀疏、语句规范性差等特征,难以深入挖掘句间交互关系.为改善农业相似问句的匹配性能,提出一种基于特征增强的多方位农业问句语义匹配模型.模型通过共享参数的双向长短期记忆网络提取上下文向量,... 农业问句文本数据具有专业名词多、特征稀疏、语句规范性差等特征,难以深入挖掘句间交互关系.为改善农业相似问句的匹配性能,提出一种基于特征增强的多方位农业问句语义匹配模型.模型通过共享参数的双向长短期记忆网络提取上下文向量,分别引入自注意力机制、多维注意力机制增强农业问句文本语义推断特征和文本距离特征,通过多特征增强聚焦语义特征信息,将增强特征嵌入到多方位匹配函数中,从向量值、方向和元素等角度进行句间相似度对比,以捕获句子多样性特征.从农业问答社区导出农业问答文本数据,人工标注相似问句构建试验数据集.试验结果表明:基于特征增强的多方位农业问句语义匹配模型可以增强文本特征之间的交互,获取更多的关系特征信息,在构建的农业问句数据集上正确率及F1值达95.3%和97.3%,与其他5种问句语义匹配模型相比,效果提升明显. 展开更多
关键词 农业问句语义匹配 特征增强 自然语言处理 双向长短期记忆网络 自注意力机制
下载PDF
联合多尺度与注意力模型的双分支局部特征提取方法 被引量:1
18
作者 黄鑫涛 曹力 +1 位作者 蔡有城 李琳 《小型微型计算机系统》 CSCD 北大核心 2023年第6期1297-1303,共7页
局部特征是图像匹配与识别等应用中的关键表征方式.针对目前局部特征提取方法存在的尺度单一、区分性不足等问题,本文基于双分支编码器-解码器提出了一种联合多尺度与注意力机制的局部特征提取方法.首先,在共享编码阶段,采用经典的VGG-S... 局部特征是图像匹配与识别等应用中的关键表征方式.针对目前局部特征提取方法存在的尺度单一、区分性不足等问题,本文基于双分支编码器-解码器提出了一种联合多尺度与注意力机制的局部特征提取方法.首先,在共享编码阶段,采用经典的VGG-Style卷积神经网络对输入图像提取不同尺度的特征层;其次,在关键点解码阶段,通过与编码阶段中相同尺度特征进行并联构建特征金字塔结构以解决单一预测结构带来的特征信息不足等问题,同时在描述解码器中嵌入基于空间、通道的混合注意力模型以实现特征的选择性预测;最后针对检测和描述过程分别提出了针对性的损失函数对训练目标进行优化.实验结果表明,本文方法所提取的局部特征相较于现有方法不仅在重复性和区分性上表现更好,而且对视角、光照等变化具有更高的鲁棒性. 展开更多
关键词 图像匹配 局部特征提取 卷积神经网络 特征金字塔 注意力机制
下载PDF
基于深度学习LoFTR算法的路面图像拼接 被引量:3
19
作者 张瑞 袁博 +3 位作者 杨明 丁健刚 徐政超 李伟 《计算机系统应用》 2023年第2期170-180,共11页
相比基于特征点的传统图像特征匹配算法,基于深度学习的特征匹配算法能产生更大规模和更高质量的匹配.为获取较大范围且清晰的路面裂缝图像,并解决弱纹理图像拼接过程中发生的匹配对缺失问题,本文基于深度学习LoFTR(detector-free local... 相比基于特征点的传统图像特征匹配算法,基于深度学习的特征匹配算法能产生更大规模和更高质量的匹配.为获取较大范围且清晰的路面裂缝图像,并解决弱纹理图像拼接过程中发生的匹配对缺失问题,本文基于深度学习LoFTR(detector-free local feature matching with Transformers)算法实现路面图像的拼接,并结合路面图像的特点,提出局部拼接方法缩短算法运行的时间.先对相邻图像做分割处理,再通过LoFTR算法产生密集特征匹配,根据匹配结果计算出单应矩阵值并实现像素转换,然后通过基于小波变换的图像融合算法获得局部拼接后的图像,最后添加未输入匹配网络的部分图像,得到相邻图像的完整拼接结果.实验结果表明,与基于SIFT(scale-invariant feature transform)、SURF(speeded up robust features)、ORB(oriented FAST and rotated BRIEF)的图像拼接方法比较,研究所提出的拼接方法对路面图像的拼接效果更佳,特征匹配阶段产生的匹配结果置信度更高.对于两幅路面图像的拼接,采用局部拼接方法耗费的时间较改进之前缩短了27.53%.研究提出的拼接方案是高效且准确的,能够为道路病害监测提供总体病害信息. 展开更多
关键词 路面图像拼接 弱纹理图像 注意力机制 LoFTR算法 深度学习 小波变换 特征匹配 局部拼接
下载PDF
语义风格一致的任意图像风格迁移 被引量:1
20
作者 颜明强 余鹏飞 +1 位作者 李海燕 李红松 《计算机科学》 CSCD 北大核心 2023年第7期129-136,共8页
图像风格迁移的目标是通过将目标图像风格迁移到给定的内容图像来合成输出图像。目前已有大量关于图像风格迁移的工作,但这些方法的风格化结果忽略了内容图像不同语义区域的流形分布,同时,大多数方法使用全局统计数据(如Gram矩阵或协方... 图像风格迁移的目标是通过将目标图像风格迁移到给定的内容图像来合成输出图像。目前已有大量关于图像风格迁移的工作,但这些方法的风格化结果忽略了内容图像不同语义区域的流形分布,同时,大多数方法使用全局统计数据(如Gram矩阵或协方差矩阵)来实现风格特征到内容特征的匹配,不可避免地存在内容丢失、风格泄漏和伪影的问题,从而产生不一致的风格化结果。针对以上问题,提出了一个基于自注意力机制的渐进式流形特征映射模块(MFMM-AM),用于协调一致地匹配相关内容和风格流形之间的特征;然后通过在图像特征空间中应用精确直方图匹配(EHM)来实现风格和内容特征图的高阶分布匹配,减少了图像信息的丢失;最后,引入了两个对比性损失,利用大规模风格数据集的外部信息来学习人类感知的风格信息,使风格化图像的色彩分布和纹理图案更加合理。实验结果表明,与现有典型的任意图像风格迁移方法相比,所提网络极大地弥合了人类创作的艺术品和人工智能创作的艺术品之间的鸿沟,可以生成视觉上更加和谐和令人满意的艺术图像。 展开更多
关键词 图像风格迁移 流形分布 自注意力机制 特征映射 高阶分布匹配
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部