期刊文献+
共找到212篇文章
< 1 2 11 >
每页显示 20 50 100
Deep Learning-Based Semantic Feature Extraction:A Literature Review and Future Directions 被引量:1
1
作者 DENG Letian ZHAO Yanru 《ZTE Communications》 2023年第2期11-17,共7页
Semantic communication,as a critical component of artificial intelligence(AI),has gained increasing attention in recent years due to its significant impact on various fields.In this paper,we focus on the applications ... Semantic communication,as a critical component of artificial intelligence(AI),has gained increasing attention in recent years due to its significant impact on various fields.In this paper,we focus on the applications of semantic feature extraction,a key step in the semantic communication,in several areas of artificial intelligence,including natural language processing,medical imaging,remote sensing,autonomous driving,and other image-related applications.Specifically,we discuss how semantic feature extraction can enhance the accuracy and efficiency of natural language processing tasks,such as text classification,sentiment analysis,and topic modeling.In the medical imaging field,we explore how semantic feature extraction can be used for disease diagnosis,drug development,and treatment planning.In addition,we investigate the applications of semantic feature extraction in remote sensing and autonomous driving,where it can facilitate object detection,scene understanding,and other tasks.By providing an overview of the applications of semantic feature extraction in various fields,this paper aims to provide insights into the potential of this technology to advance the development of artificial intelligence. 展开更多
关键词 semantic feature extraction semantic communication deep learning
下载PDF
基于Deep Learning的代词指代消解 被引量:23
2
作者 奚雪峰 周国栋 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期100-110,共11页
针对指代消解一直是自然语言处理中的核心问题,提出一种利用DBN(deep belief nets)模型的Deep Learning学习机制进行基于语义特征的指代消解方法。DBN模型由多层无监督的RBM(restricted Boltzmann machine)网络和一层有监督的BP(back-pr... 针对指代消解一直是自然语言处理中的核心问题,提出一种利用DBN(deep belief nets)模型的Deep Learning学习机制进行基于语义特征的指代消解方法。DBN模型由多层无监督的RBM(restricted Boltzmann machine)网络和一层有监督的BP(back-propagation)网络组成,RBM网络确保特征向量映射达到最优,最后一层BP网络可以对RBM网络的输出特征向量进行分类,从而训练指代消解分类器。在ACE04英文语料及ACE05中文语料上进行测试,实验结果表明,增加RBM训练层数可以提高系统性能。此外,引入对特征集合的抽象分层因素,也对系统性能的提升产生积极作用。 展开更多
关键词 代词消解 深度学习 深层语义特征
下载PDF
基于改进DeeplabV3+的水面多类型漂浮物分割方法研究
3
作者 包学才 刘飞燕 +2 位作者 聂菊根 许小华 柯华盛 《水利水电技术(中英文)》 北大核心 2024年第4期163-175,共13页
【目的】为解决传统图像处理方法鲁棒性差、常用深度学习检测方法无法准确识别大片漂浮物的边界等问题,【方法】提出一种基于改进DeeplabV3+的水面多类型漂浮物识别的语义分割方法,提高水面漂浮的识别能力。对所收集实际水面漂浮物进行... 【目的】为解决传统图像处理方法鲁棒性差、常用深度学习检测方法无法准确识别大片漂浮物的边界等问题,【方法】提出一种基于改进DeeplabV3+的水面多类型漂浮物识别的语义分割方法,提高水面漂浮的识别能力。对所收集实际水面漂浮物进行分类,采用自制数据集进行对比试验。算法选择xception网络作为主干网络以获得初步漂浮物特征,在加强特征提取网络部分引入注意力机制以强调有效特征信息,在后处理阶段加入全连接条件随机场模型,将单个像素点的局部信息与全局语义信息融合。【结果】对比图像分割性能指标,改进后的算法mPA(Mean Pixel Accuracy)提升了5.73%,mIOU(Mean Intersection Over Union)提升了4.37%。【结论】相比于其他算法模型,改进后的DeeplabV3+算法对漂浮物特征的获取能力更强,同时能获得丰富的细节信息以更精准地识别多类型水面漂浮物的边界与较难分类的漂浮物,在对多个水库场景测试后满足实际水域环境中漂浮物检测的需求。 展开更多
关键词 深度学习 语义分割 特征提取 漂浮物识别 注意力机制 全连接条件随机场 算法模型 影响因素
下载PDF
一种耦合DeepLab与Transformer的农作物种植类型遥感精细分类方法 被引量:2
4
作者 林云浩 王艳军 +1 位作者 李少春 蔡恒藩 《测绘学报》 EI CSCD 北大核心 2024年第2期353-366,共14页
如何精细遥感监测复杂的不同类型农田作物种植情况,是智慧农业农村领域实现农耕面积调查与农作物估产的关键。目前的高分辨率影像的作物种植像素级语义分割中,深度卷积神经网络难以兼顾空间多尺度全局特征和局部细节特征,从而导致各类... 如何精细遥感监测复杂的不同类型农田作物种植情况,是智慧农业农村领域实现农耕面积调查与农作物估产的关键。目前的高分辨率影像的作物种植像素级语义分割中,深度卷积神经网络难以兼顾空间多尺度全局特征和局部细节特征,从而导致各类农田地块之间边界轮廓模糊和同类农田区域内部完整性不高等问题。针对这些不足,本文提出了一种耦合DeepLabv3+和Transformer编码器的双分支并行特征融合网络FDTNet,以实现农作物种植类型的精细遥感监测。首先,在FDTNet中并行嵌入DeepLabv3+和Transformer分别捕获农田影像的局部特征和全局特征;其次,应用耦合注意力融合模块CAFM有效融合两者的特征;然后,在解码器阶段应用卷积注意力模块CBAM增强卷积层有效特征的权重;最后,采用渐进式多层特征融合策略将编码器和解码器中的有效特征全面融合并输出特征图,以实现晚稻、中稻、藕田、菜地和大棚的高精度分类识别。为了验证FDTNet网络模型在高分辨率作物分类应用的有效性,本文选择不同高分辨率的Yuhu数据集和Zhejiang数据集验证,mIoU分别达到74.7%和81.4%。相比于已有的UNet、DeepLabv3、DeepLabv3+、ResT和Res-Swin等深度学习方法,FDTNet的mIoU可分别高2.2%和3.6%。结果表明,FDTNet在纹理单一、大样本量,以及纹理多样、小样本量的两类农田场景中同时表现出优于对比方法的性能,具有较全面的多类别农作物有效特征提取能力。 展开更多
关键词 高分辨率遥感影像 农作物种植类型 语义分割 特征融合 深度学习
下载PDF
DGConv: A Novel Convolutional Neural Network Approach for Weld Seam Depth Image Detection
5
作者 Pengchao Li Fang Xu +3 位作者 Jintao Wang Haibing Guo Mingmin Liu Zhenjun Du 《Computers, Materials & Continua》 SCIE EI 2024年第2期1755-1771,共17页
We propose a novel image segmentation algorithm to tackle the challenge of limited recognition and segmentation performance in identifying welding seam images during robotic intelligent operations.Initially,to enhance... We propose a novel image segmentation algorithm to tackle the challenge of limited recognition and segmentation performance in identifying welding seam images during robotic intelligent operations.Initially,to enhance the capability of deep neural networks in extracting geometric attributes from depth images,we developed a novel deep geometric convolution operator(DGConv).DGConv is utilized to construct a deep local geometric feature extraction module,facilitating a more comprehensive exploration of the intrinsic geometric information within depth images.Secondly,we integrate the newly proposed deep geometric feature module with the Fully Convolutional Network(FCN8)to establish a high-performance deep neural network algorithm tailored for depth image segmentation.Concurrently,we enhance the FCN8 detection head by separating the segmentation and classification processes.This enhancement significantly boosts the network’s overall detection capability.Thirdly,for a comprehensive assessment of our proposed algorithm and its applicability in real-world industrial settings,we curated a line-scan image dataset featuring weld seams.This dataset,named the Standardized Linear Depth Profile(SLDP)dataset,was collected from actual industrial sites where autonomous robots are in operation.Ultimately,we conducted experiments utilizing the SLDP dataset,achieving an average accuracy of 92.7%.Our proposed approach exhibited a remarkable performance improvement over the prior method on the identical dataset.Moreover,we have successfully deployed the proposed algorithm in genuine industrial environments,fulfilling the prerequisites of unmanned robot operations. 展开更多
关键词 Weld image detection deep learning semantic segmentation depth map geometric feature extraction
下载PDF
Zero-shot Fine-grained Classification by Deep Feature Learning with Semantics 被引量:7
6
作者 Ao-Xue Li Ke-Xin Zhang Li-Wei Wang 《International Journal of Automation and computing》 EI CSCD 2019年第5期563-574,共12页
Fine-grained image classification, which aims to distinguish images with subtle distinctions, is a challenging task for two main reasons: lack of sufficient training data for every class and difficulty in learning dis... Fine-grained image classification, which aims to distinguish images with subtle distinctions, is a challenging task for two main reasons: lack of sufficient training data for every class and difficulty in learning discriminative features for representation. In this paper, to address the two issues, we propose a two-phase framework for recognizing images from unseen fine-grained classes, i.e., zeroshot fine-grained classification. In the first feature learning phase, we finetune deep convolutional neural networks using hierarchical semantic structure among fine-grained classes to extract discriminative deep visual features. Meanwhile, a domain adaptation structure is induced into deep convolutional neural networks to avoid domain shift from training data to test data. In the second label inference phase, a semantic directed graph is constructed over attributes of fine-grained classes. Based on this graph, we develop a label propagation algorithm to infer the labels of images in the unseen classes. Experimental results on two benchmark datasets demonstrate that our model outperforms the state-of-the-art zero-shot learning models. In addition, the features obtained by our feature learning model also yield significant gains when they are used by other zero-shot learning models, which shows the flexility of our model in zero-shot finegrained classification. 展开更多
关键词 FINE-GRAINED image CLASSIFICATION zero-shot learning deep feature learning domain adaptation semantic graph
原文传递
SENet优化的Deeplabv3+淡水鱼体语义分割 被引量:8
7
作者 王红君 季晓宇 +1 位作者 赵辉 岳有军 《中国农机化学报》 北大核心 2021年第2期158-163,共6页
淡水鱼头、腹、鳍的各部分快速识别与精准定位是机器人实现淡水鱼快速抓取,精确切割、提升作业效率关键技术的前提。针对深度学习的淡水鱼体语义分割算法在编码特征提取阶段产生大量无效的特征通道,以及网络不断下采样和池化操作使得鱼... 淡水鱼头、腹、鳍的各部分快速识别与精准定位是机器人实现淡水鱼快速抓取,精确切割、提升作业效率关键技术的前提。针对深度学习的淡水鱼体语义分割算法在编码特征提取阶段产生大量无效的特征通道,以及网络不断下采样和池化操作使得鱼体某些细节信息被丢失,网络性能下降、边缘分割效果不佳的问题,提出了一种基于SENet优化后的Deeplabv3+淡水鱼头、腹、鳍的语义分割算法。利用空洞/带孔卷积(dilated/atrous convolutions)实现扩展感受野,克服细节信息丢失,达到准确定位的目的,同时SENet的优化使得Deeplabv3+通过学习的方式提升淡水鱼有用的特征并抑制对当前任务用处不大的特征,最终淡水鱼各部分的语义分割平均交并比(MIoU)在自建的淡水鱼数据集上达到了93%左右,性能得到了明显提升并达到了目前先进分割水平。 展开更多
关键词 识别 定位 深度学习 特征通道 感受野 语义分割
下载PDF
MFC-DeepLabV3+:一种多特征级联融合裂缝缺陷检测网络模型 被引量:3
8
作者 李国燕 梁家栋 +2 位作者 刘毅 潘玉恒 刘泽帅 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2023年第4期1370-1381,共12页
道路裂缝对道路安全存在很大威胁,确保道路的安全性离不开对裂缝的准确检测。针对常规的人工检测方法和传统机器学习检测方法泛化性低且在复杂背景下裂缝分割检测准确率低等诸多问题,提出一种新型道路裂缝缺陷检测模型MFC-DeepLabV3+(Mu... 道路裂缝对道路安全存在很大威胁,确保道路的安全性离不开对裂缝的准确检测。针对常规的人工检测方法和传统机器学习检测方法泛化性低且在复杂背景下裂缝分割检测准确率低等诸多问题,提出一种新型道路裂缝缺陷检测模型MFC-DeepLabV3+(MultiFeatureCascade-DeepLabV3+,多特征级联-DeepLabV3+)。首先,针对裂缝图像拓扑结构复杂,非均匀性强等问题,对主干特征提取网络进行改进,提出采用通道维度的分组卷积和分离注意力模块增强模型对裂缝图像特征提取能力,同时引入位置信息注意力机制提升对裂缝目标结构特征的精准定位,扩大网络各层特征信息的利用率。其次,加入多分支共享密集连接改进ASPP(AtrousSpatialPyramidPooling,空洞空间金字塔池化)模块,使其模仿人类视觉行为感知,在感受野保持均衡的同时生成密集覆盖裂缝尺度范围的特征语义信息。最后,在模型特征融合阶段增加多重边缘细化融合机制,使模型加大对高低阶特征信息的利用,提升模型对裂缝边缘精确分割的能力,防止裂缝轮廓边缘像素缺失。为验证MFC-DeepLabV3+模型的有效性,在公开路面裂缝数据集CRACK500与DeepCrack上进行实验,相较其他分割模型,在平均交并比上分别达到79.63%和76.99%,同时在主观视觉对比上预测出的裂缝分割图像边缘更加清晰,区域更加完整,表明该模型具有良好的工程应用价值。 展开更多
关键词 缺陷检测 裂缝识别 深度学习 语义分割 多特征融合
下载PDF
基于注意力机制和全局特征优化的点云语义分割 被引量:1
9
作者 张鹏飞 韩李涛 +1 位作者 冯恒健 李洪梅 《计算机应用》 CSCD 北大核心 2024年第4期1086-1092,共7页
在基于深度学习的三维点云语义分割算法中,为了加强提取局部特征细粒度能力和学习不同局部邻域之间的长程依赖性,提出一种基于注意力机制和全局特征优化的神经网络。首先,通过加性注意力的形式设计单通道注意力(SCA)模块和点注意力(PA)... 在基于深度学习的三维点云语义分割算法中,为了加强提取局部特征细粒度能力和学习不同局部邻域之间的长程依赖性,提出一种基于注意力机制和全局特征优化的神经网络。首先,通过加性注意力的形式设计单通道注意力(SCA)模块和点注意力(PA)模块,前者通过自适应调节单通道中各点特征加强对局部特征的分辨能力,后者通过调节单点特征向量之间的重要程度抑制无用特征并减少特征冗余;其次,加入全局特征聚合(GFA)模块,聚合各局部邻域特征,以捕获全局上下文信息,从而提高语义分割精度。实验结果表明,在点云数据集S3DIS上,所提网络的平均交并比(mIoU)相较于RandLA-Net(Random sampling and an effective Local feature Aggregator Network)提升了1.8个百分点,分割性能良好,具有较好的适应性。 展开更多
关键词 三维点云 深度学习 语义分割 注意力机制 特征聚合
下载PDF
双通道特征融合的真实场景点云语义分割方法 被引量:1
10
作者 孙刘杰 朱耀达 王文举 《计算机工程与应用》 CSCD 北大核心 2024年第12期160-169,共10页
真实场景点云不仅具有点云的空间几何信息,还具有三维物体的颜色信息,现有的网络无法有效利用真实场景的局部特征以及空间几何特征信息,因此提出了一种双通道特征融合的真实场景点云语义分割方法DCFNet(dual-channel feature fusion of ... 真实场景点云不仅具有点云的空间几何信息,还具有三维物体的颜色信息,现有的网络无法有效利用真实场景的局部特征以及空间几何特征信息,因此提出了一种双通道特征融合的真实场景点云语义分割方法DCFNet(dual-channel feature fusion of real scene for point cloud semantic segmentation)可用于不同场景下的室内外场景语义分割。更具体地说,为了解决不能充分提取真实场景点云颜色信息的问题,该方法采用上下两个输入通道,通道均采用相同的特征提取网络结构,其中上通道的输入是完整RGB颜色和点云坐标信息,该通道主要关注于复杂物体对象场景特征,下通道仅输入点云坐标信息,该通道主要关注于点云的空间几何特征;在每个通道中为了更好地提取局部与全局信息,改善网络性能,引入了层间融合模块和Transformer通道特征扩充模块;同时,针对现有的三维点云语义分割方法缺乏关注局部特征与全局特征的联系,导致对复杂场景的分割效果不佳的问题,对上下两个通道所提取的特征通过DCFFS(dual-channel feature fusion segmentation)模块进行融合,并对真实场景进行语义分割。对室内复杂场景和大规模室内外场景点云分割基准进行了实验,实验结果表明,提出的DCFNet分割方法在S3DIS Area5室内场景数据集以及STPLS3D室外场景数据集上,平均交并比(MIOU)分别达到71.18%和48.87%,平均准确率(MACC)和整体准确率(OACC)分别达到77.01%与86.91%,实现了真实场景的高精度点云语义分割。 展开更多
关键词 深度学习 双通道特征融合 点云语义分割 注意力机制
下载PDF
面向带宽受限场景的高效语义通信方法
11
作者 刘伟 王孟洋 白宝明 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第3期9-18,共10页
语义通信为通信系统优化和性能提升提供了新的研究角度,然而,目前语义通信的研究忽略了通信开销的影响,未考虑语义通信性能和通信开销的关系,导致带宽资源受限时语义通信性能难以提升。为此,针对带宽受限场景,提出一种基于信息瓶颈的语... 语义通信为通信系统优化和性能提升提供了新的研究角度,然而,目前语义通信的研究忽略了通信开销的影响,未考虑语义通信性能和通信开销的关系,导致带宽资源受限时语义通信性能难以提升。为此,针对带宽受限场景,提出一种基于信息瓶颈的语义通信方法。首先,该方法采用Transformer模型进行语义和信道联合编解码,并设计特征选择模块以识别和删除冗余语义信息,构建了端到端语义通信模型;进而考虑语义通信性能与通信开销之间的折衷关系,基于信息瓶颈理论设计损失函数,在保证语义通信性能的同时,降低通信开销,完成语义通信模型的训练和优化。实验结果显示,在欧洲议会平行语料库上,与基线模型相比,所提方法在保证通信性能的同时可降低约20%~30%的通信开销,在相同带宽条件下该方法的BLEU分数可提升约5%。实验结果表明,所提方法可以有效降低语义通信开销,从而提升带宽资源受限场景下的语义通信性能。 展开更多
关键词 语义通信 通信系统 深度学习 TRANSFORMER 特征选择模块 信息瓶颈理论
下载PDF
融合编码器多尺度特征的RGB-D图像语义分割
12
作者 杨晓文 靳瑜昕 +2 位作者 韩慧妍 况立群 《计算机仿真》 2024年第9期205-212,227,共9页
针对语义分割任务中,室内场景中目标物体尺寸变化较大的问题,在ACFNet的基础上,提出融合编码器多尺度特征的RGB-D语义分割网络。首先,为有效利用网络提取的多尺度特征,提出结合池化操作的多尺度特征融合模块(PMFM),选择编码器不同阶段RG... 针对语义分割任务中,室内场景中目标物体尺寸变化较大的问题,在ACFNet的基础上,提出融合编码器多尺度特征的RGB-D语义分割网络。首先,为有效利用网络提取的多尺度特征,提出结合池化操作的多尺度特征融合模块(PMFM),选择编码器不同阶段RGB和深度特征的融合特征作为该模块的输入;其次,设计改进的跳跃连接模块(ISCM),使用下一层级包含更多语义信息的特征图辅助修正当前层级的特征图,再经跳跃连接以拼接的方式传输到解码器对应阶段。将提出的网络模型应用到NYUD V2和SUN RGB-D数据集上,平均交并比分别达到了52.6%和48.8%。通过这两项改进,实验结果表明,上述方法达到了较高的分割准确率,优于对比的语义分割方法。 展开更多
关键词 语义分割 多尺度特征 跳跃连接 深度学习
下载PDF
基于语义-视觉一致性约束的零样本图像语义分割网络
13
作者 陈琼 冯媛 +1 位作者 李志群 杨咏 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第10期41-50,共10页
零样本图像语义分割是零样本学习在视觉领域的重要任务之一,旨在分割训练中未见的新类别。目前基于像素级视觉特征生成的方法合成的视觉特征分布和真实的视觉特征分布存在不一致性的问题,合成的视觉特征难以准确反映类语义信息,导致合... 零样本图像语义分割是零样本学习在视觉领域的重要任务之一,旨在分割训练中未见的新类别。目前基于像素级视觉特征生成的方法合成的视觉特征分布和真实的视觉特征分布存在不一致性的问题,合成的视觉特征难以准确反映类语义信息,导致合成的视觉特征缺乏鉴别性;现有的一些视觉特征生成方法为了得到语义特征所表达的区分性信息,需要消耗巨大的计算资源。为此,文中提出了一种基于语义-视觉一致性约束的零样本图像语义分割网络(SVCCNet)。该网络通过语义-视觉一致性约束模块对语义特征与视觉特征进行相互转换,以提高两者的关联度,减小真实视觉特征与合成视觉特征空间结构的差异性,从而缓解合成视觉特征与真实视觉特征分布不一致的问题。语义-视觉一致性约束模块通过两个相互约束的重建映射,实现了视觉特征与类别语义的对应关系,同时保持了较低的模型复杂度。在PASCAL-VOC及PASCAL-Context数据集上的实验结果表明,SVCCNet的像素准确率、平均准确率、平均交并比、调和交并比均优于比较的主流方法。 展开更多
关键词 语义分割 特征生成 零样本学习 计算机视觉 深度学习
下载PDF
基于语义信息的无监督单目深度估计
14
作者 李颀 李煜哲 《传感器与微系统》 CSCD 北大核心 2024年第9期157-160,共4页
随着深度学习的发展,无监督单目深度估计成为计算机视觉的研究热点。由于深度图存在轮廓不清晰、深度估计不准确等问题,以编—解码器结构为基础,提出一种基于语义信息的无监督单目深度估计网络,为了获取更为清晰的轮廓信息,本文在编解... 随着深度学习的发展,无监督单目深度估计成为计算机视觉的研究热点。由于深度图存在轮廓不清晰、深度估计不准确等问题,以编—解码器结构为基础,提出一种基于语义信息的无监督单目深度估计网络,为了获取更为清晰的轮廓信息,本文在编解码器之间通过空洞空间卷积池化金字塔(ASPP)层进行语义信息的细化,提高生成的图像质量;该网络通过在编码器到解码器的跳层连接实现对多分辨率特征的提取,在编码器部分采用改进的高分辨率网络(HRNet)融合不同层的多分辨率特征,在解码前使用串联策略融合中间阶段的输出,提高深度估计的准确率。在KITTI数据集上的实验结果表明,本文方法的误差评价指标相较于目前的深度估计方法更低,在3个深度估计准确率评价指标上达到了89.4%,96.3%,98.1%,具有较好的准确性。 展开更多
关键词 深度估计 无监督学习 多分辨率特征 语义信息 编—解码结构
下载PDF
基于PointNet++的邻域特征增强点云语义分割方法
15
作者 李松 张安思 +1 位作者 伍婕 张保 《激光杂志》 CAS 北大核心 2024年第7期174-179,共6页
随着智能驾驶、机器人导航等以点云为基础的应用蓬勃发展,点云语义分割逐渐成为研究热点。然而,现有的点云语义分割方法存在局部特征提取不充分、特征融合不完整的缺陷。针对这些不足,提出了对应的解决方案。对于局部特征提取不充分的现... 随着智能驾驶、机器人导航等以点云为基础的应用蓬勃发展,点云语义分割逐渐成为研究热点。然而,现有的点云语义分割方法存在局部特征提取不充分、特征融合不完整的缺陷。针对这些不足,提出了对应的解决方案。对于局部特征提取不充分的现象,通过嵌入邻域点的坐标、方向、距离等相关信息去关联邻域点的显式特征。对于特征融合不完整的现象,提出了一种最大池化与自注意力池化相结合的混合池化方法。网络架构基于PointNet++,并结合提出的局部特征提取和融合方法,在S3DIS数据集上的实验结果表明,与基线方法PointNet++相比,各评价指标都有不同程度的提高,证实了新方法的有效性和优越性。 展开更多
关键词 三维点云 语义分割 特征提取 深度学习
下载PDF
基于元学习的小样本语义分割算法
16
作者 王兰忠 牟昌善 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第5期574-580,620,共8页
针对现有的小样本语义分割模型对未知新类分割精度不高的问题,提出一种基于元学习的小样本语义分割算法.首先,利用深度可分离卷积改进传统主干网络,并在ImageNet数据集上进行了编码器的预训练.其次,利用预训练的主干网络将支持图片和查... 针对现有的小样本语义分割模型对未知新类分割精度不高的问题,提出一种基于元学习的小样本语义分割算法.首先,利用深度可分离卷积改进传统主干网络,并在ImageNet数据集上进行了编码器的预训练.其次,利用预训练的主干网络将支持图片和查询图片映射到深度特征空间.最后,利用支持图片的真实掩码将支持特征分离为目标前景和背景,并借助vision transformer构造了一种自适应的元学习分类器.在PASCAL-5^(i)数据集上进行了大量的试验.结果表明:所提出模型在VGG-16、ResNet-50和ResNet-101主干网络上分别实现了47.1%、58.3%和60.4%的mIoU(即平均交并比)(1 shot),同时在5 shot设定下实现了49.6%、60.2%和62.1%的mIoU;在COCO-20^(i)数据集上实现了23.6%、30.3%和30.7%的mIoU(1 shot),同时在5 shot设定下实现了30.1%、34.7%和35.2%的mIoU. 展开更多
关键词 小样本语义分割 特征分离 元学习 深度可分离卷积 vision transformer 目标前景 自适应
下载PDF
语义增强的多视立体视觉方法
17
作者 韩燮 王若蓝 赵融 《计算机技术与发展》 2024年第3期41-48,共8页
针对在基于深度学习技术的特征提取网络中,深层次的卷积神经网络提取的特征缺乏低级语义信息的问题,该文提出了语义增强的多视立体视觉方法。首先,提出了一种ConvLSTM(Convolutional Long Short-Term Memory)语义聚合网络,通过使用ConvL... 针对在基于深度学习技术的特征提取网络中,深层次的卷积神经网络提取的特征缺乏低级语义信息的问题,该文提出了语义增强的多视立体视觉方法。首先,提出了一种ConvLSTM(Convolutional Long Short-Term Memory)语义聚合网络,通过使用ConvLSTM网络结构,对多个卷积层提取的特征图进行预测,得到融合每层语义信息的特征图,有助于在空间上层层抽取图像的高级特征时,利用长短期记忆神经网络结构的记忆功能来增强高层特征图中的低级语义信息,提高了弱纹理区域的重建效果,提高了3D重建的鲁棒性和完整性;其次,提出了一种可见性网络,在灰度图的基础上,通过突出特征图上可见区域的特征,加深了可见区域在特征图中的影响,有助于提高三维重建效果;最后,提取图像的纹理信息,并进入ConvLSTM语义聚合网络提取深层次特征,提高了弱纹理区域的重建效果。与主流的多视立体视觉重建方法相比,重建效果较好。 展开更多
关键词 三维重建 深度学习 多视立体视觉 特征提取 语义聚合网络
下载PDF
面向电力生产精细化风险解译的高度相似防护工具智能检测技术研究 被引量:2
18
作者 马富齐 王波 +2 位作者 董旭柱 冯磊 贾嵘 《中国电机工程学报》 EI CSCD 北大核心 2024年第3期971-980,I0010,共11页
电力生产通常面临高低电压、强弱电流等复杂工作环境转换,不同作业场景有严格的防护工具使用标准,因此,研究生产作业过程防护工具的精细辨识对保障人员安全及电网安全意义重大。已有研究可实现安全帽、工作服等基础着装类检测,而实际生... 电力生产通常面临高低电压、强弱电流等复杂工作环境转换,不同作业场景有严格的防护工具使用标准,因此,研究生产作业过程防护工具的精细辨识对保障人员安全及电网安全意义重大。已有研究可实现安全帽、工作服等基础着装类检测,而实际生产中存在大量形态高度相似的实体防护工具,如绝缘手套与线手套、绝缘杆与验电杆等。为此,该文提出一种基于深度代表性度量学习的相似防护工具智能检测方法。将目标类别特征学习转换为以差异化表达不同目标特征距离为目的的嵌入式空间特征学习,得到表征不同目标的深度代表性特征向量,通过计算未知目标与代表性特征向量的距离进行类别判断,最后以现场图像进行试验验证。试验结果表明:所提方法实现了对形态相似防护工具的特征差异表达和精准辨识,相比于常见目标检测模型具有更优越的辨识性能,从而提高电力生产安全风险辨识的精细化水平。 展开更多
关键词 生产安全防护 安全影像解译 电力深度视觉 高度相似目标 深度度量学习 嵌入特征空间
下载PDF
联合语义分割的自监督单目深度估计方法
19
作者 宋霄罡 胡浩越 +3 位作者 宁靖宇 梁莉 鲁晓锋 黑新宏 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1336-1347,共12页
研究深度估计和语义分割的图像之间的互利关系,提出了一种联合语义分割的自监督单目深度估计方法USegDepth.语义分割和深度估计任务通过共享编码器,实现语义引导.为了进一步提高编码器的跨多任务性能,设计了多任务特征提取模块,堆叠该... 研究深度估计和语义分割的图像之间的互利关系,提出了一种联合语义分割的自监督单目深度估计方法USegDepth.语义分割和深度估计任务通过共享编码器,实现语义引导.为了进一步提高编码器的跨多任务性能,设计了多任务特征提取模块,堆叠该模块构成共享编码器,解决有限感受野和缺乏跨通道交互导致的模型特征表示能力欠佳问题,进一步提升模型精度.同时,提出跨任务交互模块,通过双向的跨域信息交互细化特征表示,提升深度估计表现,特别是光度一致性监督有限的弱纹理区域和物体边界.通过在KITTI数据集上的训练和全面评估,实验结果显示所提的USegDepth模型方法的均方相对误差相比于SGDepth降低了0.176个百分点,在阈值为1.253的阈值精度达到了98.4%,证明了USegDepth在深度预测上具有较高的准确率. 展开更多
关键词 自监督深度学习 深度估计 语义分割 多任务联合 共享编码器
下载PDF
基于卷积注意力引导的多路径语义分割网络
20
作者 冯晨阳 胡术 +1 位作者 张轶 易凯 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期71-82,共12页
为降低基于Transformer的语义分割模型的计算量,本文将眼光重新回到CNN模型,提出了MCAG,一种用于语义分割的多路径卷积注意力网络架构.在包含了注意力机制的前提下,利用多尺度卷积特征,通过简单的元素相乘来唤起空间注意力,降低了计算量... 为降低基于Transformer的语义分割模型的计算量,本文将眼光重新回到CNN模型,提出了MCAG,一种用于语义分割的多路径卷积注意力网络架构.在包含了注意力机制的前提下,利用多尺度卷积特征,通过简单的元素相乘来唤起空间注意力,降低了计算量,且多路径架构让模型对细节和边界的关注增加.MCAG能够从局部到全局获取多尺度上下文,实现自在空间和通道维度上适应性,从低到高聚合信息.MCAG提高了之前先进方法在流行基准上的性能,在ADE20K、Cityscapes、COCO-Stuff上分别达到了47.7%、82.51%、43.6%的mIoU.本文提出的MCAG在很大程度上提升了小物体的分割精准率,证明了卷积注意力机制与多路机制的融合是成功的. 展开更多
关键词 卷积注意力 多路径 深度学习 特征指导 语义分割
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部