期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
结合循环提取器与自蒸馏的目标检测方法
1
作者 仲林伟 陈丹伟 《计算机技术与发展》 2024年第4期70-75,共6页
在深度学习时代,目标检测方法不断发展,且在良好的视觉环境中已经具有较高的水平。但是,在特殊天气下,常规的目标检测方法的检测性能大幅下降,甚至失效,而特殊天气环境的行车安全一直是社会广泛关注的问题。为了解决上述问题,该文主要... 在深度学习时代,目标检测方法不断发展,且在良好的视觉环境中已经具有较高的水平。但是,在特殊天气下,常规的目标检测方法的检测性能大幅下降,甚至失效,而特殊天气环境的行车安全一直是社会广泛关注的问题。为了解决上述问题,该文主要设计了一个目标检测器的模型,即引入循环解纠缠、自蒸馏方法的改进YOLO模型。在循环解纠缠模块,从输入图像中循环提取域不变特征,通过循环操作,可以在不依赖域相关注释的情况下,提高图像域特征和域不变特征的解缠能力;在自蒸馏模块,以提取到的域不变特征为教师对象,进一步提高泛化能力。并且该检测器在只有一个源域进行训练的情况下,面对许多未曾训练过的目标域上仍然表现良好,提高了检测器在未知域的鲁棒性。实验验证了模型在各种天气下城市场景目标检测的效果,实验数据表明,该方法优于基线约8百分点,相比基线方法获得了性能提升。 展开更多
关键词 深度学习 目标检测 特殊天气 循环解纠缠 自蒸馏 域不变特征
下载PDF
基于尺度注意知识迁移的自蒸馏目标分割方法
2
作者 王晓兵 张雄伟 +2 位作者 曹铁勇 郑云飞 王勇 《计算机应用》 CSCD 北大核心 2024年第1期129-137,共9页
当前的目标分割模型难以兼顾分割性能与推断效率,为此提出一种基于尺度注意知识迁移的自蒸馏目标分割方法。首先,构建了一个仅利用主干特征的目标分割网络作为推断网络,实现高效的前向推断过程。其次,提出了一种基于尺度注意知识的自蒸... 当前的目标分割模型难以兼顾分割性能与推断效率,为此提出一种基于尺度注意知识迁移的自蒸馏目标分割方法。首先,构建了一个仅利用主干特征的目标分割网络作为推断网络,实现高效的前向推断过程。其次,提出了一种基于尺度注意知识的自蒸馏学习模型:一方面,设计了具有尺度注意机制的金字塔特征模块,利用尺度注意机制自适应地捕获不同语义水平的上下文信息,提取更具区分性的自蒸馏知识;另一方面,融合交叉熵、KL(Kullback-Leibler)散度和L2距离构造蒸馏损失,高效驱动蒸馏知识向分割网络迁移,提升泛化性能。该方法在COD(Camouflaged Object Detection)、DUT-O(Dalian University of Technology-OMRON)、SOC(Salient Objects in Clutter)等五个目标分割数据集上进行了验证:将所提推断网络作为基准网络,所提自蒸馏模型分割性能在Fβ指标上平均提升3.01%,比免教师(TF)自蒸馏模型增加了1.00%;所提网络与近期的残差分割网络(R2Net)相比,参数量减少了2.33×10^(6),推断帧率提升了2.53%,浮点运算量减少了40.50%,分割性能提升了0.51%。实验结果表明:所提方法能有效兼顾性能与效率,适用于计算和存储资源受限的应用场景。 展开更多
关键词 自蒸馏 目标分割 知识迁移 尺度注意机制 金字塔知识表示
下载PDF
基于自蒸馏和双模态的室内场景解析算法
3
作者 张喻铭 周武杰 叶绿 《浙江科技学院学报》 CAS 2024年第3期218-227,270,共11页
【目的】为了使室内机器人能准确地识别室内不同类别的物体,从而选择更安全可行的路线,提出一种用于室内场景解析的基于自蒸馏和双模态的自蒸馏多级级联网络(self-distillation multi-stage cascaded network,SMCNet)。【方法】首先,使... 【目的】为了使室内机器人能准确地识别室内不同类别的物体,从而选择更安全可行的路线,提出一种用于室内场景解析的基于自蒸馏和双模态的自蒸馏多级级联网络(self-distillation multi-stage cascaded network,SMCNet)。【方法】首先,使用分割变换器(segmentation transformer,SegFormer)作为骨干网络以双流的方式分别提取三色图(red green blue,RGB)和深度图中的特征信息,得到4组特征输出;其次,设计了特征增强模块(feature enhancement module,FEM),将这四组特征进行特征增强后分组融合,以充分提取双模态特征中的有用信息并充分交融;最后,设计了自蒸馏监督模块(self-distillation supervision module,SSM),通过自蒸馏方法将高层特征中的有价值信息传递到低层特征中,并设计了多级级联监督模块(multi-stage cascaded supervision module,MCSM)进行跨层监督,得到最终的预测图。【结果】在室内场景双模态数据集纽约大学深度版本2(New York University Depth version 2,NYUDv2)和场景理解彩色-深度(scene understanding red green blue-depth,SUN RGB-D)上,相比已有的方法,本研究提出的模型在相同条件下得到的结果超过其他方法,均值交并比(mean intersection over union,MIoU)在NYUDv2和SUN RGB-D两个数据集上分别达到了57.3%和53.1%。【结论】SMCNet能比较准确地解析出室内场景中不同类别的物体,可为室内机器人获取室内视觉信息提供一定的技术支撑。 展开更多
关键词 室内场景解析 自蒸馏 多级级联 双模态
下载PDF
多层次知识自蒸馏联合多步骤训练的细粒度图像识别
4
作者 余鹰 危伟 +1 位作者 汤洪 钱进 《计算机研究与发展》 EI CSCD 北大核心 2023年第8期1834-1845,共12页
细粒度图像识别具有类内差异大、类间差异小的特点,在智能零售、生物多样性检测和智慧交通等领域中有着广阔的应用场景.提取到判别性强的多粒度特征是提升细粒度图像识别精度的关键,而已有工作大多只在单一层次进行知识获取,忽略了多层... 细粒度图像识别具有类内差异大、类间差异小的特点,在智能零售、生物多样性检测和智慧交通等领域中有着广阔的应用场景.提取到判别性强的多粒度特征是提升细粒度图像识别精度的关键,而已有工作大多只在单一层次进行知识获取,忽略了多层次信息交互对于提取鲁棒性特征的有效性.另外一些工作通过引入注意力机制来找到局部判别区域,但这不可避免地增加了网络复杂度.为了解决这些问题,提出了多层次知识自蒸馏联合多步骤训练的细粒度图像识别(multi-level knowledge self-distillation with multi-step training for fine-grained image recognition, MKSMT)模型.该模型首先在网络浅层进行特征学习,然后在深层网络再次进行特征学习,并利用知识自蒸馏将深层网络知识迁移至浅层网络中,优化后的浅层网络又能帮助深层网络提取到更鲁棒的特征,进而提高整个模型的性能.实验结果表明,MKSMT在CUB-200-2011、 NA-Birds和Stanford Dogs这3个公开细粒度图像数据集上分别达到了92.8%、 92.6%和91.1%的分类准确度,性能优于当前大部分细粒度识别算法. 展开更多
关键词 细粒度图像识别 知识自蒸馏 Swin Transformer 特征学习 鲁棒特征
下载PDF
基于相似一致性的模型自蒸馏方法
5
作者 万旭 毛莺池 +2 位作者 王孜博 刘意 平萍 《计算机科学》 CSCD 北大核心 2023年第11期259-268,共10页
针对传统自蒸馏方法存在数据预处理成本高、局部特征检测缺失,以及模型分类精度低的情况,提出了基于相似一致性的模型自蒸馏方法(Similarity and Consistency by Self-Distillation,SCD),提高模型分类精度。首先,对样本图像的不同层进... 针对传统自蒸馏方法存在数据预处理成本高、局部特征检测缺失,以及模型分类精度低的情况,提出了基于相似一致性的模型自蒸馏方法(Similarity and Consistency by Self-Distillation,SCD),提高模型分类精度。首先,对样本图像的不同层进行学习得到特征图,通过特征权值分布获取注意力图。然后,计算Mini-batch内样本间注意力图的相似性获得相似一致性知识矩阵,构建基于相似一致性的知识,使得无须对实例数据进行失真处理或提取同一类别的数据来获取额外的实例间知识,避免了大量的数据预处理工作带来的训练成本高和训练复杂的问题。最后,将相似一致性知识矩阵在模型中间层之间单向传递,让浅层次的相似矩阵模仿深层次的相似矩阵,细化低层次的相似性,捕获更加丰富的上下文场景和局部特征,解决局部特征检测缺失问题,实现单阶段单向知识转移的自蒸馏。实验结果表明,采用基于相似一致性的模型自蒸馏方法:在公开数据集CIFAR100和TinyImageNet上,验证了SCD提取的相似一致性知识在模型自蒸馏中的有效性,相较于自注意力蒸馏方法(Self Attention Distillation,SAD)和保持相似性的知识蒸馏方法(Similarity-Preserving Knowledge Distillation,SPKD),分类精度平均提升1.42%;相较于基于深度监督的自蒸馏方法(Be Your Own Teacher,BYOT)和动态本地集成知识蒸馏方法(On-the-fly Native Ensemble,ONE),分类精度平均提升1.13%;相较于基于深度神经网络的数据失真引导自蒸馏方法(Data-Distortion Guided Self-Distillation,DDGSD)和基于类间的自蒸馏方法(Class-wise Self-Knowledge Distillation,CS-KD),分类精度平均提升1.23%。 展开更多
关键词 知识蒸馏 知识表达 自蒸馏 相似一致性 知识矩阵
下载PDF
基于金字塔知识的自蒸馏HRNet目标分割方法 被引量:1
6
作者 郑云飞 王晓兵 +2 位作者 张雄伟 曹铁勇 孙蒙 《电子学报》 EI CAS CSCD 北大核心 2023年第3期746-756,共11页
知识蒸馏能有效地将教师网络的表征能力迁移到学生网络,无须改变网络结构即可提升网络的性能.因此,在性能优异的目标分割主干网HRNet(High-Resolution Net)中构建自蒸馏学习模型具有重要意义.针对HRNet并行结构中深层与浅层信息充分融... 知识蒸馏能有效地将教师网络的表征能力迁移到学生网络,无须改变网络结构即可提升网络的性能.因此,在性能优异的目标分割主干网HRNet(High-Resolution Net)中构建自蒸馏学习模型具有重要意义.针对HRNet并行结构中深层与浅层信息充分融合导致直接蒸馏难以实现的挑战,本文提出一种基于多尺度池化金字塔的结构化自蒸馏学习模型:在HRNet分支结构中引入多尺度池化金字塔表示模块,提升网络的知识表示和学习能力;构造“自上而下”和“一致性”两种蒸馏模式;融合交叉熵损失、KL(Kullback-Leibler)散度损失和结构化相似性损失进行自蒸馏学习.在四个包含显著性目标和伪装目标的分割数据集上的实验表明:本文模型在不增加资源开销的前提下,有效提升了网络的目标分割性能. 展开更多
关键词 自蒸馏学习 并行结构网络 多尺度池化金字塔 结构化相似性 目标分割
下载PDF
基于知识自蒸馏的轻量化复杂遥感图像精细分类方法 被引量:2
7
作者 孙显 杨竹君 +2 位作者 李俊希 刁文辉 付琨 《指挥与控制学报》 CSCD 2021年第4期365-373,共9页
基于遥感图像开展地物要素分类和提取,是构建数字化战场环境的技术基础,面临着场景多变、类别多样、噪声干扰等挑战.经典深度学习模型结构复杂、计算量大,难以满足低性能、低功耗边缘计算环境下的实时信息处理要求.提出了一种基于知识... 基于遥感图像开展地物要素分类和提取,是构建数字化战场环境的技术基础,面临着场景多变、类别多样、噪声干扰等挑战.经典深度学习模型结构复杂、计算量大,难以满足低性能、低功耗边缘计算环境下的实时信息处理要求.提出了一种基于知识自蒸馏的轻量化复杂遥感图像精细分类方法,通过构建一步式自蒸馏框架,实现网络从高层到低层的知识迁移.同时通过金字塔池化融合不同尺度的特征信息,显著提升全局上下文信息的利用率,解决轻量化分类模型由于参数较少、复杂度低,导致场景精细分类精度低的难题.在Vaihingen等公开遥感数据集和我国高分遥感数据集上开展实验,较国际同类方法具有更优的分类性能. 展开更多
关键词 遥感图像 轻量化模型 语义分割 知识自蒸馏 金字塔池化
下载PDF
基于多分辨率自蒸馏网络的小样本图像分类 被引量:2
8
作者 仇真 奚雪峰 +2 位作者 崔志明 盛胜利 胡伏原 《计算机工程》 CAS CSCD 北大核心 2022年第12期232-240,共9页
因图像数据具有大量的空间冗余信息,传统的多分辨率网络在处理图像数据时会产生较高的计算成本。而自蒸馏学习方法能够在精度与计算成本之间实现动态平衡,使模型在不增加网络深度和宽度的基础上,有效地提高模型精度。提出一种多分辨率... 因图像数据具有大量的空间冗余信息,传统的多分辨率网络在处理图像数据时会产生较高的计算成本。而自蒸馏学习方法能够在精度与计算成本之间实现动态平衡,使模型在不增加网络深度和宽度的基础上,有效地提高模型精度。提出一种多分辨率自蒸馏网络(MRSDN),用于解决小样本学习中输入样本的空间冗余问题。从原始网络中分出一个浅层子网络以识别图像的低分辨率表示,并且保持该原始网络识别高分辨率图像特征的能力。同时,在多分辨率网络中引入改进的全局注意力机制,以减少信息损失且放大全局交互表示。利用自蒸馏学习方法将网络中更深层的知识压缩到浅层子网络中,以提升浅层子网络的泛化能力。在此基础上,将低分辨率网络中的粗粒度特征融合到高分辨率网络中,从而提高模型提取图像特征的能力。实验结果表明,在Mini-ImageNet数据集上MRSDN网络对5-way 1-shot与5-way 5-shot任务的准确率分别为56.34%和74.35%,在Tiered-ImageNet数据集上对5-way 1-shot与5-way 5-shot任务的准确率分别为59.56%和78.96%,能有效缓解高分辨率图像输入时的空间冗余问题,提高小样本图像分类的准确率。 展开更多
关键词 自蒸馏学习 小样本学习 多分辨率网络 空间冗余 全局注意力
下载PDF
一种基于自蒸馏的自适应恶意流量分类算法
9
作者 潘嘉 翟江涛 《软件导刊》 2022年第5期61-66,共6页
针对目前已有文献中深度网络无法依据流量样本自适应选择网络层的问题,提出一种基于自蒸馏的自适应恶意流量分类算法。该方法首先将原始流量预处理后作为主干网络的输入,经自注意力网络层构建流量的权重分布,然后利用一维卷积神经网络... 针对目前已有文献中深度网络无法依据流量样本自适应选择网络层的问题,提出一种基于自蒸馏的自适应恶意流量分类算法。该方法首先将原始流量预处理后作为主干网络的输入,经自注意力网络层构建流量的权重分布,然后利用一维卷积神经网络提取流量分布中的显著特征作为后续网络输入。分支网络计算流量样本的熵值自适应选择网络层,若小于设定阈值则提前返回,否则由主干网络继续进行推理。经实验验证,该方法对于正常流量的平均检测率为99.9%,恶意流量的平均检测率为99.96%。恶意流量检测率较现有深度学习典型算法的检测率提升了2%,难样本检测率提升5%,且分支网络具有自适应功能,可避免后续的网络推理。 展开更多
关键词 恶意流量 自蒸馏 自注意力机制 自适应
下载PDF
基于多分支退出的自蒸馏方法研究
10
作者 邹美霞 《现代计算机》 2022年第12期1-8,共8页
随着卷积神经网络的快速发展,研究者不断加深或加宽网络的结构以追求更高精度,但这种方式会带来延迟和计算成本的增加。在带有多分支结构的自蒸馏方法中存在浅层网络不能充分学习深层网络性能的问题。因此,提出一种基于多分支的自蒸馏方... 随着卷积神经网络的快速发展,研究者不断加深或加宽网络的结构以追求更高精度,但这种方式会带来延迟和计算成本的增加。在带有多分支结构的自蒸馏方法中存在浅层网络不能充分学习深层网络性能的问题。因此,提出一种基于多分支的自蒸馏方法(SDA),将网络中所有分支的集成结果作为教师指导最后分支的输出,同时用最后分支输出指导其他分支,使得模型更好更早地退出网络。实验结果表明,该方法在ResNet一系列模型上取得了0.46%~1.51%的精度提升。 展开更多
关键词 卷积神经网络 多分支结构 自蒸馏方法 模型早退
下载PDF
基于自蒸馏的热轧带钢表面缺陷识别
11
作者 李秋雨 李维刚 田志强 《中国冶金》 CAS CSCD 北大核心 2024年第2期126-133,共8页
表面缺陷检测是热轧带钢生产过程中十分重要的环节,是提高热轧带钢产品质量的关键。首先,针对当前带钢表面缺陷图像形貌多样、干扰多以及检测算法精度有待提高的问题,设计了一种自蒸馏框架(Self-knowledge Distillation,SD)来提高模型... 表面缺陷检测是热轧带钢生产过程中十分重要的环节,是提高热轧带钢产品质量的关键。首先,针对当前带钢表面缺陷图像形貌多样、干扰多以及检测算法精度有待提高的问题,设计了一种自蒸馏框架(Self-knowledge Distillation,SD)来提高模型的缺陷检测精度,通过采用几何变换、色彩增强和图像线性插值的数据增强方法,增加样本数据的表征信息;从标签的概率分布和接近程度两方面提出了新的损失函数(LCK Loss),使模型能更好地学习样本提供的知识,实现相同数据不同表征间的信息传递,进而提高模型的泛化能力。其次,将Poolformer网络应用到热轧带钢表面缺陷检测中,针对Poolformer12网络参数量多的问题,设计了轻量化网络LRAM-Poolformer8,通过减少网络层数和计算量,实现模型加速的目的。最后,在武钢CSP机组的8类带钢表面缺陷数据集上进行了试验,结果表明,所提SD-LRAM-Poolformer8模型的平均识别精度为98.20%,相较于Poolformer12,检测精度提高了1.62个百分点,且计算量仅为原来的56.4%,这证明了新模型在热轧带钢表面缺陷检测中的可行性与有效性。 展开更多
关键词 热轧带钢 表面缺陷检测 自蒸馏 轻量化网络 深度学习
原文传递
一种自蒸馏的轻量化图像分类网络方案
12
作者 倪水平 马新良 《北京邮电大学学报》 EI CSCD 北大核心 2023年第6期66-71,共6页
图像分类任务经常通过压缩神经网络模型以减少参数量,导致分类准确率下降。对此,提出了一种自蒸馏的轻量化图像分类网络方案。首先,在自蒸馏框架内引入计算量和参数量可忽略的轻量注意力模块,减少自蒸馏框架的参数量与计算量,从而实现... 图像分类任务经常通过压缩神经网络模型以减少参数量,导致分类准确率下降。对此,提出了一种自蒸馏的轻量化图像分类网络方案。首先,在自蒸馏框架内引入计算量和参数量可忽略的轻量注意力模块,减少自蒸馏框架的参数量与计算量,从而实现自蒸馏框架轻量化;然后,采用分组卷积与深度可分离卷积对残差网络和VGG11网络进行模型压缩,再把压缩后的2个神经网络作为教师模型,根据教师模型的深度,构建多个作为学生模型的浅层分类器,搭建轻量自蒸馏框架。实验结果表明,所提方案不仅确保原自蒸馏的效果,压缩后的图像分类网络在不低于原分类准确率的基础上,参数量极大减少,并降低模型部署的难度。 展开更多
关键词 图像分类 神经网络 模型压缩 自蒸馏
原文传递
融合抗噪和双重蒸馏的文本分类方法
13
作者 郭伟 黄嘉晖 +1 位作者 侯晨煜 曹斌 《计算机科学》 CSCD 北大核心 2023年第6期251-260,共10页
文本分类是自然语言处理中重要且经典的问题,常被应用于新闻分类、情感分析等场景。目前,基于深度学习的分类方法已经取得了较大的成功,但在实际应用中仍然存在以下3个方面的问题:1)现实生活中的文本数据存在大量的噪声标签,直接用这些... 文本分类是自然语言处理中重要且经典的问题,常被应用于新闻分类、情感分析等场景。目前,基于深度学习的分类方法已经取得了较大的成功,但在实际应用中仍然存在以下3个方面的问题:1)现实生活中的文本数据存在大量的噪声标签,直接用这些数据训练模型会严重影响模型的性能;2)随着预训练模型的提出,模型分类准确率有所提升,但模型的规模和推理计算量也随之提升明显,使得在资源有限的设备上使用预训练模型成为一项挑战;3)预训练模型存在大量的冗余计算,当数据量较大时会导致模型出现预测效率低下的问题。针对上述问题,提出了一个融合抗噪和双重蒸馏(包括知识蒸馏和自蒸馏)的文本分类方法,通过基于置信学习的阈值抗噪方法和一种新的主动学习样例选择算法,以少量的标注成本提升数据的质量。同时,通过知识蒸馏结合自蒸馏的方式,减小了模型规模和冗余计算,进而使其可以根据需求灵活调整推理速度。在真实数据集上进行了大量实验来评估该方法的性能,实验结果表明所提方法在抗噪后准确率提升了1.18%,在较小的精度损失下相比BERT可以加速4~8倍。 展开更多
关键词 噪声标签 置信学习 主动学习 知识蒸馏 自蒸馏
下载PDF
特征自蒸馏机制下的弱监督目标检测 被引量:1
14
作者 高文龙 陈莹 彭勇 《激光与光电子学进展》 CSCD 北大核心 2023年第4期148-157,共10页
目前基于图像级注释信息的主流弱监督目标检测算法常常出现局部定位问题,仅仅关注图像中局部高辨别性的区域,却忽略了完整的目标。为了解决这种问题,提出了一种端对端的基于特征自蒸馏的弱监督目标检测网络(FSDNet),其中可拆卸的特征自... 目前基于图像级注释信息的主流弱监督目标检测算法常常出现局部定位问题,仅仅关注图像中局部高辨别性的区域,却忽略了完整的目标。为了解决这种问题,提出了一种端对端的基于特征自蒸馏的弱监督目标检测网络(FSDNet),其中可拆卸的特征自蒸馏模块充分利用不同层级特征表示中的细节信息和语义信息,并通过特征自蒸馏损失约束网络训练,在未增加测试期计算代价的前提下增强了检测器综合性能;同时构造回归分支简单却有效地提取并利用特征中隐性位置信息,并通过改善监督信息生成算法、平衡优化损失等策略进一步改善了弱监督目标检测器的局部定位问题。在Pascal VOC 2007、VOC 2012、MS-COCO等大规模公开数据集上的实验结果表明,FSD-Net拥有比Baseline及近年主流方法更好的检测性能,有效地缓解了局部定位问题。 展开更多
关键词 图像处理 目标检测 深度学习 弱监督学习 特征自蒸馏
原文传递
基于沙漏注意力高分辨率网络的人体姿态评估实验
15
作者 云霄 褚菲 +1 位作者 张晓光 程小舟 《实验室研究与探索》 CAS 北大核心 2024年第1期204-208,222,共6页
基于人体关键点检测的方法需要融合由高分辨率到低分辨率子网络生成的表示,以提高关键点检测的准确性。设计了一种基于沙漏注意力高分辨率网络的人体姿态评估方法实验,在深度高分辨率表示学习的基础上构建沙漏注意力特征模块,并设计特... 基于人体关键点检测的方法需要融合由高分辨率到低分辨率子网络生成的表示,以提高关键点检测的准确性。设计了一种基于沙漏注意力高分辨率网络的人体姿态评估方法实验,在深度高分辨率表示学习的基础上构建沙漏注意力特征模块,并设计特征回传模块和多阶段监督算法,用融合中继监督和自蒸馏的方式实现高分辨率网络的监督训练。与经典方法在标准数据集上完成人体姿态评估实验对比,并在硬件设备上进行了真实场景实验,实现了行人姿态评估和危险行为报警。 展开更多
关键词 人体姿态评估 关键点检测 注意力机制 自蒸馏 多阶段监督
下载PDF
基于自注意力连接UNet的磁共振成像去吉布斯伪影算法
16
作者 刘阳 陆志扬 +1 位作者 王骏 施俊 《计算机应用》 CSCD 北大核心 2023年第5期1606-1611,共6页
为去除磁共振成像(MRI)中的吉布斯伪影,提出一种基于自蒸馏训练的自注意力连接UNet(SDSacUNet)算法。为了缩小UNet框架中跳连接两端编码和解码特征之间的语义差距,帮助捕捉伪影的位置信息,将UNet编码端每个下采样层的输出特征分别输入... 为去除磁共振成像(MRI)中的吉布斯伪影,提出一种基于自蒸馏训练的自注意力连接UNet(SDSacUNet)算法。为了缩小UNet框架中跳连接两端编码和解码特征之间的语义差距,帮助捕捉伪影的位置信息,将UNet编码端每个下采样层的输出特征分别输入各自的自注意力连接模块进行自注意力机制的运算,而后与解码特征进行融合,参与特征的重建;在网络解码端进行自蒸馏训练,通过建立深层与浅层特征之间的损失函数,使深层重建网络的特征信息可以用于指导浅层网络的训练,同时优化整个网络,提升图像重建水平。在公开的MRI数据集CC359上评估SD-SacUNet算法的性能,获得的峰值信噪比(PSNR)为30.26 dB,结构相似性(SSIM)为0.9179;与GRACNN(Gibbs-Ringing Artifact reduction using Convolutional Neural Network)、SwinIR(Image Restoration using Swin Transformer)相比,SD-SacUNet的PSNR分别提高了0.77 dB、0.14 dB,SSIM分别提高了0.0183、0.0033。实验结果表明,SD-SacUNet算法提升了MRI去除吉布斯伪影的图像重建性能,具备潜在的应用价值。 展开更多
关键词 磁共振成像重建 深度学习 自蒸馏 TRANSFORMER UNet 注意力机制
下载PDF
基于ResNet-50的级联注意力遥感图像分类
17
作者 宋冠武 陈知明 李建军 《广西师范大学学报(自然科学版)》 CAS 北大核心 2023年第6期80-91,共12页
知识蒸馏能提高神经网络的泛化能力,可解决遥感图像场景分类时标注数据不足的问题。遥感图像存在的类间高相似性会导致中间知识特征丢失,针对该问题,本文提出一种基于自蒸馏级联注意力机制的特征提取方法(SDCASA)。首先构造权值共享的... 知识蒸馏能提高神经网络的泛化能力,可解决遥感图像场景分类时标注数据不足的问题。遥感图像存在的类间高相似性会导致中间知识特征丢失,针对该问题,本文提出一种基于自蒸馏级联注意力机制的特征提取方法(SDCASA)。首先构造权值共享的教师、学生网络;然后使用级联注意力模块精细化深层教师网络所提取到的特征,同时保留被浅层神经网络过滤的中间边缘信息;再利用精细化之后的特征指导学生网络学习;最后在下游训练一个线性分类器完成特征分类。在3个公开数据集AID、MLRSNet、EuroSAT上使用20%和50%的样本训练,分类准确率分别达到85.17%、90.10%、91.13%和85.50%、92.13%、91.17%。此方法能有效提高遥感图像场景分类准确率,性能优于主流自监督图像分类方法SimSiam、SwAV、MoCov2、Deepcluster,具有良好的应用价值。 展开更多
关键词 自蒸馏 注意力机制 遥感图像 自监督学习 图像分类
下载PDF
基于带噪预训练的刑期预测方法
18
作者 郑洁 黄辉 秦永彬 《广西科学》 CAS 北大核心 2023年第1期71-78,共8页
刑期预测模型利用自然语言处理技术自动预测当前案件的建议刑期,对提高司法工作效率,维护司法审判的公平与公正,以及实现同案同判具有重要意义。现有的研究通常采用基于预训练语言模型的方法进行刑期预测建模,但由于存在裁判文书文本较... 刑期预测模型利用自然语言处理技术自动预测当前案件的建议刑期,对提高司法工作效率,维护司法审判的公平与公正,以及实现同案同判具有重要意义。现有的研究通常采用基于预训练语言模型的方法进行刑期预测建模,但由于存在裁判文书文本较长、专业性强及部分案由标注数据不足等问题,刑期预测任务依然具有较强的挑战性。针对上述问题,本文提出了基于带噪预训练的刑期预测方法。首先,根据刑期预测任务的特点,设计了融合罪名信息的刑期预测模型;其次,结合遮蔽语言模型(Masked Language Model,MLM)任务和自蒸馏策略减少刑期预测任务预训练数据中噪声的影响;最后,改进RoBERTa-wwm模型中的位置嵌入,增强模型的长文本建模能力。实验结果表明,本文提出的预训练方法能够极大地提升刑期预测任务的准确率,在小样本条件下也具有很好的表现。 展开更多
关键词 刑期预测 语言模型 自蒸馏 长文本建模 预训练
下载PDF
用于肺水肿量化的掩码图像-语言蒸馏模型
19
作者 卢得民 钟诚 杨锋 《基因组学与应用生物学》 CAS CSCD 北大核心 2024年第2期274-283,共10页
肺水肿量化是治疗急性充血性心力衰竭(congestive heart failure,CHF)的关键。用于视觉和语言预训练的多模态掩码自编码器已被证实可有效融合胸片和肺水肿放射学报告的多模态信息以提升肺水肿量化精度。但现有的方法是随机地对图像和文... 肺水肿量化是治疗急性充血性心力衰竭(congestive heart failure,CHF)的关键。用于视觉和语言预训练的多模态掩码自编码器已被证实可有效融合胸片和肺水肿放射学报告的多模态信息以提升肺水肿量化精度。但现有的方法是随机地对图像和文本进行掩码操作,这一不稳定的操作容易导致模型忽略图像病灶和文本关键词,并阻碍多模态信息的融合与对齐,最终影响量化精度。针对上述问题,本研究设计了一种掩码图像-语言蒸馏模型,首次将自蒸馏引入到医学图像-语言预训练任务中,使得模型获得更为稳定可靠的医学图像和语言表示;并对跨模态注意力融合机制进行优化,使得模型更好地融合与对齐多模态信息。相比于101层残差神经网络(residual network 101,ResNet101)、视觉Transformer(vision transformer,ViT)-B/16、联合胸片和肺水肿放射学报告建模(joint modeling of chest radiographs and radiology reports for pulmonary edema assessment,JMC3R)和用于视觉和语言预训练的多模态掩码自编码器(multi-modal masked autoencoders for medical vision and language pre-training,M3AE),本研究所提出的方法在肺水肿量化数据集(pulmonary edemaassessmentdataset,PEAD)上获得了更高的肺水肿量化精度。 展开更多
关键词 肺水肿 自蒸馏 掩码建模 多模态 注意力机制
原文传递
采用CNN-SSD的雷达HRRP小样本目标识别方法 被引量:7
20
作者 郭泽坤 田隆 +3 位作者 韩宁 王鹏辉 刘宏伟 陈渤 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2021年第2期7-14,共8页
雷达高分辨距离像非合作目标识别技术的发展主要受限于两个方面:一是由于非合作目标观测频率极低,导致带标签样本量严重不足,使非合作目标识别成为典型的小样本识别问题,这在学界依然是一个没有定论的开放性的热点和难点问题;二是现有... 雷达高分辨距离像非合作目标识别技术的发展主要受限于两个方面:一是由于非合作目标观测频率极低,导致带标签样本量严重不足,使非合作目标识别成为典型的小样本识别问题,这在学界依然是一个没有定论的开放性的热点和难点问题;二是现有的目标识别方法多基于完备数据集假设,使得其与非合作目标小样本目标识别问题严重失配。针对上述问题,对于非合作目标识别抛开数据集完备假设,提出了一种采用卷积神经网络模型连续自蒸馏的雷达高分辨距离像小样本目标识别方法。该方法首先利用包含45类合作目标的完备的训练数据集训练,得到一个初始的类别无关的特征提取器;基于此,进一步采用模型连续自蒸馏机制得到更具泛化能力的特征提取器;最后,在非合作目标上对所提取特征的泛化能力进行了测试。实验结果表明,对于5类非合作目标,所提方法在仅有1个、5个和10个训练样本的情况下,平均识别率分别达到61.26%,84.69%和92.52%,实现了对库外样本的快速、有效识别。 展开更多
关键词 雷达目标识别 小样本学习 特征提取 高分辨距离像 卷积神经网络 连续自蒸馏
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部