期刊文献+
共找到1,633篇文章
< 1 2 82 >
每页显示 20 50 100
基于分歧的半监督学习 被引量:87
1
作者 周志华 《自动化学报》 EI CSCD 北大核心 2013年第11期1871-1878,共8页
传统监督学习通常需使用大量有标记的数据样本作为训练例,而在很多现实问题中,人们虽能容易地获得大批数据样本,但为数据提供标记却需耗费很多人力物力.那么,在仅有少量有标记数据时,可否通过对大量未标记数据进行利用来提升学习性能呢... 传统监督学习通常需使用大量有标记的数据样本作为训练例,而在很多现实问题中,人们虽能容易地获得大批数据样本,但为数据提供标记却需耗费很多人力物力.那么,在仅有少量有标记数据时,可否通过对大量未标记数据进行利用来提升学习性能呢?为此,半监督学习成为近十多年来机器学习的一大研究热点.基于分歧的半监督学习是该领域的主流范型之一,它通过使用多个学习器来对未标记数据进行利用,而学习器间的"分歧"对学习成效至关重要.本文将综述简介这方面的一些研究进展. 展开更多
关键词 机器学习 监督学习 基于分歧的半监督学习 未标记数据
下载PDF
基于半监督学习的网络异常检测研究综述 被引量:1
2
作者 张浩 谢大智 +1 位作者 胡云晟 叶骏威 《信息网络安全》 CSCD 北大核心 2024年第4期491-508,共18页
网络流量数据的获取较为容易,而对流量数据进行标记相对困难。半监督学习利用少量有标签数据和大量无标签数据进行训练,减少了对有标签数据的需求,能较好适应海量网络流量数据下的异常检测。文章对近年来的半监督网络异常检测领域的论... 网络流量数据的获取较为容易,而对流量数据进行标记相对困难。半监督学习利用少量有标签数据和大量无标签数据进行训练,减少了对有标签数据的需求,能较好适应海量网络流量数据下的异常检测。文章对近年来的半监督网络异常检测领域的论文进行深入调研。首先,介绍了一些基本概念,并深入剖析了网络异常检测中使用半监督学习策略的必要性;然后,从半监督机器学习、半监督深度学习和半监督学习结合其他范式三个方面,分析和比较了半监督网络异常检测领域近年来的论文,并进行归纳和总结;最后,对当前半监督网络异常检测领域进行了现状分析和未来展望。 展开更多
关键词 监督学习 标签稀缺 入侵检测 异常检测
下载PDF
基于图半监督与多任务学习的配电网故障区段与类型统一辨识 被引量:1
3
作者 梁栋 赵月梓 +1 位作者 贺国润 陈海文 《电力系统保护与控制》 EI CSCD 北大核心 2024年第12期25-32,共8页
为解决深度学习类配电网故障辨识方法在量测不足和标记率低时准确率不高的问题,提出了基于图半监督与多任务学习的故障区段与类型统一辨识方法。首先,设计了故障区段与类型统一辨识的图神经网络架构,在图嵌入层中融入网络拓扑和线路参... 为解决深度学习类配电网故障辨识方法在量测不足和标记率低时准确率不高的问题,提出了基于图半监督与多任务学习的故障区段与类型统一辨识方法。首先,设计了故障区段与类型统一辨识的图神经网络架构,在图嵌入层中融入网络拓扑和线路参数信息,以充分挖掘不同位置、类型的故障特征。其次,采用多任务注意力网络构建了故障区段定位和类型辨识两个任务,以提取故障的多重信息,实现不同任务间知识转移。再次,将图嵌入特征与无标签样本的编码压缩特征进行融合,得到新的多任务共享特征,以充分利用未标记数据,增强模型泛化能力。最后,通过算例测试表明,所提方法的故障辨识精度优于传统神经网络,且在实时量测少、标签率低及不同量测噪声条件下具有更好的鲁棒性。 展开更多
关键词 监督学习 多任务学习 图神经网络 故障辨识 配电网
下载PDF
非独立同分布下联邦半监督学习的数据分享研究
4
作者 顾永跟 高凌轩 +1 位作者 吴小红 陶杰 《计算机工程》 CAS CSCD 北大核心 2024年第6期188-196,共9页
联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标... 联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标签数据提升系统性能和如何缓解数据异质性带来的负面影响是两大挑战。针对标签数据仅在服务器场景,基于分享的思想,设计一种可应用在联邦半监督学习系统上的方法Share&Mark,该方法将客户端的分享数据由专家标记后参与联邦训练。同时,为充分利用分享的数据,根据各客户端模型在服务器数据集上的损失值动态调整各客户端模型在联邦聚合时的占比,即ServerLoss聚合算法。综合考虑隐私牺牲、通信开销以及人工标注成本3个方面的因素,对不同分享率下的实验结果进行分析,结果表明,约3%的数据分享比例能平衡各方面因素。此时,采用Share&Mark方法的联邦半监督学习系统FedMatch在CIFAR-10和Fashion-MNIST数据集上训练的模型准确率均可提升8%以上,并具有较优的鲁棒性。 展开更多
关键词 联邦监督学习 联邦学习 数据非独立同分布 鲁棒性 聚合算法 数据分享
下载PDF
课程学习指导下的半监督目标检测框架
5
作者 张英俊 李牛牛 +2 位作者 谢斌红 张睿 陆望东 《计算机应用》 CSCD 北大核心 2024年第8期2326-2333,共8页
为了提高伪标签的质量,解决半监督目标检测(SSOD)中的确认偏差问题,并针对现有算法中忽视无标注数据复杂性导致错误伪标签的难点,提出一种课程学习(CL)指导下的SSOD框架,该框架主要由ICSD(IoUConfidence-Standard-Deviation)难度测量器... 为了提高伪标签的质量,解决半监督目标检测(SSOD)中的确认偏差问题,并针对现有算法中忽视无标注数据复杂性导致错误伪标签的难点,提出一种课程学习(CL)指导下的SSOD框架,该框架主要由ICSD(IoUConfidence-Standard-Deviation)难度测量器和BP(Batch-Package)训练调度器这2个模块组成。其中,ICSD难度测量器综合考虑了伪边界框之间的交并比(IoU)、置信度、类别标签等信息,并引入C_IOU(Checkpoint_IOU)方法评估无标注数据的可靠性;BP训练调度器设计2种高效调度策略,分别从Batch和Package角度出发,优先选择可靠性指标高的无标记数据,实现以CL的方式充分利用整个无标记数据集。在Pascal VOC和MS-COCO数据集上的广泛对比实验结果表明,所提框架不仅适用于现有的SSOD算法,而且检测精度和稳定性都得到显著提升。 展开更多
关键词 监督学习 目标检测 课程学习 训练策略 难度测量器 训练调度器
下载PDF
一种双通道半监督网络表示学习模型
6
作者 杜航原 谢富中 +1 位作者 王文剑 白亮 《大数据》 2024年第4期106-120,共15页
在半监督网络表示学习中,节点标签对于网络在不同空间中映射关系的建立具有重要指导意义。然而在很多实际任务中,可用标签信息往往比较有限或难以获取,这导致在学习网络低维表示的过程中无法提供充分有效的监督。针对这一问题,提出了一... 在半监督网络表示学习中,节点标签对于网络在不同空间中映射关系的建立具有重要指导意义。然而在很多实际任务中,可用标签信息往往比较有限或难以获取,这导致在学习网络低维表示的过程中无法提供充分有效的监督。针对这一问题,提出了一种双通道半监督网络表示学习模型,该模型以自编码器为基本框架,由自监督和半监督两个信息传递通道构成。自监督信号与标签信息分别在两个通道中对网络表示映射关系的建立提供指导,同时二者之间形成信息互补与增强。考虑到两个通道间可能存在信息冗余,在互信息视角下设计了冗余识别与消除机制。在此基础上,构造了一体化优化模型,实现自监督学习与半监督学习的协同,使学习到的网络表示更好地捕捉和保持网络的结构和特性。在真实数据集上的实验结果表明,提出的模型学习的网络表示在节点分类、聚类和可视化等任务中能够获得优于基线方法的性能。 展开更多
关键词 监督网络表示学习 标签信息 监督学习 互信息 图神经网络
下载PDF
基于自反馈阈值学习的半监督皮肤癌诊断模型
7
作者 韩硕 袁伟珵 杜泽宇 《河北大学学报(自然科学版)》 CAS 北大核心 2024年第4期441-448,共8页
为解决监督学习皮肤癌诊断模型的训练需要大量数据标注,且医学专家标注工作成本高、耗时长、易疲劳等问题,提出了一种基于自反馈阈值学习(Self-Feedback Threshold Learning,SFTL)的半监督皮肤癌诊断方法.在标注数据预训练的ResNet网络... 为解决监督学习皮肤癌诊断模型的训练需要大量数据标注,且医学专家标注工作成本高、耗时长、易疲劳等问题,提出了一种基于自反馈阈值学习(Self-Feedback Threshold Learning,SFTL)的半监督皮肤癌诊断方法.在标注数据预训练的ResNet网络基础上,引入全局和局部类别间伪标签自反馈阈值学习机制动态筛选ResNet预测概率大于自反馈阈值的无标记样本,引入无监督阈值学习损失和分类交叉熵损失进行模型训练,在标记样本稀缺的情况下深入挖掘无标记数据的鉴别诊断信息,显著降低模型在无标记皮肤病变图像中的误判率.选取公开数据集HAM10000的皮肤病变图像展开实验验证,在仅需50%标记数据下实现了0.8229的准确率和0.7651的F1分数,证明所提出的SFTL模型在半监督场景下可有效解决皮肤癌诊断任务,相比其他同类方法具有更好的分类性能. 展开更多
关键词 监督皮肤癌诊断 自反馈阈值学习 卷积神经网络 监督学习
下载PDF
基于平衡采样的主动半监督学习人类活动识别研究
8
作者 郇战 刘艳 +3 位作者 李志新 董晨辉 周帮文 秦王盛 《传感器与微系统》 CSCD 北大核心 2024年第7期63-66,71,共5页
基于可穿戴传感器的人类活动识别研究逐渐受到人们的广泛关注。本文提出了一种基于平衡采样的主动半监督模型,在挑选样本进行标注时,将样本的不确定性和多样性一并考虑在内,挑选出类别平衡的不确定性样本。确保训练后的模型对每个类都... 基于可穿戴传感器的人类活动识别研究逐渐受到人们的广泛关注。本文提出了一种基于平衡采样的主动半监督模型,在挑选样本进行标注时,将样本的不确定性和多样性一并考虑在内,挑选出类别平衡的不确定性样本。确保训练后的模型对每个类都有很好的识别性能,从而提升整体分类结果。同时,为了全部利用标记和未标记样本的信息,将主动学习和半监督学习相结合,利用损失项信息不断更新网络参数,提升模型在低注释下的识别性能。该模型在2个公开数据集上得到了验证,在确保获得较优分类准确率的同时,可以大大减少样本的人工标注工作。 展开更多
关键词 主动学习 监督学习 查询策略 人类活动识别
下载PDF
融合全监督学习的半监督矿石粒度预测算法
9
作者 姜志宏 陈澳 《黄金科学技术》 CSCD 北大核心 2024年第3期539-547,共9页
针对选矿过程矿石粒度分析精度的提高依赖于有标签样本数量,以及传统全监督建模方法泛化性能较差的问题,提出了融合全监督学习的半监督矿石粒度预测算法。以运矿皮带上应用图像获取的矿石粒度数据作为研究对象,利用半监督学习获得无标... 针对选矿过程矿石粒度分析精度的提高依赖于有标签样本数量,以及传统全监督建模方法泛化性能较差的问题,提出了融合全监督学习的半监督矿石粒度预测算法。以运矿皮带上应用图像获取的矿石粒度数据作为研究对象,利用半监督学习获得无标签的图像识别矿石粒度样本伪标签,扩展数量有限的原始标签样本,以提高矿石粒度预测模型的性能。采用筛分法获取的矿石粒度数据集来验证融合全监督学习的半监督预测算法,结果表明,融合全监督学习的半监督预测算法的模型决定系数达到92.1%,均方根误差和平均绝对误差分别为0.023和0.02,相较于传统全监督建模方法,该模型的预测精度显著提高,为提高矿石粒度检测精度提供了有力的技术支撑。 展开更多
关键词 监督学习 粒度检测 伪标签 粒度分布 机器学习 矿石
下载PDF
基于半监督学习的路面裂缝检测
10
作者 郭文浩 张德津 《交通科技与经济》 2024年第5期52-58,共7页
针对裂缝自动检测任务中难以获取大量精确标注样本数据的问题,提出LGS-Net(Local Global Similarity-Network)模型。LGS-Net的核心在于利用裂缝图像区域的语义相似性,有效结合少量已标注数据和大量未标注图像数据,通过半监督学习实现裂... 针对裂缝自动检测任务中难以获取大量精确标注样本数据的问题,提出LGS-Net(Local Global Similarity-Network)模型。LGS-Net的核心在于利用裂缝图像区域的语义相似性,有效结合少量已标注数据和大量未标注图像数据,通过半监督学习实现裂缝自动检测。为全面评估LGS-Net的性能,实验在GAPs384和Crack500数据集上进行验证。结果表明,在标注资源有限的情况下,LGS-Net能够实现高精度的裂缝检测。通过对检测结果的可视化分析,证明LGS-Net具有在复杂环境下有效识别裂缝的能力。LGS-Net利用路面裂缝图像的语义相似性特征进行检测,能为路面裂缝检测的工程应用提供技术支持。 展开更多
关键词 道路工程 裂缝检测 语义相似性 监督学习 对比学习
下载PDF
基于半监督对比学习的人脸表情识别
11
作者 刘帅师 倪世豪 《长春工业大学学报》 CAS 2024年第1期9-14,F0003,共7页
为解决面部表情识别(FER)大规模表情收集困难和现有表情无法满足实际细粒度需求的问题,在ResNet系列网络,以Resnet-18残差网络作为基础,首先引入图像预处理算法处理人脸表情图片,然后利用半监督学习方法将未标记数据与标记数据相结合,... 为解决面部表情识别(FER)大规模表情收集困难和现有表情无法满足实际细粒度需求的问题,在ResNet系列网络,以Resnet-18残差网络作为基础,首先引入图像预处理算法处理人脸表情图片,然后利用半监督学习方法将未标记数据与标记数据相结合,用以描述输入空间的数据分布。最后利用对比学习方法扩大类间距,减少类内差异。该方法在RAF-DB真实场景人脸表情识别数据集上进行了测试,其中2000个有标签的训练集测试准确率为81.37%,4000个有标签的训练集测试准确率为83.63%。 展开更多
关键词 监督 对比学习 神经网络 表情识别
下载PDF
基于协同训练的半监督学习3D医学图像分割模型
12
作者 杨晶东 李皓秋 +2 位作者 姜泉 韩曼 宋梦歌 《智能计算机与应用》 2024年第8期174-183,共10页
近年来人工智能应用于COVID-19医学影像诊断,降低了检测成本和漏检率,但临床医学图像样本数量较少和标签质量较低,影响了3D模型的分割性能。本文提出基于协同训练的半监督学习3D医学图像分割模型,使用空间翻转和窗口技术生成多视角、多... 近年来人工智能应用于COVID-19医学影像诊断,降低了检测成本和漏检率,但临床医学图像样本数量较少和标签质量较低,影响了3D模型的分割性能。本文提出基于协同训练的半监督学习3D医学图像分割模型,使用空间翻转和窗口技术生成多视角、多模态图像,增强3D图像样本的空间差异性;采用一种基于加权不确定度的虚拟标签生成模块,为无标签数据生成可靠的虚拟标签,减少过拟合;采用基于三阶段的三维度六模型协同训练,增强分割精度和泛化性能。此外,本文可视化协同训练各阶段的特征关注度热力图,为临床诊断提供有效参考。针对661位新冠患者的771例NIFTI格式3D COVID-19的CT图像展开实验,5折交叉验证结果表明,本文模型Dice系数为73.30%,平均表面距离(ASD)为10.633,灵敏度(Sen⁃sitivity)为0.630,特异度(Specificity)为0.996。与各种典型半监督学习3D分割模型相比,具有更好的分割精度和泛化性能。 展开更多
关键词 监督学习 协同训练 3D医学图像分割 虚拟标签
下载PDF
基于伪标签深度学习的半监督滚动轴承故障诊断模型 被引量:2
13
作者 宋宇航 马萍 +1 位作者 李建军 张宏立 《噪声与振动控制》 CSCD 北大核心 2024年第2期102-107,184,共7页
针对实际工程应用中被标记的滚动轴承故障样本收集困难,传统诊断模型精度较低的问题,提出一种伪标签学习融合参数迁移深度学习网络的半监督滚动轴承故障诊断模型。首先将ImageNet数据集上预训练的残差网络(Residual Network,ResNet)模... 针对实际工程应用中被标记的滚动轴承故障样本收集困难,传统诊断模型精度较低的问题,提出一种伪标签学习融合参数迁移深度学习网络的半监督滚动轴承故障诊断模型。首先将ImageNet数据集上预训练的残差网络(Residual Network,ResNet)模型参数迁移至本文模型中作为初始参数,并使用不同学习率微调网络层参数以加快模型收敛速度;随后引入伪标签半监督学习,使用标签数据训练模型并对无标记数据进行预测以生成伪标签;最后使用标签数据以及伪标签数据训练参数迁移后的ResNet模型,并测试诊断效果。对两种滚动轴承故障数据进行半监督下故障诊断实验及跨域故障诊断实验。实验结果表明,在具有大量未标记样本集下,所提出模型可迁移至不同设备完成诊断,具有较强的鲁棒性,可用于处理复杂工业环境中的故障诊断问题。 展开更多
关键词 故障诊断 滚动轴承 监督学习 深度迁移学习
下载PDF
一种无需手工标注的半监督学习关键词抽取方法 被引量:1
14
作者 蔡茂东 沈国华 黄志球 《小型微型计算机系统》 CSCD 北大核心 2024年第1期69-74,共6页
关键词的自动抽取技术是为了满足信息时代人们对特定领域知识快速便捷获取的需求.它也是机器翻译、信息检索、知识图谱构建等应用场景中的关键基础问题和研究热点.监督学习方法的效果是建立在有现成的大量的带有准确标注的高质量的数据... 关键词的自动抽取技术是为了满足信息时代人们对特定领域知识快速便捷获取的需求.它也是机器翻译、信息检索、知识图谱构建等应用场景中的关键基础问题和研究热点.监督学习方法的效果是建立在有现成的大量的带有准确标注的高质量的数据集的前提上的,无法在低资源环境下快速运用.本文提出了一种考虑词频、词长以及词大小写特征的无监督算法以及结合了该无监督算法的自扩展迭代的半监督学习关键词抽取方法.半监督学习方法在同样无需手工标注关键词的前提下,相比无监督算法具有更高的F1值. 展开更多
关键词 监督学习 监督算法 自扩展迭代 低资源环境 关键词抽取
下载PDF
基于半监督学习Informer算法的工业机器人故障诊断方法 被引量:1
15
作者 宋俊杰 陈翀 +1 位作者 王涛 程良伦 《机电工程技术》 2024年第2期24-28,共5页
在工业领域中,六轴机器人的故障监测数据难以收集大量的故障标签数据。传统的智能诊断方法通常依赖于大规模有标签数据的监督学习,但这在实际应用中存在局限。在解决这一问题的同时,针对单一模型特征提取能力不足、分类性能差的问题,结... 在工业领域中,六轴机器人的故障监测数据难以收集大量的故障标签数据。传统的智能诊断方法通常依赖于大规模有标签数据的监督学习,但这在实际应用中存在局限。在解决这一问题的同时,针对单一模型特征提取能力不足、分类性能差的问题,结合半监督学习机制与Informer在处理时序数据的优势,提出一种基于半监督学习和概率稀疏注意力的Informer网络架构,实现对少量有标签数据和大量未标签数据的深度学习,以实现对设备故障的精准诊断。对多组真实环境下采集的工业六轴机器人试验数据进行验证,并与CNN、LSTM、GRU 3种深度学习网络对不同故障程度的辨识能力进行比较。结果表明,在无标签数据为100%组的对比实验中所提出方法的故障诊断准确率达到了90%,同时具有更高的分类准确率和更快的收敛速度;在10%标签数据的条件下所提出方法可实现的诊断准确率达到89.7%。 展开更多
关键词 深度学习 故障诊断 监督学习 无标签数据 工业机器人
下载PDF
基于最优传输理论的深度半监督学习伪标签生成算法
16
作者 翟德明 沈斯娴 +3 位作者 周雄 江俊君 刘贤明 季向阳 《软件学报》 EI CSCD 北大核心 2024年第11期5196-5209,共14页
目前,深度学习广泛应用于各个领域并取得了优异的表现,这通常需要大量标注数据的支持,而大量标注数据的获取往往意味着高昂的成本与苛刻的应用条件.因此,随着深度学习的发展,如何在实际场景下突破数据限制,成为目前重要的研究目标,而半... 目前,深度学习广泛应用于各个领域并取得了优异的表现,这通常需要大量标注数据的支持,而大量标注数据的获取往往意味着高昂的成本与苛刻的应用条件.因此,随着深度学习的发展,如何在实际场景下突破数据限制,成为目前重要的研究目标,而半监督学习正是其中一大研究方向.半监督学习通过利用大量的未标记数据辅助少量的标记数据进行学习,很好地减轻了深度学习的数据需求压力.伪标签生成方法是当前半监督学习的重要组成部分,所生成的伪标签质量的优劣会很大程度影响半监督学习的最终效果.聚焦半监督学习中的伪标签生成问题,提出基于最优传输理论的伪标签生成方法.所提方法在将有标签信息作为生成过程引导的同时引入类别均衡约束,在此基础上将半监督学习的伪标签生成过程转换成最优传输优化问题,给出新的求解伪标签生成问题的形式.为求解该优化问题,引入Sinkhorn-Knopp算法进行近似快速求解,避免不可计算问题.所提伪标签生成方法作为半监督学习中的独立过程可结合当前一致性正则等半监督学习技巧构成完整的半监督学习过程.最终,在CIFAR-10、SVHN、MNIST、FashionMNIST这4大公共经典图像分类数据集上进行实验,验证方法的有效性.实验结果显示,所提方法与当前先进的半监督学习方法相比,均取得更优异的结果,尤其是在标签情况较少的情况下提升显著. 展开更多
关键词 监督学习 伪标签生成 最优传输 图像分类 深度学习
下载PDF
基于联邦学习的主动半监督短文本分类方法
17
作者 孔德焱 冀振燕 +2 位作者 杨燕燕 刘洋 刘吉强 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3517-3526,共10页
短文本分类应用广泛,是当前的研究热点,但受到短文本标注数据稀缺和数据隐私保护不便集中训练的影响,分类效果不佳.针对上述问题,我们提出了基于联邦学习的主动半监督异质图注意力网络模型(Active Semi-Supervised Learning empowered H... 短文本分类应用广泛,是当前的研究热点,但受到短文本标注数据稀缺和数据隐私保护不便集中训练的影响,分类效果不佳.针对上述问题,我们提出了基于联邦学习的主动半监督异质图注意力网络模型(Active Semi-Supervised Learning empowered Heterogeneous Graph ATtention network model based on Federated learning,Fed-ASSL-HGAT),通过设计新颖的主动半监督学习(Active Semi-Supervised Learning,ASSL)框架生成高质量标注样本赋能异质图注意力网络(Heterogeneous Graph ATttention network model,HGAT),引入联邦学习对部署在不同节点的模型进行联合训练以满足数据隐私保护需求.所提出的ASSL框架通过将主动学习的多类别标注转化成二元类别标注,可大大降低标注难度;设计基于信息增益的选择策略筛选软、硬标签,以防止信息损失;通过半监督学习选择高准确率、高稳定性的正负样本打伪标签以确保标注质量.实验结果表明,所提出的ASSL-HGAT(S)在AGNews、Snippets、TagMyNews数据集上相比HGAT基线模型F1值分别提升2.45%、8.11%、7.46%.融合联邦学习所进一步提出的Fed-ASSL-HGAT模型可在不泄漏隐私数据的情况下满足性能要求. 展开更多
关键词 异质图神经网络 主动学习 监督学习 联邦学习
下载PDF
基于深度半监督学习的小样本金属工件表面缺陷分割
18
作者 徐兴宇 钟羽中 +1 位作者 涂海燕 佃松宜 《计算机应用研究》 CSCD 北大核心 2024年第8期2540-2545,共6页
针对工业应用场景下缺少缺陷样本的问题,提出了一种仅需要极少缺陷样本的金属工件表面缺陷分割方法。该方法结合了图像生成技术和半监督学习策略,通过利用极少缺陷图像提取的小尺寸缺陷图像来训练缺陷生成模型,然后将生成的缺陷图像嵌... 针对工业应用场景下缺少缺陷样本的问题,提出了一种仅需要极少缺陷样本的金属工件表面缺陷分割方法。该方法结合了图像生成技术和半监督学习策略,通过利用极少缺陷图像提取的小尺寸缺陷图像来训练缺陷生成模型,然后将生成的缺陷图像嵌入到正常图像中以实现数据增广。其次,采用半监督学习策略训练分割网络,以减小生成数据与真实数据分布之间的差异对模型的不良影响。在真实的金属工件机器视觉检测系统上的验证结果表明,半监督的训练策略提高了分割模型对真实缺陷的泛化能力,所提方法能够在仅使用5张缺陷样本图像的条件下取得较高的分割精度。 展开更多
关键词 监督学习 表面缺陷检测 图像分割 小样本 数据增广
下载PDF
基于主动学习的深度半监督聚类模型
19
作者 付艳艳 黄瑞章 +3 位作者 薛菁菁 任丽娜 陈艳平 林川 《计算机应用研究》 CSCD 北大核心 2024年第10期2955-2961,共7页
深度半监督聚类旨在利用少量的监督信息达到更好的聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深... 深度半监督聚类旨在利用少量的监督信息达到更好的聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深度半监督聚类模型(DASCM)。该模型设计了一种主动学习方法,能够挑选出蕴涵丰富信息的边缘文本,并进一步生成蕴涵边缘文本的高价值监督信息。该模型利用这些监督信息指导聚类,从而提升聚类性能。在5个真实文本数据集上的实验表明,DASCM的聚类性能有显著提升。这一结果验证了利用主动学习方法生成的涵盖边缘文本的监督信息对于提升聚类效果是有效的。 展开更多
关键词 深度监督聚类 主动学习 边缘文本
下载PDF
基于样本动态权重的课程式半监督学习方法
20
作者 朱徽 胡斌 +1 位作者 宋怡宁 赵晓芳 《高技术通讯》 CAS 北大核心 2024年第4期342-355,共14页
本文针对半监督场景中极度匮乏的监督信号导致的标签传播困难、模型训练严重受噪声干扰等问题展开研究。伪标签化带来的噪声和低数据利用率导致的确认偏差,会随着自训练过程造成错误累积,进而形成不可逆偏差,损害性能。本文提出基于样... 本文针对半监督场景中极度匮乏的监督信号导致的标签传播困难、模型训练严重受噪声干扰等问题展开研究。伪标签化带来的噪声和低数据利用率导致的确认偏差,会随着自训练过程造成错误累积,进而形成不可逆偏差,损害性能。本文提出基于样本动态权重的课程式半监督学习方法,旨在通过非离散的课程设计,鼓励模型由简单至困难地利用样本,逐步构建分类面,进而缓解伪标签化过程中的噪声产生,增强模型泛化能力。从类内角度,提供弱监督信号的高置信度伪标签被混合用于构建特征原型,估计样本的学习难度。从类间角度,标签嵌入被用于评估类间语义相关度,课程式地减弱训练前期对语义相关类别间的辨别。在通用的半监督学习基准数据集上进行了广泛的实验和分析,证明了方法的有效性。 展开更多
关键词 监督学习 特征表示向量 课程学习 特征原型 语义相关度
下载PDF
上一页 1 2 82 下一页 到第
使用帮助 返回顶部