期刊文献+
共找到196篇文章
< 1 2 10 >
每页显示 20 50 100
Reliability of Three Dimentional Pseudo-continuous Arterial Spin Labeling:A Volumetric Cerebral Perfusion Imaging with Different Post-labeling Time and Functional State in Health Adults
1
作者 刘梦琦 陈志晔 马林 《Chinese Medical Sciences Journal》 CAS CSCD 2018年第1期38-44,共7页
Objective To evaluate the reliability of three dimensional spiral fast spin echo pseudo-continuous arterial spin labeling(3 D pc-ASL) in measuring cerebral blood flow(CBF) with different post-labeling delay time(PLD) ... Objective To evaluate the reliability of three dimensional spiral fast spin echo pseudo-continuous arterial spin labeling(3 D pc-ASL) in measuring cerebral blood flow(CBF) with different post-labeling delay time(PLD) in the resting state and the right finger taping state.Methods 3 D pc-ASL and three dimensional T1-weighted fast spoiled gradient recalled echo(3 D T1-FSPGR) sequence were applied to eight healthy subjects twice at the same time each day for one week interval. ASL data acquisition was performed with post-labeling delay time(PLD) 1.5 seconds and 2.0 seconds in the resting state and the right finger taping state respectively. CBF mapping was calculated and CBF value of both the gray matter(GM) and white matter(WM) was automatically extracted. The reliability was evaluated using the intraclass correlation coefficient(ICC) and Bland and Altman plot.Results ICC of the GM(0.84) and WM(0.92) was lower at PLD 1.5 seconds than that(GM, 0.88; WM, 0.94) at PLD 2.0 seconds in the resting state, and ICC of GM(0.88) was higher in the right finger taping state than that in the resting state at PLD 1.5 seconds. ICC of the GM and WM was 0.71 and 0.78 for PLD 1.5 seconds and PLD 2.0 seconds in the resting state at the first scan, and ICC of the GM and WM was 0.83 and 0.79 at the second scan, respectively.Conclusion This work demonstrated that 3 D pc-ASL might be a reliable imaging technique to measure CBF over the whole brain at different PLD in the resting state or controlled state. 展开更多
关键词 pseudo-continuous ARTERIAL spin labelING magnetic resonance imaging intraclass correlation coefficient RELIABILITY
下载PDF
PLDMLT:Multi-Task Learning of Diabetic Retinopathy Using the Pixel-Level Labeled Fundus Images
2
作者 Hengyang Liu Chuncheng Huang 《Computers, Materials & Continua》 SCIE EI 2023年第8期1745-1761,共17页
In the field of medical images,pixel-level labels are time-consuming and expensive to acquire,while image-level labels are relatively easier to obtain.Therefore,it makes sense to learn more information(knowledge)from ... In the field of medical images,pixel-level labels are time-consuming and expensive to acquire,while image-level labels are relatively easier to obtain.Therefore,it makes sense to learn more information(knowledge)from a small number of hard-to-get pixel-level annotated images to apply to different tasks to maximize their usefulness and save time and training costs.In this paper,using Pixel-Level Labeled Images forMulti-Task Learning(PLDMLT),we focus on grading the severity of fundus images for Diabetic Retinopathy(DR).This is because,for the segmentation task,there is a finely labeled mask,while the severity grading task is without classification labels.To this end,we propose a two-stage multi-label learning weakly supervised algorithm,which generates initial classification pseudo labels in the first stage and visualizes heat maps at all levels of severity using Grad-Cam to further provide medical interpretability for the classification task.A multitask model framework with U-net as the baseline is proposed in the second stage.A label update network is designed to alleviate the gradient balance between the classification and segmentation tasks.Extensive experimental results show that our PLDMLTmethod significantly outperforms other stateof-the-art methods in DR segmentation on two public datasets,achieving up to 98.897%segmentation accuracy.In addition,our method achieves comparable competitiveness with single-task fully supervised learning in the DR severity grading task. 展开更多
关键词 DR lesion segmentation pseudo labels grading task class activation heat map update label network
下载PDF
选择置信伪标签的迁移学习
3
作者 滕少华 周德根 +1 位作者 滕璐瑶 张巍 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期31-44,共14页
域适应旨在将标签丰富的源域知识迁移到无标签的目标域.选择性伪标签和标签传播都是域适应的常用方法.然而传统的选择性伪标签以最大类的预测概率标记样本,忽视了其他概率;而且传统的标签传播同等对待不同置信度的标签,这可能导致错误标... 域适应旨在将标签丰富的源域知识迁移到无标签的目标域.选择性伪标签和标签传播都是域适应的常用方法.然而传统的选择性伪标签以最大类的预测概率标记样本,忽视了其他概率;而且传统的标签传播同等对待不同置信度的标签,这可能导致错误标签.因此,该文提出了一种选择置信伪标签(TL-SCP)的迁移学习.首先,在评估伪标签的置信度时兼顾了最大类的预测概率和其他类预测概率;其次,在标签传播过程中尽量保留高置信度标签,并据此指导低置信度标签的更新,借此减少错误标签传播;最后,在4个基准数据集上进行的大量实验验证了提出的模型(TL-SCP)优于现有的模型. 展开更多
关键词 置信伪标签 域适应 伪标签 迁移学习 标签传播
下载PDF
基于半监督学习的域适应实体解析算法
4
作者 戴超凡 丁华华 《计算机科学》 CSCD 北大核心 2024年第9期214-222,共9页
实体解析旨在查找两个数据实体是否引用同一实体,是许多自然语言处理任务中的一项基本任务。现有的基于深度学习的实体解析解决方案通常需要大量的标注数据,即使利用预训练的语言模型进行训练,仍然需要数千个标签才能达到令人满意的准... 实体解析旨在查找两个数据实体是否引用同一实体,是许多自然语言处理任务中的一项基本任务。现有的基于深度学习的实体解析解决方案通常需要大量的标注数据,即使利用预训练的语言模型进行训练,仍然需要数千个标签才能达到令人满意的准确性。现实场景中,这些标注数据并不容易获得。针对上述问题,提出了一个基于半监督学习的域适应实体解析模型。首先,在源域上训练一个分类器,然后利用域适应减小源域和目标域的分布差异,同时用数据增强后的目标域软伪标签加入源域迭代训练,从而实现从源域到目标域的知识迁移。在13个来自相同或不同领域的数据集上对所提模型进行了对比实验和消融实验,实验结果表明,与无监督基线模型相比,所提模型在多个数据集上的F1值平均提升了2.84%,9.16%和7.1%;与有监督基线模型相比,所提模型只需要20%~40%的标签就可以达到与有监督学习相当的性能。消融实验进一步证明了所提模型的有效性,其总体上可以获得更好的实体解析结果(相关代码已开源1))。 展开更多
关键词 实体解析 域适应 伪标签 预训练语言模型 数据增强
下载PDF
基于自训练半监督神经网络的结构损伤识别
5
作者 秦世强 杨睿 苏晟 《地震工程与工程振动》 CSCD 北大核心 2024年第2期38-49,共12页
为解决结构损伤识别中标签样本不足的问题,提出一种基于自训练半监督神经网络(self-training semi-supervised neural networks,SSNN)的结构损伤识别框架,该框架利用自训练半监督方法对多层感知机(multilayer perceptron,MLP)神经网络... 为解决结构损伤识别中标签样本不足的问题,提出一种基于自训练半监督神经网络(self-training semi-supervised neural networks,SSNN)的结构损伤识别框架,该框架利用自训练半监督方法对多层感知机(multilayer perceptron,MLP)神经网络进行训练,从无标签样本中挑选置信度高的样本标注伪标签,扩大样本训练集,并采用归一化频率变化率和损伤特征指数作为输入特征,用于识别结构损伤。首先,介绍自训练半监督学习的基本理论和方法;其次,从神经网络构建、损伤特征提取、分类器评估等方面,给出结构损伤识别流程;最后,通过空间桁架的数值案例及3层框架的试验数据,验证所提出的损伤识别方法。结果表明:自训练半监督学习能够从无标签样本中选取置信度较高的样本,为损伤识别提供更充足的有标签样本;在标记样本不足的条件下,SSNN比MLP神经网络的损伤识别效果更好;相较于MLP神经网络,SSNN在单一位置损伤工况下,识别准确率提升约4%,2个位置损伤识别准确率提升约9%。 展开更多
关键词 结构损伤识别 半监督学习 自训练 伪标签 神经网络
下载PDF
基于虚拟样本伪标签生成的高光谱图像分类
6
作者 谢福鼎 雷潇涵 《辽宁师范大学学报(自然科学版)》 CAS 2024年第1期86-92,共7页
半监督高光谱图像分类的精度一般随着标记像素数的增加而提高.然而,标签样本的获得费时费力,且依赖于专家知识.针对这个问题,提出了一种通过少量标签样本生成具有伪标签的虚拟样本新方法.基于数学中的凸集理论,所提出的方法利用少量的... 半监督高光谱图像分类的精度一般随着标记像素数的增加而提高.然而,标签样本的获得费时费力,且依赖于专家知识.针对这个问题,提出了一种通过少量标签样本生成具有伪标签的虚拟样本新方法.基于数学中的凸集理论,所提出的方法利用少量的训练样本可以生成任意多的带有伪标签的虚拟样本,有效地扩大了训练样本集,明显改善了半监督分类器的分类结果.为了验证所提方法的有效性,在Indian Pines和Pavia University两个常用的实际高光谱数据集上进行了广泛测试.实验结果表明,利用所提出的方法在分类具有少量标签样本的高光谱图像时,3个评价分类结果的指标值均有明显提升. 展开更多
关键词 高光谱图像 虚拟样本 伪标签 半监督分类 凸集
下载PDF
生成式标签对抗的文本分类模型
7
作者 姚迅 秦忠正 杨捷 《计算机应用》 CSCD 北大核心 2024年第6期1781-1785,共5页
文本分类是自然语言处理(NLP)中的一项基础任务,目的是将文本数据分配至预先定义的类别。图卷积神经网络(GCN)与大规模的预训练模型BERT(Bidirectional Encoder Representations from Transformer)的结合在文本分类任务中取得了良好的... 文本分类是自然语言处理(NLP)中的一项基础任务,目的是将文本数据分配至预先定义的类别。图卷积神经网络(GCN)与大规模的预训练模型BERT(Bidirectional Encoder Representations from Transformer)的结合在文本分类任务中取得了良好的效果。大规模异构图中GCN的无向的信息传递产生信息噪声影响模型的判断,造成模型分类能力下降,针对这一问题,提出一种生成式标签对抗模型,即类对抗图卷积网络(CAGCN)模型,以降低分类时无关信息的干扰,提升模型的分类性能。首先,采用TextGCN(Text Graph Convolutional Network)中的构图法构建邻接矩阵,结合GCN和BERT模型作为类生成器(CG);其次,在模型训练时采用伪标签特征训练法,并构建聚类器与类生成器联合训练;最后,在多个广泛使用的数据集上进行实验。实验结果表明,在泛用的分类数据集20NG、R8、R52、Ohsumed和MR上,CAGCN模型的分类准确率比RoBERTaGCN模型分别提高了1.2、0.1、0.5、1.7和0.5个百分点。 展开更多
关键词 文本分类 图卷积神经网络 BERT 伪标签 异构图
下载PDF
基于多分类器协同训练的结构损伤识别
8
作者 秦世强 杨睿 苏晟 《武汉理工大学学报(交通科学与工程版)》 2024年第4期712-717,共6页
文中提出一种基于多分类器协同训练(multi-classifiers co-training,MCCT)的结构损伤识别框架.该框架结合多层感知机(multilayer perceptron,MLP)和支持向量机(support vector machine,SVM)进行协同训练,从无标签样本中挑选置信度高的... 文中提出一种基于多分类器协同训练(multi-classifiers co-training,MCCT)的结构损伤识别框架.该框架结合多层感知机(multilayer perceptron,MLP)和支持向量机(support vector machine,SVM)进行协同训练,从无标签样本中挑选置信度高的样本标注伪标签,扩大样本训练集,并采用加速度响应的功率谱密度(PSD)作为输入特征,用于识别结构损伤.结果表明:协同训练方法能够从无标签样本中选取置信度较高的样本,为损伤识别提供更充足有标签样本.相较于MLP和SVM,该方法在多种工况下,损伤识别准确率分别提升约4.7%和6.3%. 展开更多
关键词 结构损伤识别 协同训练 半监督学习 伪标签 神经网络
下载PDF
基于伪标签的无监督领域自适应行人重识别研究综述 被引量:1
9
作者 景叶怡然 余增 +1 位作者 时云潇 李天瑞 《计算机科学》 CSCD 北大核心 2024年第1期72-83,共12页
行人重识别是计算机视觉领域的热点研究课题之一。近年来,为了解决行人重识别实际应用中标签数据稀缺的问题,同时也为了有效地利用现有的标签数据,研究者们提出了基于生成对抗网络以及基于伪标签的领域自适应方法,用于进行跨领域的行人... 行人重识别是计算机视觉领域的热点研究课题之一。近年来,为了解决行人重识别实际应用中标签数据稀缺的问题,同时也为了有效地利用现有的标签数据,研究者们提出了基于生成对抗网络以及基于伪标签的领域自适应方法,用于进行跨领域的行人重识别研究。基于伪标签的无监督领域自适应行人重识别方法由于效果显著而备受研究者的青睐。文中梳理了近7年来基于伪标签的无监督领域自适应行人重识别的研究成果,将基于伪标签的方法从模型训练角度划分为两个阶段。1)伪标签生成阶段。现有工作的伪标签生成方法大多使用聚类方法,部分工作采用基于图结构学习的图匹配、图卷积网络方法来生成目标域的伪标签。2)伪标签精炼阶段。文中将现有的伪标签精炼方法归纳为基于表征学习的精炼方法以及基于相似度学习的精炼方法,并分别进行模型方法的总结与整理。最后,讨论现阶段基于伪标签的无监督领域自适应行人重识别面临的挑战并对未来可能的发展方向进行展望。 展开更多
关键词 行人重识别 深度学习 伪标签 无监督 领域自适应
下载PDF
基于最优传输理论的深度半监督学习伪标签生成算法
10
作者 翟德明 沈斯娴 +3 位作者 周雄 江俊君 刘贤明 季向阳 《软件学报》 EI CSCD 北大核心 2024年第11期5196-5209,共14页
目前,深度学习广泛应用于各个领域并取得了优异的表现,这通常需要大量标注数据的支持,而大量标注数据的获取往往意味着高昂的成本与苛刻的应用条件.因此,随着深度学习的发展,如何在实际场景下突破数据限制,成为目前重要的研究目标,而半... 目前,深度学习广泛应用于各个领域并取得了优异的表现,这通常需要大量标注数据的支持,而大量标注数据的获取往往意味着高昂的成本与苛刻的应用条件.因此,随着深度学习的发展,如何在实际场景下突破数据限制,成为目前重要的研究目标,而半监督学习正是其中一大研究方向.半监督学习通过利用大量的未标记数据辅助少量的标记数据进行学习,很好地减轻了深度学习的数据需求压力.伪标签生成方法是当前半监督学习的重要组成部分,所生成的伪标签质量的优劣会很大程度影响半监督学习的最终效果.聚焦半监督学习中的伪标签生成问题,提出基于最优传输理论的伪标签生成方法.所提方法在将有标签信息作为生成过程引导的同时引入类别均衡约束,在此基础上将半监督学习的伪标签生成过程转换成最优传输优化问题,给出新的求解伪标签生成问题的形式.为求解该优化问题,引入Sinkhorn-Knopp算法进行近似快速求解,避免不可计算问题.所提伪标签生成方法作为半监督学习中的独立过程可结合当前一致性正则等半监督学习技巧构成完整的半监督学习过程.最终,在CIFAR-10、SVHN、MNIST、FashionMNIST这4大公共经典图像分类数据集上进行实验,验证方法的有效性.实验结果显示,所提方法与当前先进的半监督学习方法相比,均取得更优异的结果,尤其是在标签情况较少的情况下提升显著. 展开更多
关键词 半监督学习 伪标签生成 最优传输 图像分类 深度学习
下载PDF
基于高置信度伪标签数据选择算法的临床事件抽取方法
11
作者 罗媛媛 杨春明 +2 位作者 李波 张晖 赵旭剑 《太原理工大学学报》 北大核心 2024年第1期204-213,共10页
【目的】事件抽取是构建高质量事件知识图谱的前提。临床事件抽取过程中事件元素存在依赖关系,现有方法无法准确识别事件元素并组合为事件,且现有临床事件标记数据较少,给事件抽取任务带来了极大的挑战。【方法】将临床事件抽取建模为... 【目的】事件抽取是构建高质量事件知识图谱的前提。临床事件抽取过程中事件元素存在依赖关系,现有方法无法准确识别事件元素并组合为事件,且现有临床事件标记数据较少,给事件抽取任务带来了极大的挑战。【方法】将临床事件抽取建模为实体识别模型,提出一种融合多特征的中文医学事件抽取方法:BERT-MCRF.该方法使用BERT构建模型的嵌入和特征提取部分,在CRF层加入多个字的滑动窗口特征,然后将BERT-MCRF作为半监督实验的基实验,提出一种高置信度伪标签数据选择算法作为筛选数据的条件,得到较高质量的300条数据与原始数据合并,最终构建了1700条语料,并重新训练模型。【结果】BERT-MCRF模型在3种属性实体上的整体F1值达到80.21%,比经典的BiLSTM-CRF模型提升15.11%;通过半监督思路重新训练的模型最终F1值达到81.56%,较原始BERT-MCRF提升了1.35%. 展开更多
关键词 临床医学事件抽取 实体识别 多特征 半监督学习 高置信度伪标签选择算法
下载PDF
基于伪标签正则化损失的无监督行人重识别
12
作者 贾洁茹 张硕蕊 +1 位作者 钱宇华 阮秋琦 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1743-1758,共16页
无监督行人重识别旨在不需要行人身份标签的情况下,将查询的行人图像与候选集中的行人图像相匹配.目前主流的无监督行人重识别方法通常先利用聚类算法生成伪标签,然后利用伪标签训练深度神经网络.然而由于模型初始表征能力不足和聚类算... 无监督行人重识别旨在不需要行人身份标签的情况下,将查询的行人图像与候选集中的行人图像相匹配.目前主流的无监督行人重识别方法通常先利用聚类算法生成伪标签,然后利用伪标签训练深度神经网络.然而由于模型初始表征能力不足和聚类算法的局限性等,伪标签中会引入大量噪声,严重误导模型优化过程,导致模型性能退化.为了减轻伪标签噪声的影响,本文提出了一种新的伪标签正则化损失函数,用伪标签的置信度分数和样本相似度对伪标签噪声进行约束.具体来说,本文首先提出了一种聚类引导的注意力机制,根据伪标签与聚类中心的语义相关程度来估计伪标签的置信度,以此来识别噪声标签并给正确标签分配更多的权重,有效降低伪标签噪声在总体损失函数中的作用.同时,为了充分利用伪标签的判别能力,本文利用伪标签进行在线软样本挖掘,构建mini-batch中的正负样本对并为每个正负样本对计算一个连续的权重分数.通过将以上两种权重引入到对比损失中,本文提出的伪标签正则化损失函数可以有效抑制伪标签噪声的影响,减轻标签噪声对训练过程的影响,提高模型的准确性和鲁棒性.在多个公开行人数据集上的实验结果验证了本文方法的有效性,在Market1501、DukeMTMC-reID和MSMT17数据集上mAP分别达到了85.9%、75.1%和29.3%. 展开更多
关键词 行人重识别 无监督学习 伪标签噪声 对比学习 聚类优化
下载PDF
基于弱标签争议的半自动分类数据标注方法
13
作者 李自强 杨薇 +1 位作者 杨先凤 罗林 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2891-2899,共9页
当前,深度主动学习(Deep Active Learning,DAL)在分类数据标注工作中获得成功,但如何筛选出最能提升模型性能的样本仍是难题.本文提出基于弱标签争议的半自动分类数据标注方法(Dispute about Weak Label based Deep Active Learning,DWL... 当前,深度主动学习(Deep Active Learning,DAL)在分类数据标注工作中获得成功,但如何筛选出最能提升模型性能的样本仍是难题.本文提出基于弱标签争议的半自动分类数据标注方法(Dispute about Weak Label based Deep Active Learning,DWLDAL),迭代地筛选出模型难以区分的样本,交给人工进行准确标注.该方法包含伪标签生成器和弱标签生成器,伪标签生成器是在准确标注的数据集上训练而成,用于生成无标签数据的伪标签;弱标签生成器则是在带伪标签的随机子集上训练而成.弱标签生成器委员会决定哪些无标签数据最有争议,则交给人工标注.本文针对文本分类问题,在公开数据集IMDB(Internet Movie DataBase)、20NEWS(20NEW Sgroup)和chnsenticorp(chnsenticorp_htl_all)上进行实验验证.从数据标注和分类任务的准确性2个角度,对3种不同投票决策方式进行评估.DWLDAL方法中数据标注的F1分数比现有方法Snuba分别提高30.22%、14.07%和2.57%,DWLDAL方法中分类任务的F1分数比Snuba分别提高1.01%、22.72%和4.83%. 展开更多
关键词 深度主动学习 文本分类 伪标签生成器 弱标签生成器 投票委员会
下载PDF
半监督TS网络模型在齿轮故障诊断中的应用
14
作者 陈保家 阮宇豪 +3 位作者 陈法法 肖文荣 李公法 陶波 《机械科学与技术》 CSCD 北大核心 2024年第7期1249-1256,共8页
为解决在工业大数据条件下,有标签样本少导致机械故障诊断准确率低的问题,提出了一种半监督神经网络模型。该方法采用协同训练的方式,从时域和频域两个维度训练教师网络(T),将无标签数据转化为高质量的伪标签数据。再利用转化后的伪标... 为解决在工业大数据条件下,有标签样本少导致机械故障诊断准确率低的问题,提出了一种半监督神经网络模型。该方法采用协同训练的方式,从时域和频域两个维度训练教师网络(T),将无标签数据转化为高质量的伪标签数据。再利用转化后的伪标签数据训练学生网络(S),通过对数据进行评判和计分,避免网络过拟合。最后通过得分函数,对伪标签数据进行阶梯筛选成为有标签数据。齿轮故障诊断结果表明:TS网络在仅有少量有标签数据的情况下,故障分类准确率达90.31%,与其他半监督方法相比,准确率高出15%~20%。在信噪比(SNR)为5、0、-5的条件下,模型可以达到86.81%、78.00%、52.78%的诊断准确率。 展开更多
关键词 齿轮故障诊断 伪标签学习 抗噪性 协同训练
下载PDF
基于多模态共享网络的自监督语音-人脸跨模态关联学习方法
15
作者 李俊屿 卜凡亮 +2 位作者 谭林 周禹辰 毛璟仪 《科学技术与工程》 北大核心 2024年第7期2804-2812,共9页
现有的语音-人脸跨模态关联学习方法在语义关联和监督信息方面仍然面临挑战,尚未充分考虑语音与人脸之间的语义信息交互。为解决这些问题,提出一种基于多模态共享网络的自监督关联学习方法。首先,将语音和人脸模态的特征映射到单位球面... 现有的语音-人脸跨模态关联学习方法在语义关联和监督信息方面仍然面临挑战,尚未充分考虑语音与人脸之间的语义信息交互。为解决这些问题,提出一种基于多模态共享网络的自监督关联学习方法。首先,将语音和人脸模态的特征映射到单位球面,构建一个公共的特征空间;接着,通过多模态共享网络的残差块来挖掘复杂的非线性数据关系,并利用其中权重共享的全连接层来增强语音与人脸特征向量之间的关联性;最后,使用K均值聚类算法生成的伪标签作为监督信号来指导度量学习,从而完成4种跨模态关联学习任务。实验结果表明,本文提出的方法在语音-人脸跨模态验证、匹配和检索任务上均取得了良好的效果,多项评价指标相较于现有基线方法提升1%~4%的准确率。 展开更多
关键词 语音-人脸跨模态 多模态共享网络 伪标签 关联学习
下载PDF
伪标签指导下自适应聚类网络
16
作者 张鑫煜 徐慧英 +1 位作者 陈宇杭 朱信忠 《浙江师范大学学报(自然科学版)》 CAS 2024年第4期404-412,共9页
深度聚类是一种结合深度学习进行数据表征学习的聚类方法.这种方法在聚类的基础上,利用深度学习技术来学习数据的内在结构和特征,从而更有效地进行大规模数据的聚类,在推荐系统和异常检测等领域有广泛的应用.然而,目前的深度聚类方法存... 深度聚类是一种结合深度学习进行数据表征学习的聚类方法.这种方法在聚类的基础上,利用深度学习技术来学习数据的内在结构和特征,从而更有效地进行大规模数据的聚类,在推荐系统和异常检测等领域有广泛的应用.然而,目前的深度聚类方法存在以下2个问题:1)传统的深度聚类网络没有充分利用图节点先验分布的信息;2)基于对比学习的深度聚类网络平等对待每一个样本,降低了模型的区分度.基于此,提出了一种结合伪标签和动态更新权重的聚类网络.该方法通过对原始图节点聚类得到伪标签,应用于交叉视图相似度矩阵生成正负样本对,以便模型能够正确地学习区分正负样本.之后,样本对根据自身相似度值计算自适应权重,再通过权重更新样本对的损失梯度.此外,在损失函数中引入类内类间阈值来寻找样本对相似度的最优值.在6个真实数据集上进行节点聚类实验,证明了该方法的优越性和有效性. 展开更多
关键词 自监督学习 深度聚类 对比学习 聚类伪标签 自适应权重
下载PDF
多层次结构与半监督学习的谣言检测研究
17
作者 张岩珂 但志平 +2 位作者 董方敏 高准 张洪志 《国外电子测量技术》 2024年第2期84-92,共9页
当前谣言检测工作主要基于监督学习,需要人为标记数据而导致检测具有滞后性。为了充分利用大量的未标记数据,及时检测社交网络中的虚假谣言。提出了一种基于多层次结构与半监督学习谣言检测模型(multi-level semi spuervised graph conv... 当前谣言检测工作主要基于监督学习,需要人为标记数据而导致检测具有滞后性。为了充分利用大量的未标记数据,及时检测社交网络中的虚假谣言。提出了一种基于多层次结构与半监督学习谣言检测模型(multi-level semi spuervised graph convolutional neural network, MSGCN)。该模型构建了一种多层次检测模块,基于图卷积网络对有限的标记样本进行训练以提取多层次传播结构特征、扩散结构特征和全局结构特征。其次,引入随机模型扰动集成无标签数据的动态输出进行一致性预测,提出互补伪标签法来获取高质量伪标签数据,并将其加入标记数据扩充样本。最后在有监督交叉熵损失和无监督一致性损失约束下提高模型质量。在公开的Twitter15、Twitter16和Weibo数据集上的实验结果表明,所提出模型在30%标记样本下准确率达到88.3%、90.1%和95.5%,在少量的标记样本下便可达到优异的成绩。 展开更多
关键词 谣言检测 半监督 层次结构 伪标签
下载PDF
多项正则化约束的伪标签传播优化脑电信号聚类
18
作者 代成龙 李光辉 +2 位作者 李栋 申佳华 皮德常 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期156-171,共16页
作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题... 作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题,也在一定程度上限制了无标签脑电信号这类新型数据的应用拓展.为了解决无标签脑电信号的无监督分析问题,提出了一种基于多项正则化约束的伪标签传播优化聚类模型.该模型通过同时优化学习伪标签传播矩阵、脑电信号相似度邻接矩阵、标签分类器的方式实现聚类.将提出的脑电信号聚类模型转化为一个多目标优化问题,并提出了一种基于梯度下降策略的聚类算法EEGapc(electroencephalogram clustering with pseudo label propagation).该算法不仅充分考虑了脑电信号之间的相关性及脑电信号间的信息传递,还能快速收敛到局部最优.在14个真实脑电信号数据集上的实验结果表明,提出的EEGapc脑电信号聚类算法比现有的8种聚类算法性能更好,且在平均NMI(normalized mutual information),ARI(adjusted rand index),F-score,kappa这4个指标上,EEGapc与现有的8种聚类算法相比,分别至少提升了86.88%,58.01%,6.29%,61.17%. 展开更多
关键词 脑电信号聚类 伪标签传播 邻接矩阵优化 伪标签分类器 多目标优化
下载PDF
基于伪标签的弱监督显著特征增强目标检测方法 被引量:1
19
作者 史殿习 刘洋洋 +3 位作者 宋林娜 谭杰夫 周晨磊 张轶 《计算机科学》 CSCD 北大核心 2024年第1期233-242,共10页
显著性目标检测旨在检测图像中最明显的区域。传统的基于单一标签的算法不可避免地受到所采用的细化算法的影响,表现出偏见特征,从而进一步影响了显著性网络的检测性能。针对这一问题,基于多指令滤波器结构,提出了一种基于伪标签的弱监... 显著性目标检测旨在检测图像中最明显的区域。传统的基于单一标签的算法不可避免地受到所采用的细化算法的影响,表现出偏见特征,从而进一步影响了显著性网络的检测性能。针对这一问题,基于多指令滤波器结构,提出了一种基于伪标签的弱监督显著特征增强目标检测方法FeaEM,通过从多个标签中集成更全面和准确的显著性线索,从而有效提升目标检测的性能。FeaEM方法的核心是引入一个新的多指令滤波器结构,利用多个伪标签来避免单一标签带来的负面影响;通过在指令滤波器中引入特征选择机制,从噪声伪标签中提取和过滤更准确的显著性线索,从而学习更多有效的具有代表性的特征;同时,针对现有的弱监督目标检测方法对输入图像的尺度十分敏感,同一图像的不同尺寸输入的预测结构存在较大偏差问题,通过引入尺度特征融合机制,以确保在输入不同尺寸的同一图像时,能输出一致的显著图,进而有效提高模型的尺度泛化能力。在多个数据集上进行的大量实验表明,所提出的FeaEM方法优于最具代表性的方法。 展开更多
关键词 深度学习 目标检测 显著性 伪标签 注意力机制
下载PDF
一种基于在线蒸馏的轻量化噪声标签学习方法
20
作者 黄贻望 黄雨鑫 刘声 《计算机研究与发展》 EI CSCD 北大核心 2024年第12期3121-3133,共13页
利用含有有损标签的噪声数据来训练深度学习模型是机器学习中的研究热点.研究表明深度学习模型训练易受噪声数据的影响而产生过拟合现象.最近,一种将元学习与标签校正相结合的方法能够使模型更好地适应噪声数据以减缓过拟合现象,然而这... 利用含有有损标签的噪声数据来训练深度学习模型是机器学习中的研究热点.研究表明深度学习模型训练易受噪声数据的影响而产生过拟合现象.最近,一种将元学习与标签校正相结合的方法能够使模型更好地适应噪声数据以减缓过拟合现象,然而这种元标签校正方法依赖于模型的性能,同时轻量化模型在噪声数据下不具备良好的泛化性能.针对这一问题,本文结合元学习提出一种基于在线蒸馏的轻量化噪声标签学习方法KDMLC(knowledge distillation-based meta-label correction learning),该方法将深度神经网络与多层感知机构成的元标签校正(meta label correction,MLC)模型视为教师模型,对噪声标签进行校正并指导轻量化模型进行训练,同时采用双层优化策略训练并增强教师模型的泛化能力,从而生成更高质量的伪标签用于训练轻量化模型.实验表明,KDMLC在高噪声水平下对比MLC方法准确率提高了5.50个百分点;同时对CIFAR10数据集使用Cutout数据增强,KDMLC在高噪声水平下对比MLC准确率提升了9.11个百分点,而在真实噪声数据集Clothing1M上的实验,KDMLC也优于其他方法,验证了KDMLC的可行性和有效性. 展开更多
关键词 伪标签 标签校正 元学习 知识蒸馏 噪声数据
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部