期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
Constrained clustering with weak label prior
1
作者 Jing ZHANG Ruidong FAN +2 位作者 Hong TAO Jiacheng JIANG Chenping HOU 《Frontiers of Computer Science》 SCIE EI CSCD 2024年第3期117-132,共16页
Clustering is widely exploited in data mining.It has been proved that embedding weak label prior into clustering is effective to promote its performance.Previous researches mainly focus on only one type of prior.Howev... Clustering is widely exploited in data mining.It has been proved that embedding weak label prior into clustering is effective to promote its performance.Previous researches mainly focus on only one type of prior.However,in many real scenarios,two kinds of weak label prior information,e.g.,pairwise constraints and cluster ratio,are easily obtained or already available.How to incorporate them to improve clustering performance is important but rarely studied.We propose a novel constrained Clustering with Weak Label Prior method(CWLP),which is an integrated framework.Within the unified spectral clustering model,the pairwise constraints are employed as a regularizer in spectral embedding and label proportion is added as a constraint in spectral rotation.To approximate a variant of the embedding matrix more precisely,we replace a cluster indicator matrix with its scaled version.Instead of fixing an initial similarity matrix,we propose a new similarity matrix that is more suitable for deriving clustering results.Except for the theoretical convergence and computational complexity analyses,we validate the effectiveness of CWLP through several benchmark datasets,together with its ability to discriminate suspected breast cancer patients from healthy controls.The experimental evaluation illustrates the superiority of our proposed approach. 展开更多
关键词 CLUSTERING weak label prior cluster ratio pairwise constraints
原文传递
Learning Multi Labels from Single Label——An Extreme Weak Label Learning Algorithm 被引量:1
2
作者 DUAN Junhong LI Xiaoyu MU Dejun 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2019年第2期161-168,共8页
This paper presents a novel algorithm for an extreme form of weak label learning, in which only one of all relevant labels is given for each training sample. Using genetic algorithm, all of the labels in the training ... This paper presents a novel algorithm for an extreme form of weak label learning, in which only one of all relevant labels is given for each training sample. Using genetic algorithm, all of the labels in the training set are optimally divided into several non-overlapping groups to maximize the label distinguishability in every group. Multiple classifiers are trained separately and ensembled for label predictions. Experimental results show significant improvement over previous weak label learning algorithms. 展开更多
关键词 weak-supervised LEARNING genetic algorithm MULTI-label classification
原文传递
基于弱标签争议的半自动分类数据标注方法
3
作者 李自强 杨薇 +1 位作者 杨先凤 罗林 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2891-2899,共9页
当前,深度主动学习(Deep Active Learning,DAL)在分类数据标注工作中获得成功,但如何筛选出最能提升模型性能的样本仍是难题.本文提出基于弱标签争议的半自动分类数据标注方法(Dispute about Weak Label based Deep Active Learning,DWL... 当前,深度主动学习(Deep Active Learning,DAL)在分类数据标注工作中获得成功,但如何筛选出最能提升模型性能的样本仍是难题.本文提出基于弱标签争议的半自动分类数据标注方法(Dispute about Weak Label based Deep Active Learning,DWLDAL),迭代地筛选出模型难以区分的样本,交给人工进行准确标注.该方法包含伪标签生成器和弱标签生成器,伪标签生成器是在准确标注的数据集上训练而成,用于生成无标签数据的伪标签;弱标签生成器则是在带伪标签的随机子集上训练而成.弱标签生成器委员会决定哪些无标签数据最有争议,则交给人工标注.本文针对文本分类问题,在公开数据集IMDB(Internet Movie DataBase)、20NEWS(20NEW Sgroup)和chnsenticorp(chnsenticorp_htl_all)上进行实验验证.从数据标注和分类任务的准确性2个角度,对3种不同投票决策方式进行评估.DWLDAL方法中数据标注的F1分数比现有方法Snuba分别提高30.22%、14.07%和2.57%,DWLDAL方法中分类任务的F1分数比Snuba分别提高1.01%、22.72%和4.83%. 展开更多
关键词 深度主动学习 文本分类 伪标签生成器 弱标签生成器 投票委员会
下载PDF
局部特征引导标签平滑与优化的井下弱特征人员重识别
4
作者 张杰 缪小然 +3 位作者 赵作鹏 胡建峰 闵冰冰 高宇蒙 《工矿自动化》 CSCD 北大核心 2024年第2期83-89,共7页
煤矿井下低照度、强光扰、高粉尘等环境条件,以及井下人员服装的相似性和脸部落煤现象,导致井下弱特征人员重识别困难。现有人员重识别方法仅提取全局特征,未充分考虑局部特征,使得井下人员重识别准确率较低。针对上述问题,提出了一种... 煤矿井下低照度、强光扰、高粉尘等环境条件,以及井下人员服装的相似性和脸部落煤现象,导致井下弱特征人员重识别困难。现有人员重识别方法仅提取全局特征,未充分考虑局部特征,使得井下人员重识别准确率较低。针对上述问题,提出了一种局部特征引导标签平滑与优化的井下弱特征人员重识别方法。该方法首先通过卷积神经网络提取井下人员图像的全局特征与局部特征;然后利用k最近邻相似性计算全局特征和局部特征的互补性得分,来衡量全局特征和局部特征的相似程度;最后根据特征互补性得分对局部特征进行标签平滑及对全局特征进行标签优化,即动态调整每个局部特征的权重,以改进每个局部特征的标签,并对局部特征的预测结果进行汇总,利用更可靠的信息来完善标签以作为全局特征的标签,从而减少图像噪声并增强特征识别能力。实验结果表明,该方法在公开数据集和包含井下人员图像的自建数据集上的平均精度均值(mAP)、第一匹配正确率(Rank-1)和平均逆置负样本惩罚率(mINP)总体优于主流人员重识别方法,具有良好的泛化性和鲁棒性,能有效实现井下弱特征人员重识别。 展开更多
关键词 人员重识别 弱特征人员 局部特征 标签平滑 标签优化 特征互补性
下载PDF
数据恶劣条件下的辐射源个体识别方法综述
5
作者 闫文君 段可欣 +2 位作者 凌青 李春雷 黄丽 《海军航空大学学报》 2024年第5期523-534,共12页
文章分析对比了数据恶劣条件下的辐射源个体识别方法。总结了包括不平衡、错误标签、小样本和弱标注4种情况下的个体识别方法,探讨了辐射源特征提取方法的优点和局限性,对方法中作为技术关键和难点的特征提取方法进行了概括,并指出深度... 文章分析对比了数据恶劣条件下的辐射源个体识别方法。总结了包括不平衡、错误标签、小样本和弱标注4种情况下的个体识别方法,探讨了辐射源特征提取方法的优点和局限性,对方法中作为技术关键和难点的特征提取方法进行了概括,并指出深度学习在深度特征提取上的优势,以及在辐射源个体识别领域所具有的广泛应用前景,以期对各种情况下的辐射源个体识别方法做出较为全面的补充。 展开更多
关键词 辐射源个体识别 不平衡识别 小样本识别 错误标签 弱标注 深度学习
下载PDF
一种针对弱标记的直推式多标记分类方法 被引量:13
6
作者 孔祥南 黎铭 +1 位作者 姜远 周志华 《计算机研究与发展》 EI CSCD 北大核心 2010年第8期1392-1399,共8页
多标记学习主要解决一个样本可以同时属于多个类别的问题,它广泛适用于图像场景分类、文本分类等任务.在传统的多标记学习中,分类器往往需要利用大量具有完整标记的训练样本才能获得较好的分类性能,然而,在很多现实应用中又往往只能获... 多标记学习主要解决一个样本可以同时属于多个类别的问题,它广泛适用于图像场景分类、文本分类等任务.在传统的多标记学习中,分类器往往需要利用大量具有完整标记的训练样本才能获得较好的分类性能,然而,在很多现实应用中又往往只能获得少量标记不完整的训练样本.为了更好地利用这些弱标记训练样本,提出一种针对弱标记的直推式多标记分类方法,它可以通过标记误差加权来补全样本标记,同时也能更好地利用弱标记样本提高分类性能.实验结果表明,该方法在弱标记情况下的图像场景分类任务上具有较好的性能提高. 展开更多
关键词 机器学习 多标记学习 弱标记 图像场景分类 直推式学习
下载PDF
一种基于弱标签的三维模型语义自动标注方法 被引量:3
7
作者 田枫 沈旭昆 +2 位作者 刘贤梅 周凯 杜睿山 《系统仿真学报》 CAS CSCD 北大核心 2012年第9期1873-1876,1881,共5页
随着三维应用的普及,三维模型大量产生并广泛传播。由于三维模型广泛应用于计算机辅助设计、三维游戏、电影特效制作等诸多领域,已经形成了大量的三维模型数据库。三维模型语义标注的目的是给出描述其语义的标注词,是三维模型管理和基... 随着三维应用的普及,三维模型大量产生并广泛传播。由于三维模型广泛应用于计算机辅助设计、三维游戏、电影特效制作等诸多领域,已经形成了大量的三维模型数据库。三维模型语义标注的目的是给出描述其语义的标注词,是三维模型管理和基于文本的三维检索的关键技术。针对互联网大量存在的弱标签三维模型现状,提出一种基于弱标签的三维模型语义标注方法LPMLL,首先,采用半监督学习方法进行标签传播,得到标注词置信度,达到提升训练集的目的。然后,采用一种基于最大后验概率准则的方法进行多标签学习,得到最终标注词。实验数据表明了该方法的有效性。 展开更多
关键词 三维模型自动标注 语义标注 半监督学习 弱标签
下载PDF
基于正则化的半监督弱标签分类方法 被引量:5
8
作者 丁家满 刘楠 +2 位作者 周蜀杰 贾连印 李润鑫 《计算机学报》 EI CAS CSCD 北大核心 2022年第1期69-81,共13页
针对多标签学习中实例标签的缺失补全和预测问题,本文提出一种基于正则化的半监督弱标签分类方法(简称SWCMR),方法同时兼顾实例相似性和标签相关性.SWCMR首先根据标签相关性对弱标签实例的缺失标签进行初步预估,然后利用弱标签实例和无... 针对多标签学习中实例标签的缺失补全和预测问题,本文提出一种基于正则化的半监督弱标签分类方法(简称SWCMR),方法同时兼顾实例相似性和标签相关性.SWCMR首先根据标签相关性对弱标签实例的缺失标签进行初步预估,然后利用弱标签实例和无标签实例构造邻域图,从实例相似性和标签相关性角度构建基于平滑性假设的正则化项,接下来利用预估后的弱标签实例结合无标签实例训练半监督弱标签分类模型.在多种公共多标签数据集上的实验结果表明,SWCMR提高了分类性能,尤其是标签信息较少时,分类效果提升更显著. 展开更多
关键词 半监督弱标签学习 多标签分类 正则化 标签相关性
下载PDF
特征回归与检测结合的人数统计方法 被引量:5
9
作者 周治平 许伶俐 李文慧 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第3期425-432,共8页
针对目前特征回归与检测这2种主流的人流量统计方法的不足,提出一种基于特征回归与检测结合的人数统计方法.对于视频帧的远景区域,采用背景分割的方法提取出前景块,将前景块中的特征通过贝叶斯多核支持向量回归方法估计出人数;对于近景... 针对目前特征回归与检测这2种主流的人流量统计方法的不足,提出一种基于特征回归与检测结合的人数统计方法.对于视频帧的远景区域,采用背景分割的方法提取出前景块,将前景块中的特征通过贝叶斯多核支持向量回归方法估计出人数;对于近景区域提取HOG特征,采用弱标签结构训练出模型,并采用星型结构混合模型级联检测实现行人的准确定位并统计出人数.在视频数据库上的实验结果表明,该方法不仅能够较准确地实现人流量的统计,在一定程度上减少统计时间,还能够准确地定位出一定尺度范围内行人的位置. 展开更多
关键词 人流量统计 贝叶斯多核支持向量回归 行人检测 HOG特征 弱标签结构
下载PDF
弱标签环境下基于语义邻域学习的图像标注 被引量:4
10
作者 田枫 沈旭昆 《计算机研究与发展》 EI CSCD 北大核心 2014年第8期1821-1832,共12页
图像语义自动标注是实现图像语义检索与管理的关键,是具有挑战性的研究课题.传统的图像标注方法需要具有完整、准确标签的数据集才能取得较好的标注性能.然而,在现实应用中获得数据的标签往往是不准确、不完整的,并且标签分布不均衡.对... 图像语义自动标注是实现图像语义检索与管理的关键,是具有挑战性的研究课题.传统的图像标注方法需要具有完整、准确标签的数据集才能取得较好的标注性能.然而,在现实应用中获得数据的标签往往是不准确、不完整的,并且标签分布不均衡.对于Web图像和社会化图像尤其如此.为了更好地利用这些弱标签样本,提出了一种基于语义邻域学习的图像自动标注方法(semantic neighborhood learning from weakly labeled image,SNLWL).首先在邻域标签损失误差最小化意义下,填充训练集样本标签.通过递进式的邻域选择过程,保证建立的语义一致邻域内样本具有全局相似性、部分相关性和语义一致性,并且语义标签分布平衡.在邻域标签重构误差最小化意义下进行标签预测,降低噪声标签对性能的影响.多个数据集上的实验结果表明,与已知的具有较好标注效果的方法相比,此方法更适用于处理弱标签数据集,标准评测集上的测试也表明了此方法的有效性. 展开更多
关键词 图像标注 自动标注 弱标签 语义邻域 邻域学习
下载PDF
基于弱标签的多示例迁移学习方法 被引量:1
11
作者 肖燕珊 梁飞 刘波 《计算机应用研究》 CSCD 北大核心 2021年第1期125-128,共4页
作为监督学习的一种变体,多示例学习(MIL)试图从包中的示例中学习分类器。在多示例学习中,标签与包相关联,而不是与单个示例相关联。包的标签是已知的,示例的标签是未知的。MIL可以解决标记模糊问题,但要解决带有弱标签的问题并不容易... 作为监督学习的一种变体,多示例学习(MIL)试图从包中的示例中学习分类器。在多示例学习中,标签与包相关联,而不是与单个示例相关联。包的标签是已知的,示例的标签是未知的。MIL可以解决标记模糊问题,但要解决带有弱标签的问题并不容易。对于弱标签问题,包和示例的标签都是未知的,但它们是潜在的变量。现在有多个标签和示例,可以通过对不同标签进行加权来近似估计包和示例的标签。提出了一种新的基于迁移学习的多示例学习框架来解决弱标签的问题。首先构造了一个基于多示例方法的迁移学习模型,该模型可以将知识从源任务迁移到目标任务中,从而将弱标签问题转换为多示例学习问题。在此基础上,提出了一种求解多示例迁移学习模型的迭代框架。实验结果表明,该方法优于现有多示例学习方法。 展开更多
关键词 多示例学习 迁移学习 弱标签
下载PDF
基于小样本集弱学习规则的KNN分类算法 被引量:8
12
作者 冷明伟 陈晓云 谭国律 《计算机应用研究》 CSCD 北大核心 2011年第3期915-917,共3页
KNN及其改进算法使用类标号已知的数据集Dl对类标号未知的数据集Du进行类别标志,如果Dl中的数据数量过少,将会影响最后的分类精度。基于小样本弱学习规则的KNN分类算法旨在提高基于小样本集的KNN算法的分类精度,它首先对Dl中的数据对象... KNN及其改进算法使用类标号已知的数据集Dl对类标号未知的数据集Du进行类别标志,如果Dl中的数据数量过少,将会影响最后的分类精度。基于小样本弱学习规则的KNN分类算法旨在提高基于小样本集的KNN算法的分类精度,它首先对Dl中的数据对象进行学习,从中选取一些数据,利用学到的标签知识对其进行类别标号,然后将其加入到Dl中;最后利用扩展后的Dl对Du中的数据对象进行类别标志。通过使用标准数据集的测试发现,该算法能够提高KNN的分类精度,取得了较满意的结果。 展开更多
关键词 机器学习 K-最近邻分类 小样本集 标签数据 弱学习规则
下载PDF
基于缩影的多时相遥感语义变化检测方法 被引量:1
13
作者 景维鹏 王健 +2 位作者 张文钧 谷俊涛 陈广胜 《华中农业大学学报》 CAS CSCD 北大核心 2023年第3期123-132,共10页
针对高分辨率遥感图像标签稀缺和标签技术增长缓慢限制了多时相语义变化检测发展的问题,提出了采用有噪声、低分辨率的弱标签替代高分辨率标签进行多时相语义变化检测的方法。首先,采用低分辨率卫星数据平滑高分辨率遥感图像输入的质量... 针对高分辨率遥感图像标签稀缺和标签技术增长缓慢限制了多时相语义变化检测发展的问题,提出了采用有噪声、低分辨率的弱标签替代高分辨率标签进行多时相语义变化检测的方法。首先,采用低分辨率卫星数据平滑高分辨率遥感图像输入的质量差异。其次,通过将缩影(epitomes)模型和标签超分辨率算法作为统计推理算法相结合的方法预估高分辨率遥感图像分类图,并拟合一个小型FCN网络对生成的遥感图像分类图进行后处理来改善其分类的效果。最后,通过对比不同时相土地覆盖分类图像之间的差异得出变化检测结果。结果表明,本研究提出的方法与其他多时相语义变化检测方法 FCN/all相比,平均交并比(mIoU)提高了8.9个百分点,能够有效检测土地覆盖分类变化。 展开更多
关键词 弱监督 标签超分辨率 缩影 土地覆盖变化图 语义分割 遥感影像 变化检测
下载PDF
基于改进池化层的弱标记声音事件检测 被引量:5
14
作者 刘淼 王晶 +1 位作者 董桂官 易伟明 《信号处理》 CSCD 北大核心 2021年第10期1907-1913,共7页
针对DCASE2017挑战赛任务4提供的大规模弱标记声音事件检测数据集,我们搭建了基于梅尔滤波器特征(Fbank)、卷积神经网络(CNN)以及循环神经网络(RNN)的多类别声音事件检测系统,分析了attention和linear softmax两种已有的常用池化层在神... 针对DCASE2017挑战赛任务4提供的大规模弱标记声音事件检测数据集,我们搭建了基于梅尔滤波器特征(Fbank)、卷积神经网络(CNN)以及循环神经网络(RNN)的多类别声音事件检测系统,分析了attention和linear softmax两种已有的常用池化层在神经网络反向传播中的部分推演过程,并在linear softmax池化层的基础上进行改进,提出了一种"指数可学习的幂函数softmax"池化层。实验结果表明,相比于DCASE竞赛中获得第一名的模型,应用"指数可学习的幂函数softmax"池化层的检测系统,将段级别的声音事件预测的F1值从0.556提高到0.652,帧级别预测的F1值从0.518提高到0.583,帧级别预测的error rate(ER)从0.730降低到0.667。 展开更多
关键词 弱标记 声音事件检测 池化层 指数可学习的幂函数softmax
下载PDF
基于标记与特征依赖最大化的弱标记集成分类 被引量:3
15
作者 谭桥宇 余国先 +1 位作者 王峻 郭茂祖 《软件学报》 EI CSCD 北大核心 2017年第11期2851-2864,共14页
弱标记学习是多标记学习的一个重要分支,近几年已被广泛研究并被应用于多标记样本的缺失标记补全和预测等问题.然而,针对特征集合较大、更容易拥有多个语义标记和出现标记缺失的高维数据问题,现有弱标记学习方法普遍易受这类数据包含的... 弱标记学习是多标记学习的一个重要分支,近几年已被广泛研究并被应用于多标记样本的缺失标记补全和预测等问题.然而,针对特征集合较大、更容易拥有多个语义标记和出现标记缺失的高维数据问题,现有弱标记学习方法普遍易受这类数据包含的噪声和冗余特征的干扰.为了对高维多标记数据进行准确的分类,提出了一种基于标记与特征依赖最大化的弱标记集成分类方法 En WL.En WL首先在高维数据的特征空间多次利用近邻传播聚类方法,每次选择聚类中心构成具有代表性的特征子集,降低噪声和冗余特征的干扰;再在每个特征子集上训练一个基于标记与特征依赖最大化的半监督多标记分类器;最后,通过投票集成这些分类器实现多标记分类.在多种高维数据集上的实验结果表明,En WL在多种评价度量上的预测性能均优于已有相关方法. 展开更多
关键词 弱标记学习 高维数据 特征子集 依赖最大化 集成分类
下载PDF
基于可变形部件模型及稀疏特征的行人检测 被引量:2
16
作者 甘鹏坤 陶凌 龙伟 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2015年第6期563-570,共8页
针对方向梯度直方图算法无法处理模糊边界且忽略了物体内平滑的特征区域的问题,提出一种基于稀疏编码的可变形部件模型算法.通过稀疏学习得到稀疏编码直方图特征算子的图像特征,利用弱标签隐藏变量结构化支持向量机学习算法对特征进行... 针对方向梯度直方图算法无法处理模糊边界且忽略了物体内平滑的特征区域的问题,提出一种基于稀疏编码的可变形部件模型算法.通过稀疏学习得到稀疏编码直方图特征算子的图像特征,利用弱标签隐藏变量结构化支持向量机学习算法对特征进行训练得到部件模型,再结合级联检测算法对人体目标进行识别检测.实验结果显示,混合模型结合级联方法的检测耗时约是混合模型和语义模型平均检测耗时的1/4,与目前其他已有算法比较,所提方法更加鲁棒和具有识别力. 展开更多
关键词 图像处理 人体检测 稀疏特征 部件模型 弱标签隐藏变量支持向量机学习算法 级联检测
下载PDF
弱标签环境下基于多尺度注意力融合的声音识别检测 被引量:4
17
作者 郑伟哲 仇鹏 韦娟 《计算机科学》 CSCD 北大核心 2020年第5期120-123,共4页
目前大多数声音识别检测的研究都是基于强标签数据集的,但在真实环境的声音识别与检测任务中,音频标签不完整并且含有大量噪声,使得获取强标签音频数据比较困难,进而影响对声音的准确识别与检测。为此,在卷积循环神经网络模型的基础上,... 目前大多数声音识别检测的研究都是基于强标签数据集的,但在真实环境的声音识别与检测任务中,音频标签不完整并且含有大量噪声,使得获取强标签音频数据比较困难,进而影响对声音的准确识别与检测。为此,在卷积循环神经网络模型的基础上,提出了一种多尺度注意力融合机制。该机制使用注意力门控单元,在降低声音时频图特征中噪声影响的同时,能够更多地利用有效特征。同时,通过结合多个尺寸的卷积核进行特征融合,进一步提升对声音特征的有效提取。此外,采用一种结合帧检测结果的加权法对声音信号进行识别。最后,在弱标签环境下,从AudioSet数据库中选取一个包含17种城市交通工具声音的弱标签数据集进行检测识别,所提模型对测试集声音识别结果的F 1值为58.9%,检测结果的F 1值为43.7%。结果表明,在弱标签城市交通工具声数据集下,网络模型相比传统的声音识别检测模型具有更高的识别检测精度;同时,重要性加权识别方法、多尺度注意力融合方法均可提升模型对声音识别检测的精度。 展开更多
关键词 弱标签 多尺度 注意力 声音识别 声音检测
下载PDF
基于超像素图割的多类别弱标注强化算法 被引量:3
18
作者 林佳丽 刘秉瀚 《计算机工程与设计》 北大核心 2019年第7期1971-1977,共7页
为解决基于深度学习的图像语义分割逐像素制作语义标签训练集耗时耗力的问题,提出一种便捷的基于超像素图割的多类别弱标注强化算法。在弱标注框内自适应提取超像素,采用交互式涂鸦结合超像素扩充前景背景采样点;根据框内采样点对高斯... 为解决基于深度学习的图像语义分割逐像素制作语义标签训练集耗时耗力的问题,提出一种便捷的基于超像素图割的多类别弱标注强化算法。在弱标注框内自适应提取超像素,采用交互式涂鸦结合超像素扩充前景背景采样点;根据框内采样点对高斯混合模型参数进行初始化;迭代更新参数,使用最小割算法对像素点进行分类,实现像素级强标注。实验结果表明,在保证标注精度的前提下,该方法较传统人工与Grabcut算法在标注上具有较大效率优势,对服装图像重新标注并作为全卷积网络训练集,达到与原始数据集相近的分割精度。 展开更多
关键词 图像语义分割 超像素图割 弱标注强化 多类别 全卷积网络
下载PDF
一种基于标签传播的两阶段社区发现算法 被引量:12
19
作者 郑文萍 车晨浩 +1 位作者 钱宇华 王杰 《计算机研究与发展》 EI CSCD 北大核心 2018年第9期1959-1971,共13页
针对标签传播社区发现算法在节点更新顺序及标签传播过程中存在较大随机性而导致划分结果稳定性差的问题,提出一种基于标签传播的两阶段社区发现算法(a two-stage community detectionalgorithm based on label propagation,LPA-TS),通... 针对标签传播社区发现算法在节点更新顺序及标签传播过程中存在较大随机性而导致划分结果稳定性差的问题,提出一种基于标签传播的两阶段社区发现算法(a two-stage community detectionalgorithm based on label propagation,LPA-TS),通过参与系数确定节点更新顺序,并在标签传播过程中依据节点间相似性更新节点标签,得到初始社区划分.将社区看作节点,社区间连边数作为边权重,得到社区关系网络.按照参与系数由低到高的顺序合并社区关系网络中的节点,得到最终社区划分结果.算法LPA-TS减少了传统LPA方法在节点更新和标签传播过程的随机性;在第2阶段,将不符合弱社区定义的初始社区与连边最多的相邻社区合并,再按照社区参与系数由低到高的顺序合并初始社区提升社区发现质量.通过与一些经典算法在8个真实网络及不同参数下LFR benchmark人工网络数据集上的实验比较表明LPA-TS算法表现了良好的稳定性,在NMI、ARI、模块性等方面表现良好. 展开更多
关键词 复杂网络 社区发现 标签传播 参与系数 弱社区
下载PDF
针对弱标记数据的多标签分类算法 被引量:8
20
作者 王晶晶 杨有龙 《计算机工程与应用》 CSCD 北大核心 2020年第5期65-73,共9页
针对标签信息不完整的多标签分类问题,一种新的多标签算法MCWD被提出。它通过有效地恢复训练数据中缺失的标签信息,能够产生更好的分类结果。在训练阶段,MCWD通过迭代更新每个训练实例的权重以及利用两两标签之间的相关性来恢复训练数... 针对标签信息不完整的多标签分类问题,一种新的多标签算法MCWD被提出。它通过有效地恢复训练数据中缺失的标签信息,能够产生更好的分类结果。在训练阶段,MCWD通过迭代更新每个训练实例的权重以及利用两两标签之间的相关性来恢复训练数据中缺失的标签信息;在标签恢复完毕后,利用新得到的训练集来训练分类模型;用此模型对测试集进行预测。实验结果表明,该算法在14个多标签数据集上具有一定的优势。 展开更多
关键词 多标签分类 缺失标签 弱标记学习 标签相关性
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部