期刊文献+
共找到266篇文章
< 1 2 14 >
每页显示 20 50 100
基于密度峰值的标签传播算法
1
作者 吴卫江 王星豪 +2 位作者 潘雪玲 郑艺峰 郑猋 《计算机与数字工程》 2024年第1期81-86,共6页
随着智能技术应用的推广,高质量社区的检测已成为社会网络研究的热点之一。由于具有线性时间复杂度,且无需预定义目标函数和社团数,标签传播算法(LPA)已得到广泛关注。然而,在标签传播过程中,LPA具有不确定性和随机性,进而影响检测社区... 随着智能技术应用的推广,高质量社区的检测已成为社会网络研究的热点之一。由于具有线性时间复杂度,且无需预定义目标函数和社团数,标签传播算法(LPA)已得到广泛关注。然而,在标签传播过程中,LPA具有不确定性和随机性,进而影响检测社区结果的准确性和稳定性。为此,提出一种基于密度峰值的标签传播社区检测方法(DPC-RWL)。首先,采用密度峰值聚类算法查找出社区的核心节点集合,计算节点与核心节点集之间的权重,选取最大值为该节点赋予权值。最后,使用基于标签传播算法的归属度函数进行传播。真实网络和LFR人工基准网络的对比实验表明,所提算法能准确高效地识别出社区结构。 展开更多
关键词 密度峰值聚类 标签传播 节点权重 社交网络
下载PDF
增强学习标签相关性的多标签特征选择方法
2
作者 滕少华 卢建磊 +1 位作者 滕璐瑶 张巍 《计算机应用研究》 CSCD 北大核心 2024年第7期2079-2086,共8页
针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合... 针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合样本语义信息的代表性实例,同时计算其对应的标签向量,而这些标签向量体现了每个簇包含不同标签的重要程度;其次,通过原始样本和每个簇中心的标签级自表示,既捕获了原始标签空间中的标签相关性,又探索了每一个簇内的标签相关性;最后,对自表示系数矩阵进行稀疏处理,以减少噪声的影响,并将原始样本和每个簇代表性实例分别从特征空间映射到重构标签空间进行特征选择。在9个多标签数据集上的实验结果表明,所提算法与其他方法相比具有更好的性能。 展开更多
关键词 多标签学习 特征选择 标签相关性 聚类
下载PDF
面向复杂网络舆情知识发现的事理图谱方法优化
3
作者 肖亚龙 冯皓 +1 位作者 朱承璋 冯杰 《情报杂志》 CSSCI 北大核心 2024年第10期134-143,共10页
[研究目的]优化事理图谱构建方法,提升事理图谱工具在非结构化网络舆情数据中的知识发现能力,能更好挖掘复杂网络舆情事件内部的因果关系和演化路径。[研究方法]研究采用RoBERTa预训练模型进行序列标注以取代传统模式匹配方法,引入Word2... [研究目的]优化事理图谱构建方法,提升事理图谱工具在非结构化网络舆情数据中的知识发现能力,能更好挖掘复杂网络舆情事件内部的因果关系和演化路径。[研究方法]研究采用RoBERTa预训练模型进行序列标注以取代传统模式匹配方法,引入Word2Vec词向量和BERTopic主题模型取代传统机器学习聚类算法,对知乎平台“硅谷银行破产”网络舆情进行实证分析。[研究结论]结果表明,融合深度学习与序列标注的因果关系抽取在114901个上下文中识别到68613条原始因果事件对,相较模式匹配方法高出46.47%;基于词向量与主题聚类模型的事件泛化将2148个代表事件划归为14个主题,在文本特征和语义特征层面的泛化效果优于K-means算法。该文依据优化方法构建的网络舆情事理图谱围绕核心主题呈现“循环型”“紧密型”“长链型”的演化路径特征,构建流程和分析过程可为网络舆情治理提供工具及决策支持。 展开更多
关键词 网络舆情 事理图谱 知识发现 深度学习 序列标注 主题聚类
下载PDF
基于聚类及长短时记忆神经网络预测油田产量 被引量:1
4
作者 王洪亮 林霞 +1 位作者 蒋丽维 刘宗尚 《石油科学通报》 CAS 2024年第1期62-72,共11页
利用机器学习方法预测油田产量的精度与训练样本的代表性及数量息息相关。通常,采用油田生产数据或者油井生产数据构建训练样本。将油田作为训练样本,存在“小样本”的问题;将油井作为训练样本,由于老油田一般具有开发层系多、生产历史... 利用机器学习方法预测油田产量的精度与训练样本的代表性及数量息息相关。通常,采用油田生产数据或者油井生产数据构建训练样本。将油田作为训练样本,存在“小样本”的问题;将油井作为训练样本,由于老油田一般具有开发层系多、生产历史长、油井投产批次多等特点,人工标注能够代表油田产量递减规律的训练样本难度大,且耗时费力。本文将油田和油井生产数据有机融合构建训练样本,建立产量智能预测模型,预测油田产量。首先,采用无监督学习的K均值聚类算法,依据有效厚度、孔隙度、渗透率、饱和度等信息对油井进行聚类分析,识别产量递减类别,并将每类油井转换成一口典型油井作为该类油井的代表;其次,将典型井作为预测对象,通过从每类油井中按比例随机抽取油井来增加训练样本数量,即将典型井和油井生产数据融合构建训练样本;最后,基于长短时记忆循环神经网络建立模型预测典型井产量,进而预测油田产量。研究结果表明:该方法既解决了油田数据作为训练样本的“小样本”问题,又降低了油井数据作为训练样本的标注难度与工作量,并且精度符合现场生产要求,对油气产量智能预测的工程化落地应用具有一定指导意义。 展开更多
关键词 油井产量 K-MEANS聚类 样本标注 神经网络 人工智能
下载PDF
伪标签指导下自适应聚类网络
5
作者 张鑫煜 徐慧英 +1 位作者 陈宇杭 朱信忠 《浙江师范大学学报(自然科学版)》 CAS 2024年第4期404-412,共9页
深度聚类是一种结合深度学习进行数据表征学习的聚类方法.这种方法在聚类的基础上,利用深度学习技术来学习数据的内在结构和特征,从而更有效地进行大规模数据的聚类,在推荐系统和异常检测等领域有广泛的应用.然而,目前的深度聚类方法存... 深度聚类是一种结合深度学习进行数据表征学习的聚类方法.这种方法在聚类的基础上,利用深度学习技术来学习数据的内在结构和特征,从而更有效地进行大规模数据的聚类,在推荐系统和异常检测等领域有广泛的应用.然而,目前的深度聚类方法存在以下2个问题:1)传统的深度聚类网络没有充分利用图节点先验分布的信息;2)基于对比学习的深度聚类网络平等对待每一个样本,降低了模型的区分度.基于此,提出了一种结合伪标签和动态更新权重的聚类网络.该方法通过对原始图节点聚类得到伪标签,应用于交叉视图相似度矩阵生成正负样本对,以便模型能够正确地学习区分正负样本.之后,样本对根据自身相似度值计算自适应权重,再通过权重更新样本对的损失梯度.此外,在损失函数中引入类内类间阈值来寻找样本对相似度的最优值.在6个真实数据集上进行节点聚类实验,证明了该方法的优越性和有效性. 展开更多
关键词 自监督学习 深度聚类 对比学习 聚类伪标签 自适应权重
下载PDF
一种基于层次聚类的人力数据标签体系设计与实现
6
作者 明丽洪 马永一 +1 位作者 罗昌俊 付渲理 《兵工自动化》 北大核心 2024年第11期32-35,共4页
人力数据作为各业务领域数据的核心承载点,是连接人、物理实体、业务活动的关键点。通过设计人力数据标签体系,将人力数据属性抽象为图结构,通过层次聚类算法实现不同属性集的自动聚类和人才梯队划分,可按照专业领域方向、科研项目承担... 人力数据作为各业务领域数据的核心承载点,是连接人、物理实体、业务活动的关键点。通过设计人力数据标签体系,将人力数据属性抽象为图结构,通过层次聚类算法实现不同属性集的自动聚类和人才梯队划分,可按照专业领域方向、科研项目承担、科研成果获得、人才奖励等维度实现人力数据的抽取和灵活组合呈现,为人才梯队层级的培养规划与目标拟定奠定基础。 展开更多
关键词 人力资源 数据标签 层次聚类
下载PDF
基于特征表达和模型预测的主动学习
7
作者 姜海涛 邱保志 李向丽 《计算机工程与设计》 北大核心 2024年第9期2757-2763,共7页
为解决当前的主动学习算法在采样时通常忽略样本特征表达信息的问题,提出一个基于样本特征表达和模型预测的主动学习模型。针对主动学习算法在模型训练早期阶段引起的冷启动问题,提出一个标注集初始化算法。利用聚类技术提取样本特征表... 为解决当前的主动学习算法在采样时通常忽略样本特征表达信息的问题,提出一个基于样本特征表达和模型预测的主动学习模型。针对主动学习算法在模型训练早期阶段引起的冷启动问题,提出一个标注集初始化算法。利用聚类技术提取样本特征表达信息,通过分类器得到样本的模型预测信息,致力于使初始标注集的样本分布尽可能接近原始数据集的分布。实验结果表明,该模型分类准确率优于多个主动学习基线算法,该算法能够有效缓解模型的冷启动问题。 展开更多
关键词 主动学习 特征表达 模型预测 冷启动 聚类 图像分类 标注集初始化
下载PDF
多项正则化约束的伪标签传播优化脑电信号聚类
8
作者 代成龙 李光辉 +2 位作者 李栋 申佳华 皮德常 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期156-171,共16页
作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题... 作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题,也在一定程度上限制了无标签脑电信号这类新型数据的应用拓展.为了解决无标签脑电信号的无监督分析问题,提出了一种基于多项正则化约束的伪标签传播优化聚类模型.该模型通过同时优化学习伪标签传播矩阵、脑电信号相似度邻接矩阵、标签分类器的方式实现聚类.将提出的脑电信号聚类模型转化为一个多目标优化问题,并提出了一种基于梯度下降策略的聚类算法EEGapc(electroencephalogram clustering with pseudo label propagation).该算法不仅充分考虑了脑电信号之间的相关性及脑电信号间的信息传递,还能快速收敛到局部最优.在14个真实脑电信号数据集上的实验结果表明,提出的EEGapc脑电信号聚类算法比现有的8种聚类算法性能更好,且在平均NMI(normalized mutual information),ARI(adjusted rand index),F-score,kappa这4个指标上,EEGapc与现有的8种聚类算法相比,分别至少提升了86.88%,58.01%,6.29%,61.17%. 展开更多
关键词 脑电信号聚类 伪标签传播 邻接矩阵优化 伪标签分类器 多目标优化
下载PDF
RFID标签冲突低复杂度聚类分离方法
9
作者 郭佳雯 吴海锋 +1 位作者 高威 曾玉 《计算机工程与设计》 北大核心 2024年第7期1972-1980,共9页
由于多个无线射频识别(RFID)标签同时与阅读器通信易发生冲突,通信效率较低,因此标签防冲突是RFID通信系统的一个重要问题。对此,提出一种PCA降维与一维投影结合的聚类方法,解决标签冲突。通过PCA降维找到最大化投影方向进行投影,采用... 由于多个无线射频识别(RFID)标签同时与阅读器通信易发生冲突,通信效率较低,因此标签防冲突是RFID通信系统的一个重要问题。对此,提出一种PCA降维与一维投影结合的聚类方法,解决标签冲突。通过PCA降维找到最大化投影方向进行投影,采用蒙特卡洛方法快速找到峰值作为聚类中心,完成信号分离。仿真数据中,不同信道衰落系数下,该方法都能在20 dB后成功解码,分离效率达到100%;实测数据中,该方法的时间复杂度低于传统算法,吞吐量达到0.55。 展开更多
关键词 无线射频识别 标签冲突 聚类 信号分离 蒙特卡洛 低复杂度 FM0码
下载PDF
基于共享背景主题的Labeled LDA模型 被引量:17
10
作者 江雨燕 李平 王清 《电子学报》 EI CAS CSCD 北大核心 2013年第9期1794-1799,共6页
隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labe... 隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labeled LDA模型(Shared Background Topics Labeled LDA,SBTL-LDA).在SBTL-LDA模型中每个标记除了存在若干个独享的局部主题外,还存在若干个共享的背景(Background)主题,这样可以有效分析不同标记所含主题之间的依赖关系,而文档标记被映射为局部主题和共享主题的组合,因此SBTL-LDA模型可以有效提升文档标记判别的准确性.同时SBTL-LDA模型还可以看成是一种半监督聚类模型,在对文档进行聚类分析的过程中模型可以有效的利用文档的标记信息提升文档聚类效果.实验证明SBTL-LDA模型能够有效解决PLDA模型中主题之间的相似性和依赖关系,具有良好的多标记判别能力,并且具有优于LDA、PLDA模型的文档聚类效果. 展开更多
关键词 隐藏狄利克雷分配 文本分析 多标记学习 半监督聚类
下载PDF
基于伪标签正则化损失的无监督行人重识别
11
作者 贾洁茹 张硕蕊 +1 位作者 钱宇华 阮秋琦 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1743-1758,共16页
无监督行人重识别旨在不需要行人身份标签的情况下,将查询的行人图像与候选集中的行人图像相匹配.目前主流的无监督行人重识别方法通常先利用聚类算法生成伪标签,然后利用伪标签训练深度神经网络.然而由于模型初始表征能力不足和聚类算... 无监督行人重识别旨在不需要行人身份标签的情况下,将查询的行人图像与候选集中的行人图像相匹配.目前主流的无监督行人重识别方法通常先利用聚类算法生成伪标签,然后利用伪标签训练深度神经网络.然而由于模型初始表征能力不足和聚类算法的局限性等,伪标签中会引入大量噪声,严重误导模型优化过程,导致模型性能退化.为了减轻伪标签噪声的影响,本文提出了一种新的伪标签正则化损失函数,用伪标签的置信度分数和样本相似度对伪标签噪声进行约束.具体来说,本文首先提出了一种聚类引导的注意力机制,根据伪标签与聚类中心的语义相关程度来估计伪标签的置信度,以此来识别噪声标签并给正确标签分配更多的权重,有效降低伪标签噪声在总体损失函数中的作用.同时,为了充分利用伪标签的判别能力,本文利用伪标签进行在线软样本挖掘,构建mini-batch中的正负样本对并为每个正负样本对计算一个连续的权重分数.通过将以上两种权重引入到对比损失中,本文提出的伪标签正则化损失函数可以有效抑制伪标签噪声的影响,减轻标签噪声对训练过程的影响,提高模型的准确性和鲁棒性.在多个公开行人数据集上的实验结果验证了本文方法的有效性,在Market1501、DukeMTMC-reID和MSMT17数据集上mAP分别达到了85.9%、75.1%和29.3%. 展开更多
关键词 行人重识别 无监督学习 伪标签噪声 对比学习 聚类优化
下载PDF
基于局部密度峰和标签传播的最小生成树聚类
12
作者 林钰莹 侯新民 《计算机系统应用》 2024年第8期18-29,共12页
基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在... 基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在保留原始数据集分布结构的同时,排除了噪声点,因此,将局部密度峰与最小生成树聚类算法相结合,采用标签传播,提出了基于局部密度峰和标签传播的最小生成树聚类算法(DPMST).该算法采用了局部密度峰之间基于共享邻的距离,利用局部密度峰之间的邻域信息,有效构造最小生成树和识别无效边,使算法能够发现具有复杂结构的簇.标签传播增强强标签,削弱弱标签,以细化错误的标签,特别是对于边界点以及揭示复杂流形,能够提高聚类结果的质量.人工和真实数据集上的实验结果表明,与经典聚类算法DPC、MST、K-means、DBSCAN、AP、SC和BIRCH比较,DPMST算法表现优异. 展开更多
关键词 局部密度峰 最小生成树 标签传播 聚类
下载PDF
基于证据理论的三向密度峰值聚类
13
作者 赵乌吉斯古楞 凃云杰 《计算机应用与软件》 北大核心 2024年第5期264-273,共10页
为避免聚类标签错误传播,并且充分挖掘邻域信息,提出一种基于证据理论的三向密度峰聚类方法。在分配非分组点时考虑到K近邻的聚类信息,有利于提升聚类精度;用证据理论来描述和合并这些近邻信息,使建立的三向聚类模型能够将它们分配到最... 为避免聚类标签错误传播,并且充分挖掘邻域信息,提出一种基于证据理论的三向密度峰聚类方法。在分配非分组点时考虑到K近邻的聚类信息,有利于提升聚类精度;用证据理论来描述和合并这些近邻信息,使建立的三向聚类模型能够将它们分配到最可能的聚类中,从而有效地避免了密度峰值聚类算法中错误标签的传播。在多个数据集上的实验对比结果表明,提出的方法能够有效避免聚类标签错误传播,并且实现了较高的聚类精度。 展开更多
关键词 密度峰值聚类 标签错误传播 三向理论 证据理论
下载PDF
面向目标机动类型的数据标签生成方法
14
作者 汪其林 曹志敏 高静 《指挥控制与仿真》 2024年第3期86-94,共9页
针对现有目标机动类型识别方法通用性不足、准确率较低等问题,提出基于改进K-medoids聚类的多层标签生成方法。以空中目标机动轨迹为例,设计多种数据预处理方法,采用动态时间规整作为聚类算法的距离度量,通过构建标签框架指导算法实施过... 针对现有目标机动类型识别方法通用性不足、准确率较低等问题,提出基于改进K-medoids聚类的多层标签生成方法。以空中目标机动轨迹为例,设计多种数据预处理方法,采用动态时间规整作为聚类算法的距离度量,通过构建标签框架指导算法实施过程,进行迭代聚类以生成多层标签。在公开数据集上测试算法,实验结果表明,该方法在无监督情况下对第一层标签的识别准确率达到89.75%,接近传统有监督算法;同时,相对于没有引入标签框架的情况,能更有效地区分第二层模糊标签。该方法只需少量专家知识,便能简单地扩展到不同领域、不同机动类型。 展开更多
关键词 标签生成 动态时间规整 K-medoids聚类
下载PDF
基于方向权值标签传播的微学习单元聚类算法
15
作者 胡志远 张月琴 陈健 《科学技术与工程》 北大核心 2024年第10期4189-4196,共8页
为帮助学习者从大量在线学资源中找到适合自身个性化的学习资源及顺序集合,提出了一种基于有向边方向权值的标签传播算法(label propagation algorithm on directed edge weights,LPADEW)用于发现适合特定学习者并属于同一学习周期的微... 为帮助学习者从大量在线学资源中找到适合自身个性化的学习资源及顺序集合,提出了一种基于有向边方向权值的标签传播算法(label propagation algorithm on directed edge weights,LPADEW)用于发现适合特定学习者并属于同一学习周期的微学习单元序列簇群。该算法对标签传播算法进行两个改进:根据单元节点的利用度确定标签的更新顺序,降低在节点更新顺序上的随机性;利用当前单元节点的前置邻居和后置邻居的有向边权累加值进行标签更新,并将标签权重引入标签更新策略,既可降低标签更新的随机性,也可避免形成巨型簇群。实验结果表明,LPADEW算法在微学习真实数据集和人工数据集中均取得了较好的结果。 展开更多
关键词 微学习 有向图 图聚类 有向边权值 标签传播
下载PDF
基于AEViT与先验知识的胶质瘤IDH1突变状态预测
16
作者 徐华畅 许倩 +3 位作者 赵钰琳 梁峰宁 徐凯 朱红 《智能系统学报》 CSCD 北大核心 2024年第4期952-960,共9页
针对目前预测胶质瘤异柠檬酸脱氢酶1(isocitrate dehydrogenase1,IDH1)突变状态存在的数据不足、准确率较低等问题,提出一种基于AEViT(auto-encoder vision Transformer)与先验知识的胶质瘤IDH1突变状态预测方法。首先使用改进的K-Mean... 针对目前预测胶质瘤异柠檬酸脱氢酶1(isocitrate dehydrogenase1,IDH1)突变状态存在的数据不足、准确率较低等问题,提出一种基于AEViT(auto-encoder vision Transformer)与先验知识的胶质瘤IDH1突变状态预测方法。首先使用改进的K-Means聚类算法为无IDH1突变状态标签的胶质瘤磁共振成像(magnetic resonance imaging,MRI)数据标注伪标签,并采用ViT(vision Transformer)网络对伪标签进行修正,得到最终的胶质瘤IDH1突变状态。为避免不准确的伪标签数据影响模型精度,采用果蝇优化算法为伪标签数据赋予最优权重;然后提出基于Auto-Encoder和ViT的分类模型AEViT,利用Auto-Encoder提取胶质瘤MRI特征;再将特征输入ViT中对胶质瘤IDH1突变状态进行分类;最后将基于胶质瘤位置信息的先验知识加入模型,达到99.01%的预测准确率。结果表明该方法优于其他现有模型,能够实现胶质瘤数据扩增和术前无创、准确地预测胶质瘤IDH1突变状态,从而辅助诊疗过程。 展开更多
关键词 胶质瘤 异柠檬酸脱氢酶1 K-MEANS聚类算法 伪标签 Auto-Encoder vision Transformer 果蝇优化算法 先验知识
下载PDF
利用多标签信息的聚类方法
17
作者 杨国安 王志岗 《天津理工大学学报》 2024年第1期15-21,共7页
k-means是当前使用最广泛的聚类算法,但其只对无标签信息的样本数据进行聚类,需用户提供初始聚类中心等信息且聚类花费时间长结果不稳定。当前很多数据集都带有多标签的信息,如何利用多标签信息更加快速有效的聚类是一个重要的研究方向... k-means是当前使用最广泛的聚类算法,但其只对无标签信息的样本数据进行聚类,需用户提供初始聚类中心等信息且聚类花费时间长结果不稳定。当前很多数据集都带有多标签的信息,如何利用多标签信息更加快速有效的聚类是一个重要的研究方向。文中提出了多标签数据的聚类方法,首先对多标签信息进行聚类得到适当的初始聚类中心,然后再使用k-means算法对大量样本做聚类。试验结果表明,该聚类方法比使用随机初始聚类中心的k-means算法具有更好的时间性能和聚类结果。 展开更多
关键词 多标签 聚类 K-MEANS 无标签
下载PDF
SAR ATR中标签噪声不确定性建模与纠正
18
作者 于跃 王琛 +6 位作者 师君 陶重犇 李良 唐欣欣 周黎明 韦顺军 张晓玲 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第5期974-984,共11页
深度监督学习在合成孔径雷达自动目标识别任务中的成功依赖于大量标签样本。但是,在大规模数据集中经常存在错误(噪声)标签,很大程度降低网络训练效果。该文提出一种基于损失曲线拟合的标签噪声不确定性建模和基于噪声不确定度的纠正方... 深度监督学习在合成孔径雷达自动目标识别任务中的成功依赖于大量标签样本。但是,在大规模数据集中经常存在错误(噪声)标签,很大程度降低网络训练效果。该文提出一种基于损失曲线拟合的标签噪声不确定性建模和基于噪声不确定度的纠正方法:以损失曲线作为判别特征,应用无监督模糊聚类算法获得聚类中心和类别隶属度以建模各样本标签噪声不确定度;根据样本标签噪声不确定度将样本集划分为噪声标签样本集、正确标签样本集和模糊标签样本集,以加权训练损失方法分组处理训练集,指导分类网络训练实现纠正噪声标签。在MSTAR数据集上的实验证明,该文所提方法可处理数据集中混有不同比例标签噪声情况下的网络训练问题,有效纠正标签噪声。当训练数据集中标签噪声比例较小(40%)时,该文所提方法可纠正98.6%的标签噪声,并训练网络达到98.7%的分类精度。即使标签噪声比例很大(80%)时,该文方法仍可纠正87.8%的标签噪声,并训练网络达到82.3%的分类精度。 展开更多
关键词 合成孔径雷达 标签噪声 标签噪声纠正 标签噪声不确定性建模 模糊聚类算法
下载PDF
基于数据挖掘和聚类分析的协同过滤推荐算法
19
作者 何岫钰 《电子设计工程》 2024年第9期47-50,共4页
为了提高推荐系统的可扩展性和用户满意度,设计基于数据挖掘和聚类分析的协同过滤推荐算法。基于双向关联规则原理,构建标签资源矩阵,利用K-means聚类算法对标签进行聚类。结合用户偏好标签,算法能计算标签与资源的紧密程度,实现基本推... 为了提高推荐系统的可扩展性和用户满意度,设计基于数据挖掘和聚类分析的协同过滤推荐算法。基于双向关联规则原理,构建标签资源矩阵,利用K-means聚类算法对标签进行聚类。结合用户偏好标签,算法能计算标签与资源的紧密程度,实现基本推荐。通过标签计算用户与资源的兴趣度,实现个性化推荐。将基本推荐和个性化推荐线性组合,得出最终结果。实验表明,该算法不仅能保持数据集的平衡状态,准确性也高。通过聚类捕捉更复杂的用户兴趣模式,显著提高了推荐结果的命中率和NDCG值,为用户提供更符合个性化需求的资源。 展开更多
关键词 数据挖掘 聚类分析 协同过滤推荐 标签相似度 偏好度 个性化推荐
下载PDF
样本标签污染条件下的雷达辐射源个体识别技术
20
作者 段可欣 闫文君 +2 位作者 凌青 王艳艳 王艺卉 《海军航空大学学报》 2024年第2期189-198,260,共11页
针对辐射源个体识别(Specific Emitter Identification,SEI)中由于数据集存在错误标签导致识别率下降的问题,提出了1种有监督和无监督融合的错误标签识别和纠正方法。首先采用无监督密度峰值聚类方法将数据集中出现的标签错误样本找出,... 针对辐射源个体识别(Specific Emitter Identification,SEI)中由于数据集存在错误标签导致识别率下降的问题,提出了1种有监督和无监督融合的错误标签识别和纠正方法。首先采用无监督密度峰值聚类方法将数据集中出现的标签错误样本找出,再使用K折交叉实验对这些标签异常的样本进行预测投票,将得票数多的标签作为错误标签纠正的结果。经过清洗的数据集再通过卷积神经网络进行训练,得到1个较为理想的辐射源个体识别的网络模型,保证了在样本污染条件下,辐射源个体识别网络仍能具有较好的识别率。文章所提方法的识别率相比未经处理的数据集的识别率在标签错误率小于30%时平均提高3.3%;在标签错误率大于30%时,也能使个体识别率达到90%左右,验证了文章所提方法在对错误标签的识别和纠正上可以取得较好的效果。 展开更多
关键词 辐射源个体识别 错误标签 密度峰值聚类 K折交叉实验 卷积神经网络
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部