期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
266
篇文章
<
1
2
…
14
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于密度峰值的标签传播算法
1
作者
吴卫江
王星豪
+2 位作者
潘雪玲
郑艺峰
郑猋
《计算机与数字工程》
2024年第1期81-86,共6页
随着智能技术应用的推广,高质量社区的检测已成为社会网络研究的热点之一。由于具有线性时间复杂度,且无需预定义目标函数和社团数,标签传播算法(LPA)已得到广泛关注。然而,在标签传播过程中,LPA具有不确定性和随机性,进而影响检测社区...
随着智能技术应用的推广,高质量社区的检测已成为社会网络研究的热点之一。由于具有线性时间复杂度,且无需预定义目标函数和社团数,标签传播算法(LPA)已得到广泛关注。然而,在标签传播过程中,LPA具有不确定性和随机性,进而影响检测社区结果的准确性和稳定性。为此,提出一种基于密度峰值的标签传播社区检测方法(DPC-RWL)。首先,采用密度峰值聚类算法查找出社区的核心节点集合,计算节点与核心节点集之间的权重,选取最大值为该节点赋予权值。最后,使用基于标签传播算法的归属度函数进行传播。真实网络和LFR人工基准网络的对比实验表明,所提算法能准确高效地识别出社区结构。
展开更多
关键词
密度峰值聚类
标签传播
节点权重
社交网络
下载PDF
职称材料
增强学习标签相关性的多标签特征选择方法
2
作者
滕少华
卢建磊
+1 位作者
滕璐瑶
张巍
《计算机应用研究》
CSCD
北大核心
2024年第7期2079-2086,共8页
针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合...
针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合样本语义信息的代表性实例,同时计算其对应的标签向量,而这些标签向量体现了每个簇包含不同标签的重要程度;其次,通过原始样本和每个簇中心的标签级自表示,既捕获了原始标签空间中的标签相关性,又探索了每一个簇内的标签相关性;最后,对自表示系数矩阵进行稀疏处理,以减少噪声的影响,并将原始样本和每个簇代表性实例分别从特征空间映射到重构标签空间进行特征选择。在9个多标签数据集上的实验结果表明,所提算法与其他方法相比具有更好的性能。
展开更多
关键词
多标签学习
特征选择
标签相关性
聚类
下载PDF
职称材料
面向复杂网络舆情知识发现的事理图谱方法优化
3
作者
肖亚龙
冯皓
+1 位作者
朱承璋
冯杰
《情报杂志》
CSSCI
北大核心
2024年第10期134-143,共10页
[研究目的]优化事理图谱构建方法,提升事理图谱工具在非结构化网络舆情数据中的知识发现能力,能更好挖掘复杂网络舆情事件内部的因果关系和演化路径。[研究方法]研究采用RoBERTa预训练模型进行序列标注以取代传统模式匹配方法,引入Word2...
[研究目的]优化事理图谱构建方法,提升事理图谱工具在非结构化网络舆情数据中的知识发现能力,能更好挖掘复杂网络舆情事件内部的因果关系和演化路径。[研究方法]研究采用RoBERTa预训练模型进行序列标注以取代传统模式匹配方法,引入Word2Vec词向量和BERTopic主题模型取代传统机器学习聚类算法,对知乎平台“硅谷银行破产”网络舆情进行实证分析。[研究结论]结果表明,融合深度学习与序列标注的因果关系抽取在114901个上下文中识别到68613条原始因果事件对,相较模式匹配方法高出46.47%;基于词向量与主题聚类模型的事件泛化将2148个代表事件划归为14个主题,在文本特征和语义特征层面的泛化效果优于K-means算法。该文依据优化方法构建的网络舆情事理图谱围绕核心主题呈现“循环型”“紧密型”“长链型”的演化路径特征,构建流程和分析过程可为网络舆情治理提供工具及决策支持。
展开更多
关键词
网络舆情
事理图谱
知识发现
深度学习
序列标注
主题聚类
下载PDF
职称材料
基于聚类及长短时记忆神经网络预测油田产量
被引量:
1
4
作者
王洪亮
林霞
+1 位作者
蒋丽维
刘宗尚
《石油科学通报》
CAS
2024年第1期62-72,共11页
利用机器学习方法预测油田产量的精度与训练样本的代表性及数量息息相关。通常,采用油田生产数据或者油井生产数据构建训练样本。将油田作为训练样本,存在“小样本”的问题;将油井作为训练样本,由于老油田一般具有开发层系多、生产历史...
利用机器学习方法预测油田产量的精度与训练样本的代表性及数量息息相关。通常,采用油田生产数据或者油井生产数据构建训练样本。将油田作为训练样本,存在“小样本”的问题;将油井作为训练样本,由于老油田一般具有开发层系多、生产历史长、油井投产批次多等特点,人工标注能够代表油田产量递减规律的训练样本难度大,且耗时费力。本文将油田和油井生产数据有机融合构建训练样本,建立产量智能预测模型,预测油田产量。首先,采用无监督学习的K均值聚类算法,依据有效厚度、孔隙度、渗透率、饱和度等信息对油井进行聚类分析,识别产量递减类别,并将每类油井转换成一口典型油井作为该类油井的代表;其次,将典型井作为预测对象,通过从每类油井中按比例随机抽取油井来增加训练样本数量,即将典型井和油井生产数据融合构建训练样本;最后,基于长短时记忆循环神经网络建立模型预测典型井产量,进而预测油田产量。研究结果表明:该方法既解决了油田数据作为训练样本的“小样本”问题,又降低了油井数据作为训练样本的标注难度与工作量,并且精度符合现场生产要求,对油气产量智能预测的工程化落地应用具有一定指导意义。
展开更多
关键词
油井产量
K-MEANS聚类
样本标注
神经网络
人工智能
下载PDF
职称材料
伪标签指导下自适应聚类网络
5
作者
张鑫煜
徐慧英
+1 位作者
陈宇杭
朱信忠
《浙江师范大学学报(自然科学版)》
CAS
2024年第4期404-412,共9页
深度聚类是一种结合深度学习进行数据表征学习的聚类方法.这种方法在聚类的基础上,利用深度学习技术来学习数据的内在结构和特征,从而更有效地进行大规模数据的聚类,在推荐系统和异常检测等领域有广泛的应用.然而,目前的深度聚类方法存...
深度聚类是一种结合深度学习进行数据表征学习的聚类方法.这种方法在聚类的基础上,利用深度学习技术来学习数据的内在结构和特征,从而更有效地进行大规模数据的聚类,在推荐系统和异常检测等领域有广泛的应用.然而,目前的深度聚类方法存在以下2个问题:1)传统的深度聚类网络没有充分利用图节点先验分布的信息;2)基于对比学习的深度聚类网络平等对待每一个样本,降低了模型的区分度.基于此,提出了一种结合伪标签和动态更新权重的聚类网络.该方法通过对原始图节点聚类得到伪标签,应用于交叉视图相似度矩阵生成正负样本对,以便模型能够正确地学习区分正负样本.之后,样本对根据自身相似度值计算自适应权重,再通过权重更新样本对的损失梯度.此外,在损失函数中引入类内类间阈值来寻找样本对相似度的最优值.在6个真实数据集上进行节点聚类实验,证明了该方法的优越性和有效性.
展开更多
关键词
自监督学习
深度聚类
对比学习
聚类伪标签
自适应权重
下载PDF
职称材料
一种基于层次聚类的人力数据标签体系设计与实现
6
作者
明丽洪
马永一
+1 位作者
罗昌俊
付渲理
《兵工自动化》
北大核心
2024年第11期32-35,共4页
人力数据作为各业务领域数据的核心承载点,是连接人、物理实体、业务活动的关键点。通过设计人力数据标签体系,将人力数据属性抽象为图结构,通过层次聚类算法实现不同属性集的自动聚类和人才梯队划分,可按照专业领域方向、科研项目承担...
人力数据作为各业务领域数据的核心承载点,是连接人、物理实体、业务活动的关键点。通过设计人力数据标签体系,将人力数据属性抽象为图结构,通过层次聚类算法实现不同属性集的自动聚类和人才梯队划分,可按照专业领域方向、科研项目承担、科研成果获得、人才奖励等维度实现人力数据的抽取和灵活组合呈现,为人才梯队层级的培养规划与目标拟定奠定基础。
展开更多
关键词
人力资源
数据标签
层次聚类
下载PDF
职称材料
基于特征表达和模型预测的主动学习
7
作者
姜海涛
邱保志
李向丽
《计算机工程与设计》
北大核心
2024年第9期2757-2763,共7页
为解决当前的主动学习算法在采样时通常忽略样本特征表达信息的问题,提出一个基于样本特征表达和模型预测的主动学习模型。针对主动学习算法在模型训练早期阶段引起的冷启动问题,提出一个标注集初始化算法。利用聚类技术提取样本特征表...
为解决当前的主动学习算法在采样时通常忽略样本特征表达信息的问题,提出一个基于样本特征表达和模型预测的主动学习模型。针对主动学习算法在模型训练早期阶段引起的冷启动问题,提出一个标注集初始化算法。利用聚类技术提取样本特征表达信息,通过分类器得到样本的模型预测信息,致力于使初始标注集的样本分布尽可能接近原始数据集的分布。实验结果表明,该模型分类准确率优于多个主动学习基线算法,该算法能够有效缓解模型的冷启动问题。
展开更多
关键词
主动学习
特征表达
模型预测
冷启动
聚类
图像分类
标注集初始化
下载PDF
职称材料
多项正则化约束的伪标签传播优化脑电信号聚类
8
作者
代成龙
李光辉
+2 位作者
李栋
申佳华
皮德常
《计算机研究与发展》
EI
CSCD
北大核心
2024年第1期156-171,共16页
作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题...
作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题,也在一定程度上限制了无标签脑电信号这类新型数据的应用拓展.为了解决无标签脑电信号的无监督分析问题,提出了一种基于多项正则化约束的伪标签传播优化聚类模型.该模型通过同时优化学习伪标签传播矩阵、脑电信号相似度邻接矩阵、标签分类器的方式实现聚类.将提出的脑电信号聚类模型转化为一个多目标优化问题,并提出了一种基于梯度下降策略的聚类算法EEGapc(electroencephalogram clustering with pseudo label propagation).该算法不仅充分考虑了脑电信号之间的相关性及脑电信号间的信息传递,还能快速收敛到局部最优.在14个真实脑电信号数据集上的实验结果表明,提出的EEGapc脑电信号聚类算法比现有的8种聚类算法性能更好,且在平均NMI(normalized mutual information),ARI(adjusted rand index),F-score,kappa这4个指标上,EEGapc与现有的8种聚类算法相比,分别至少提升了86.88%,58.01%,6.29%,61.17%.
展开更多
关键词
脑电信号聚类
伪标签传播
邻接矩阵优化
伪标签分类器
多目标优化
下载PDF
职称材料
RFID标签冲突低复杂度聚类分离方法
9
作者
郭佳雯
吴海锋
+1 位作者
高威
曾玉
《计算机工程与设计》
北大核心
2024年第7期1972-1980,共9页
由于多个无线射频识别(RFID)标签同时与阅读器通信易发生冲突,通信效率较低,因此标签防冲突是RFID通信系统的一个重要问题。对此,提出一种PCA降维与一维投影结合的聚类方法,解决标签冲突。通过PCA降维找到最大化投影方向进行投影,采用...
由于多个无线射频识别(RFID)标签同时与阅读器通信易发生冲突,通信效率较低,因此标签防冲突是RFID通信系统的一个重要问题。对此,提出一种PCA降维与一维投影结合的聚类方法,解决标签冲突。通过PCA降维找到最大化投影方向进行投影,采用蒙特卡洛方法快速找到峰值作为聚类中心,完成信号分离。仿真数据中,不同信道衰落系数下,该方法都能在20 dB后成功解码,分离效率达到100%;实测数据中,该方法的时间复杂度低于传统算法,吞吐量达到0.55。
展开更多
关键词
无线射频识别
标签冲突
聚类
信号分离
蒙特卡洛
低复杂度
FM0码
下载PDF
职称材料
基于共享背景主题的Labeled LDA模型
被引量:
17
10
作者
江雨燕
李平
王清
《电子学报》
EI
CAS
CSCD
北大核心
2013年第9期1794-1799,共6页
隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labe...
隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labeled LDA模型(Shared Background Topics Labeled LDA,SBTL-LDA).在SBTL-LDA模型中每个标记除了存在若干个独享的局部主题外,还存在若干个共享的背景(Background)主题,这样可以有效分析不同标记所含主题之间的依赖关系,而文档标记被映射为局部主题和共享主题的组合,因此SBTL-LDA模型可以有效提升文档标记判别的准确性.同时SBTL-LDA模型还可以看成是一种半监督聚类模型,在对文档进行聚类分析的过程中模型可以有效的利用文档的标记信息提升文档聚类效果.实验证明SBTL-LDA模型能够有效解决PLDA模型中主题之间的相似性和依赖关系,具有良好的多标记判别能力,并且具有优于LDA、PLDA模型的文档聚类效果.
展开更多
关键词
隐藏狄利克雷分配
文本分析
多标记学习
半监督聚类
下载PDF
职称材料
基于伪标签正则化损失的无监督行人重识别
11
作者
贾洁茹
张硕蕊
+1 位作者
钱宇华
阮秋琦
《电子学报》
EI
CAS
CSCD
北大核心
2024年第5期1743-1758,共16页
无监督行人重识别旨在不需要行人身份标签的情况下,将查询的行人图像与候选集中的行人图像相匹配.目前主流的无监督行人重识别方法通常先利用聚类算法生成伪标签,然后利用伪标签训练深度神经网络.然而由于模型初始表征能力不足和聚类算...
无监督行人重识别旨在不需要行人身份标签的情况下,将查询的行人图像与候选集中的行人图像相匹配.目前主流的无监督行人重识别方法通常先利用聚类算法生成伪标签,然后利用伪标签训练深度神经网络.然而由于模型初始表征能力不足和聚类算法的局限性等,伪标签中会引入大量噪声,严重误导模型优化过程,导致模型性能退化.为了减轻伪标签噪声的影响,本文提出了一种新的伪标签正则化损失函数,用伪标签的置信度分数和样本相似度对伪标签噪声进行约束.具体来说,本文首先提出了一种聚类引导的注意力机制,根据伪标签与聚类中心的语义相关程度来估计伪标签的置信度,以此来识别噪声标签并给正确标签分配更多的权重,有效降低伪标签噪声在总体损失函数中的作用.同时,为了充分利用伪标签的判别能力,本文利用伪标签进行在线软样本挖掘,构建mini-batch中的正负样本对并为每个正负样本对计算一个连续的权重分数.通过将以上两种权重引入到对比损失中,本文提出的伪标签正则化损失函数可以有效抑制伪标签噪声的影响,减轻标签噪声对训练过程的影响,提高模型的准确性和鲁棒性.在多个公开行人数据集上的实验结果验证了本文方法的有效性,在Market1501、DukeMTMC-reID和MSMT17数据集上mAP分别达到了85.9%、75.1%和29.3%.
展开更多
关键词
行人重识别
无监督学习
伪标签噪声
对比学习
聚类优化
下载PDF
职称材料
基于局部密度峰和标签传播的最小生成树聚类
12
作者
林钰莹
侯新民
《计算机系统应用》
2024年第8期18-29,共12页
基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在...
基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在保留原始数据集分布结构的同时,排除了噪声点,因此,将局部密度峰与最小生成树聚类算法相结合,采用标签传播,提出了基于局部密度峰和标签传播的最小生成树聚类算法(DPMST).该算法采用了局部密度峰之间基于共享邻的距离,利用局部密度峰之间的邻域信息,有效构造最小生成树和识别无效边,使算法能够发现具有复杂结构的簇.标签传播增强强标签,削弱弱标签,以细化错误的标签,特别是对于边界点以及揭示复杂流形,能够提高聚类结果的质量.人工和真实数据集上的实验结果表明,与经典聚类算法DPC、MST、K-means、DBSCAN、AP、SC和BIRCH比较,DPMST算法表现优异.
展开更多
关键词
局部密度峰
最小生成树
标签传播
聚类
下载PDF
职称材料
基于证据理论的三向密度峰值聚类
13
作者
赵乌吉斯古楞
凃云杰
《计算机应用与软件》
北大核心
2024年第5期264-273,共10页
为避免聚类标签错误传播,并且充分挖掘邻域信息,提出一种基于证据理论的三向密度峰聚类方法。在分配非分组点时考虑到K近邻的聚类信息,有利于提升聚类精度;用证据理论来描述和合并这些近邻信息,使建立的三向聚类模型能够将它们分配到最...
为避免聚类标签错误传播,并且充分挖掘邻域信息,提出一种基于证据理论的三向密度峰聚类方法。在分配非分组点时考虑到K近邻的聚类信息,有利于提升聚类精度;用证据理论来描述和合并这些近邻信息,使建立的三向聚类模型能够将它们分配到最可能的聚类中,从而有效地避免了密度峰值聚类算法中错误标签的传播。在多个数据集上的实验对比结果表明,提出的方法能够有效避免聚类标签错误传播,并且实现了较高的聚类精度。
展开更多
关键词
密度峰值聚类
标签错误传播
三向理论
证据理论
下载PDF
职称材料
面向目标机动类型的数据标签生成方法
14
作者
汪其林
曹志敏
高静
《指挥控制与仿真》
2024年第3期86-94,共9页
针对现有目标机动类型识别方法通用性不足、准确率较低等问题,提出基于改进K-medoids聚类的多层标签生成方法。以空中目标机动轨迹为例,设计多种数据预处理方法,采用动态时间规整作为聚类算法的距离度量,通过构建标签框架指导算法实施过...
针对现有目标机动类型识别方法通用性不足、准确率较低等问题,提出基于改进K-medoids聚类的多层标签生成方法。以空中目标机动轨迹为例,设计多种数据预处理方法,采用动态时间规整作为聚类算法的距离度量,通过构建标签框架指导算法实施过程,进行迭代聚类以生成多层标签。在公开数据集上测试算法,实验结果表明,该方法在无监督情况下对第一层标签的识别准确率达到89.75%,接近传统有监督算法;同时,相对于没有引入标签框架的情况,能更有效地区分第二层模糊标签。该方法只需少量专家知识,便能简单地扩展到不同领域、不同机动类型。
展开更多
关键词
标签生成
动态时间规整
K-medoids聚类
下载PDF
职称材料
基于方向权值标签传播的微学习单元聚类算法
15
作者
胡志远
张月琴
陈健
《科学技术与工程》
北大核心
2024年第10期4189-4196,共8页
为帮助学习者从大量在线学资源中找到适合自身个性化的学习资源及顺序集合,提出了一种基于有向边方向权值的标签传播算法(label propagation algorithm on directed edge weights,LPADEW)用于发现适合特定学习者并属于同一学习周期的微...
为帮助学习者从大量在线学资源中找到适合自身个性化的学习资源及顺序集合,提出了一种基于有向边方向权值的标签传播算法(label propagation algorithm on directed edge weights,LPADEW)用于发现适合特定学习者并属于同一学习周期的微学习单元序列簇群。该算法对标签传播算法进行两个改进:根据单元节点的利用度确定标签的更新顺序,降低在节点更新顺序上的随机性;利用当前单元节点的前置邻居和后置邻居的有向边权累加值进行标签更新,并将标签权重引入标签更新策略,既可降低标签更新的随机性,也可避免形成巨型簇群。实验结果表明,LPADEW算法在微学习真实数据集和人工数据集中均取得了较好的结果。
展开更多
关键词
微学习
有向图
图聚类
有向边权值
标签传播
下载PDF
职称材料
基于AEViT与先验知识的胶质瘤IDH1突变状态预测
16
作者
徐华畅
许倩
+3 位作者
赵钰琳
梁峰宁
徐凯
朱红
《智能系统学报》
CSCD
北大核心
2024年第4期952-960,共9页
针对目前预测胶质瘤异柠檬酸脱氢酶1(isocitrate dehydrogenase1,IDH1)突变状态存在的数据不足、准确率较低等问题,提出一种基于AEViT(auto-encoder vision Transformer)与先验知识的胶质瘤IDH1突变状态预测方法。首先使用改进的K-Mean...
针对目前预测胶质瘤异柠檬酸脱氢酶1(isocitrate dehydrogenase1,IDH1)突变状态存在的数据不足、准确率较低等问题,提出一种基于AEViT(auto-encoder vision Transformer)与先验知识的胶质瘤IDH1突变状态预测方法。首先使用改进的K-Means聚类算法为无IDH1突变状态标签的胶质瘤磁共振成像(magnetic resonance imaging,MRI)数据标注伪标签,并采用ViT(vision Transformer)网络对伪标签进行修正,得到最终的胶质瘤IDH1突变状态。为避免不准确的伪标签数据影响模型精度,采用果蝇优化算法为伪标签数据赋予最优权重;然后提出基于Auto-Encoder和ViT的分类模型AEViT,利用Auto-Encoder提取胶质瘤MRI特征;再将特征输入ViT中对胶质瘤IDH1突变状态进行分类;最后将基于胶质瘤位置信息的先验知识加入模型,达到99.01%的预测准确率。结果表明该方法优于其他现有模型,能够实现胶质瘤数据扩增和术前无创、准确地预测胶质瘤IDH1突变状态,从而辅助诊疗过程。
展开更多
关键词
胶质瘤
异柠檬酸脱氢酶1
K-MEANS聚类算法
伪标签
Auto-Encoder
vision
Transformer
果蝇优化算法
先验知识
下载PDF
职称材料
利用多标签信息的聚类方法
17
作者
杨国安
王志岗
《天津理工大学学报》
2024年第1期15-21,共7页
k-means是当前使用最广泛的聚类算法,但其只对无标签信息的样本数据进行聚类,需用户提供初始聚类中心等信息且聚类花费时间长结果不稳定。当前很多数据集都带有多标签的信息,如何利用多标签信息更加快速有效的聚类是一个重要的研究方向...
k-means是当前使用最广泛的聚类算法,但其只对无标签信息的样本数据进行聚类,需用户提供初始聚类中心等信息且聚类花费时间长结果不稳定。当前很多数据集都带有多标签的信息,如何利用多标签信息更加快速有效的聚类是一个重要的研究方向。文中提出了多标签数据的聚类方法,首先对多标签信息进行聚类得到适当的初始聚类中心,然后再使用k-means算法对大量样本做聚类。试验结果表明,该聚类方法比使用随机初始聚类中心的k-means算法具有更好的时间性能和聚类结果。
展开更多
关键词
多标签
聚类
K-MEANS
无标签
下载PDF
职称材料
SAR ATR中标签噪声不确定性建模与纠正
18
作者
于跃
王琛
+6 位作者
师君
陶重犇
李良
唐欣欣
周黎明
韦顺军
张晓玲
《雷达学报(中英文)》
EI
CSCD
北大核心
2024年第5期974-984,共11页
深度监督学习在合成孔径雷达自动目标识别任务中的成功依赖于大量标签样本。但是,在大规模数据集中经常存在错误(噪声)标签,很大程度降低网络训练效果。该文提出一种基于损失曲线拟合的标签噪声不确定性建模和基于噪声不确定度的纠正方...
深度监督学习在合成孔径雷达自动目标识别任务中的成功依赖于大量标签样本。但是,在大规模数据集中经常存在错误(噪声)标签,很大程度降低网络训练效果。该文提出一种基于损失曲线拟合的标签噪声不确定性建模和基于噪声不确定度的纠正方法:以损失曲线作为判别特征,应用无监督模糊聚类算法获得聚类中心和类别隶属度以建模各样本标签噪声不确定度;根据样本标签噪声不确定度将样本集划分为噪声标签样本集、正确标签样本集和模糊标签样本集,以加权训练损失方法分组处理训练集,指导分类网络训练实现纠正噪声标签。在MSTAR数据集上的实验证明,该文所提方法可处理数据集中混有不同比例标签噪声情况下的网络训练问题,有效纠正标签噪声。当训练数据集中标签噪声比例较小(40%)时,该文所提方法可纠正98.6%的标签噪声,并训练网络达到98.7%的分类精度。即使标签噪声比例很大(80%)时,该文方法仍可纠正87.8%的标签噪声,并训练网络达到82.3%的分类精度。
展开更多
关键词
合成孔径雷达
标签噪声
标签噪声纠正
标签噪声不确定性建模
模糊聚类算法
下载PDF
职称材料
基于数据挖掘和聚类分析的协同过滤推荐算法
19
作者
何岫钰
《电子设计工程》
2024年第9期47-50,共4页
为了提高推荐系统的可扩展性和用户满意度,设计基于数据挖掘和聚类分析的协同过滤推荐算法。基于双向关联规则原理,构建标签资源矩阵,利用K-means聚类算法对标签进行聚类。结合用户偏好标签,算法能计算标签与资源的紧密程度,实现基本推...
为了提高推荐系统的可扩展性和用户满意度,设计基于数据挖掘和聚类分析的协同过滤推荐算法。基于双向关联规则原理,构建标签资源矩阵,利用K-means聚类算法对标签进行聚类。结合用户偏好标签,算法能计算标签与资源的紧密程度,实现基本推荐。通过标签计算用户与资源的兴趣度,实现个性化推荐。将基本推荐和个性化推荐线性组合,得出最终结果。实验表明,该算法不仅能保持数据集的平衡状态,准确性也高。通过聚类捕捉更复杂的用户兴趣模式,显著提高了推荐结果的命中率和NDCG值,为用户提供更符合个性化需求的资源。
展开更多
关键词
数据挖掘
聚类分析
协同过滤推荐
标签相似度
偏好度
个性化推荐
下载PDF
职称材料
样本标签污染条件下的雷达辐射源个体识别技术
20
作者
段可欣
闫文君
+2 位作者
凌青
王艳艳
王艺卉
《海军航空大学学报》
2024年第2期189-198,260,共11页
针对辐射源个体识别(Specific Emitter Identification,SEI)中由于数据集存在错误标签导致识别率下降的问题,提出了1种有监督和无监督融合的错误标签识别和纠正方法。首先采用无监督密度峰值聚类方法将数据集中出现的标签错误样本找出,...
针对辐射源个体识别(Specific Emitter Identification,SEI)中由于数据集存在错误标签导致识别率下降的问题,提出了1种有监督和无监督融合的错误标签识别和纠正方法。首先采用无监督密度峰值聚类方法将数据集中出现的标签错误样本找出,再使用K折交叉实验对这些标签异常的样本进行预测投票,将得票数多的标签作为错误标签纠正的结果。经过清洗的数据集再通过卷积神经网络进行训练,得到1个较为理想的辐射源个体识别的网络模型,保证了在样本污染条件下,辐射源个体识别网络仍能具有较好的识别率。文章所提方法的识别率相比未经处理的数据集的识别率在标签错误率小于30%时平均提高3.3%;在标签错误率大于30%时,也能使个体识别率达到90%左右,验证了文章所提方法在对错误标签的识别和纠正上可以取得较好的效果。
展开更多
关键词
辐射源个体识别
错误标签
密度峰值聚类
K折交叉实验
卷积神经网络
下载PDF
职称材料
题名
基于密度峰值的标签传播算法
1
作者
吴卫江
王星豪
潘雪玲
郑艺峰
郑猋
机构
中国石油大学(北京)石油数据挖掘北京市重点实验室
中国石油大学(北京)信息科学与信息工程学院
闽南师范大学数据科学与智能应用福建省高等学校重点实验室
闽南师范大学计算机学院
出处
《计算机与数字工程》
2024年第1期81-86,共6页
基金
国家自然科学基金项目(编号:61701213)
福建省自然科学基金项目(编号:2019J01748)
福建省教育厅中青年项目(编号:JAT190392)资助。
文摘
随着智能技术应用的推广,高质量社区的检测已成为社会网络研究的热点之一。由于具有线性时间复杂度,且无需预定义目标函数和社团数,标签传播算法(LPA)已得到广泛关注。然而,在标签传播过程中,LPA具有不确定性和随机性,进而影响检测社区结果的准确性和稳定性。为此,提出一种基于密度峰值的标签传播社区检测方法(DPC-RWL)。首先,采用密度峰值聚类算法查找出社区的核心节点集合,计算节点与核心节点集之间的权重,选取最大值为该节点赋予权值。最后,使用基于标签传播算法的归属度函数进行传播。真实网络和LFR人工基准网络的对比实验表明,所提算法能准确高效地识别出社区结构。
关键词
密度峰值聚类
标签传播
节点权重
社交网络
Keywords
density peak
cluster
ing
label
propagation
node weigh
social networks
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
增强学习标签相关性的多标签特征选择方法
2
作者
滕少华
卢建磊
滕璐瑶
张巍
机构
广东工业大学计算机学院
广州番禺职业技术学院信息工程学院
出处
《计算机应用研究》
CSCD
北大核心
2024年第7期2079-2086,共8页
基金
国家自然科学基金资助项目(6197210)
广州市科技计划资助项目(2023A04J1729)。
文摘
针对现有多标签特征选择方法存在的两个问题:第一,忽略了学习标签相关性过程中噪声信息的影响;第二,忽略探索每个簇的综合标签信息,提出一种增强学习标签相关性的多标签特征选择方法。首先,对样本进行聚类,并将每个簇中心视为一个综合样本语义信息的代表性实例,同时计算其对应的标签向量,而这些标签向量体现了每个簇包含不同标签的重要程度;其次,通过原始样本和每个簇中心的标签级自表示,既捕获了原始标签空间中的标签相关性,又探索了每一个簇内的标签相关性;最后,对自表示系数矩阵进行稀疏处理,以减少噪声的影响,并将原始样本和每个簇代表性实例分别从特征空间映射到重构标签空间进行特征选择。在9个多标签数据集上的实验结果表明,所提算法与其他方法相比具有更好的性能。
关键词
多标签学习
特征选择
标签相关性
聚类
Keywords
multi-
label
learning
feature selection
label
correlation
cluster
ing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向复杂网络舆情知识发现的事理图谱方法优化
3
作者
肖亚龙
冯皓
朱承璋
冯杰
机构
中南大学人文学院
中南大学人文学院智媒传播研究中心
出处
《情报杂志》
CSSCI
北大核心
2024年第10期134-143,共10页
基金
教育部人文社会科学基金青年项目“社交媒体时代重大突发事件国际舆论博弈研究”(编号:22YJC860007)
湖南省哲学社会科学基金青年项目“重大危机事件中美政治话语互动模式研究”(编号:21YBQ010)
湖南省哲学社会科学基金一般项目“‘一带一路’视角下跨国媒体间议程设置研究”(编号:23YBA019)研究成果。
文摘
[研究目的]优化事理图谱构建方法,提升事理图谱工具在非结构化网络舆情数据中的知识发现能力,能更好挖掘复杂网络舆情事件内部的因果关系和演化路径。[研究方法]研究采用RoBERTa预训练模型进行序列标注以取代传统模式匹配方法,引入Word2Vec词向量和BERTopic主题模型取代传统机器学习聚类算法,对知乎平台“硅谷银行破产”网络舆情进行实证分析。[研究结论]结果表明,融合深度学习与序列标注的因果关系抽取在114901个上下文中识别到68613条原始因果事件对,相较模式匹配方法高出46.47%;基于词向量与主题聚类模型的事件泛化将2148个代表事件划归为14个主题,在文本特征和语义特征层面的泛化效果优于K-means算法。该文依据优化方法构建的网络舆情事理图谱围绕核心主题呈现“循环型”“紧密型”“长链型”的演化路径特征,构建流程和分析过程可为网络舆情治理提供工具及决策支持。
关键词
网络舆情
事理图谱
知识发现
深度学习
序列标注
主题聚类
Keywords
online public opinion
event evolutionary graph
knowledge discovery
deep learning
sequence
label
ing
topic
cluster
ing
分类号
G203 [文化科学—传播学]
下载PDF
职称材料
题名
基于聚类及长短时记忆神经网络预测油田产量
被引量:
1
4
作者
王洪亮
林霞
蒋丽维
刘宗尚
机构
中国石油勘探开发研究院
出处
《石油科学通报》
CAS
2024年第1期62-72,共11页
基金
国家重点研发计划课题“战略性资源开发区风险评估应用示范”(2022YFF0801204)
中国石油天然气股份有限公司重大统建项目“中国石油认知计算平台”(2019-40210-000020-02)联合资助。
文摘
利用机器学习方法预测油田产量的精度与训练样本的代表性及数量息息相关。通常,采用油田生产数据或者油井生产数据构建训练样本。将油田作为训练样本,存在“小样本”的问题;将油井作为训练样本,由于老油田一般具有开发层系多、生产历史长、油井投产批次多等特点,人工标注能够代表油田产量递减规律的训练样本难度大,且耗时费力。本文将油田和油井生产数据有机融合构建训练样本,建立产量智能预测模型,预测油田产量。首先,采用无监督学习的K均值聚类算法,依据有效厚度、孔隙度、渗透率、饱和度等信息对油井进行聚类分析,识别产量递减类别,并将每类油井转换成一口典型油井作为该类油井的代表;其次,将典型井作为预测对象,通过从每类油井中按比例随机抽取油井来增加训练样本数量,即将典型井和油井生产数据融合构建训练样本;最后,基于长短时记忆循环神经网络建立模型预测典型井产量,进而预测油田产量。研究结果表明:该方法既解决了油田数据作为训练样本的“小样本”问题,又降低了油井数据作为训练样本的标注难度与工作量,并且精度符合现场生产要求,对油气产量智能预测的工程化落地应用具有一定指导意义。
关键词
油井产量
K-MEANS聚类
样本标注
神经网络
人工智能
Keywords
oil well production
K-Means
cluster
ing
sample
label
ing
neural network
artificial intelligence
分类号
TE328 [石油与天然气工程—油气田开发工程]
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
伪标签指导下自适应聚类网络
5
作者
张鑫煜
徐慧英
陈宇杭
朱信忠
机构
浙江师范大学计算机科学与技术学院
出处
《浙江师范大学学报(自然科学版)》
CAS
2024年第4期404-412,共9页
基金
国家自然科学基金资助项目(62376252,61976196)
浙江省自然科学基金重点资助项目(LZ22F030003)。
文摘
深度聚类是一种结合深度学习进行数据表征学习的聚类方法.这种方法在聚类的基础上,利用深度学习技术来学习数据的内在结构和特征,从而更有效地进行大规模数据的聚类,在推荐系统和异常检测等领域有广泛的应用.然而,目前的深度聚类方法存在以下2个问题:1)传统的深度聚类网络没有充分利用图节点先验分布的信息;2)基于对比学习的深度聚类网络平等对待每一个样本,降低了模型的区分度.基于此,提出了一种结合伪标签和动态更新权重的聚类网络.该方法通过对原始图节点聚类得到伪标签,应用于交叉视图相似度矩阵生成正负样本对,以便模型能够正确地学习区分正负样本.之后,样本对根据自身相似度值计算自适应权重,再通过权重更新样本对的损失梯度.此外,在损失函数中引入类内类间阈值来寻找样本对相似度的最优值.在6个真实数据集上进行节点聚类实验,证明了该方法的优越性和有效性.
关键词
自监督学习
深度聚类
对比学习
聚类伪标签
自适应权重
Keywords
self-supervised learning
deep
cluster
ing
contrastive learning
cluster
pseudo-
label
s
adaptive weights
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种基于层次聚类的人力数据标签体系设计与实现
6
作者
明丽洪
马永一
罗昌俊
付渲理
机构
中国空气动力研究与发展中心计算空气动力研究所
出处
《兵工自动化》
北大核心
2024年第11期32-35,共4页
文摘
人力数据作为各业务领域数据的核心承载点,是连接人、物理实体、业务活动的关键点。通过设计人力数据标签体系,将人力数据属性抽象为图结构,通过层次聚类算法实现不同属性集的自动聚类和人才梯队划分,可按照专业领域方向、科研项目承担、科研成果获得、人才奖励等维度实现人力数据的抽取和灵活组合呈现,为人才梯队层级的培养规划与目标拟定奠定基础。
关键词
人力资源
数据标签
层次聚类
Keywords
human resources
data
label
hierarchical
cluster
ing
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于特征表达和模型预测的主动学习
7
作者
姜海涛
邱保志
李向丽
机构
郑州大学计算机与人工智能学院
出处
《计算机工程与设计》
北大核心
2024年第9期2757-2763,共7页
基金
国家自然科学联合基金项目(U21B2037)
国家自然科学基金项目(62172371)。
文摘
为解决当前的主动学习算法在采样时通常忽略样本特征表达信息的问题,提出一个基于样本特征表达和模型预测的主动学习模型。针对主动学习算法在模型训练早期阶段引起的冷启动问题,提出一个标注集初始化算法。利用聚类技术提取样本特征表达信息,通过分类器得到样本的模型预测信息,致力于使初始标注集的样本分布尽可能接近原始数据集的分布。实验结果表明,该模型分类准确率优于多个主动学习基线算法,该算法能够有效缓解模型的冷启动问题。
关键词
主动学习
特征表达
模型预测
冷启动
聚类
图像分类
标注集初始化
Keywords
active learning
feature representation
model prediction
cold start
cluster
ing
image classification
label
ing set initialization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
多项正则化约束的伪标签传播优化脑电信号聚类
8
作者
代成龙
李光辉
李栋
申佳华
皮德常
机构
江南大学人工智能与计算机学院
南京航空航天大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第1期156-171,共16页
基金
国家自然科学基金项目(62106087)
江苏省自然科学基金项目(BK20210455)
中央高校基本科研业务费专项资金(JUSRP122033)。
文摘
作为一种非侵入式分析载体,脑电信号目前被广泛应用于脑-机接口、医疗辅助诊断及康复领域,但这些应用通常依赖需要完整标签的有监督分析技术,如分类.随着无标签脑电信号的与日俱增,现有的有监督方法不能有效解决无标签脑电信号分析问题,也在一定程度上限制了无标签脑电信号这类新型数据的应用拓展.为了解决无标签脑电信号的无监督分析问题,提出了一种基于多项正则化约束的伪标签传播优化聚类模型.该模型通过同时优化学习伪标签传播矩阵、脑电信号相似度邻接矩阵、标签分类器的方式实现聚类.将提出的脑电信号聚类模型转化为一个多目标优化问题,并提出了一种基于梯度下降策略的聚类算法EEGapc(electroencephalogram clustering with pseudo label propagation).该算法不仅充分考虑了脑电信号之间的相关性及脑电信号间的信息传递,还能快速收敛到局部最优.在14个真实脑电信号数据集上的实验结果表明,提出的EEGapc脑电信号聚类算法比现有的8种聚类算法性能更好,且在平均NMI(normalized mutual information),ARI(adjusted rand index),F-score,kappa这4个指标上,EEGapc与现有的8种聚类算法相比,分别至少提升了86.88%,58.01%,6.29%,61.17%.
关键词
脑电信号聚类
伪标签传播
邻接矩阵优化
伪标签分类器
多目标优化
Keywords
electroencephalogram
cluster
ing
pseudo
label
propagation
adjacency matrix optimization
pseudo
label
classifier
multi-objective optimization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
RFID标签冲突低复杂度聚类分离方法
9
作者
郭佳雯
吴海锋
高威
曾玉
机构
云南民族大学电气信息工程学院
云南省教育厅云南省高校智能传感网络及信息系统科技创新团队
出处
《计算机工程与设计》
北大核心
2024年第7期1972-1980,共9页
基金
国家自然科学基金项目(62161052)
云南省应用基础研究重点基金项目(2018FA036)。
文摘
由于多个无线射频识别(RFID)标签同时与阅读器通信易发生冲突,通信效率较低,因此标签防冲突是RFID通信系统的一个重要问题。对此,提出一种PCA降维与一维投影结合的聚类方法,解决标签冲突。通过PCA降维找到最大化投影方向进行投影,采用蒙特卡洛方法快速找到峰值作为聚类中心,完成信号分离。仿真数据中,不同信道衰落系数下,该方法都能在20 dB后成功解码,分离效率达到100%;实测数据中,该方法的时间复杂度低于传统算法,吞吐量达到0.55。
关键词
无线射频识别
标签冲突
聚类
信号分离
蒙特卡洛
低复杂度
FM0码
Keywords
RIFD
label
conflict
cluster
ing
signal separation
Monte Carlo
low complexity
FM0 code
分类号
TN911 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于共享背景主题的Labeled LDA模型
被引量:
17
10
作者
江雨燕
李平
王清
机构
安徽工业大学管理科学与工程学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2013年第9期1794-1799,共6页
基金
国家自然科学基金(No.71172219)
安徽省自然科学研究项目省级重点项目(No.KJ2011Z039
No.KJ2013A053)
文摘
隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labeled LDA模型(Shared Background Topics Labeled LDA,SBTL-LDA).在SBTL-LDA模型中每个标记除了存在若干个独享的局部主题外,还存在若干个共享的背景(Background)主题,这样可以有效分析不同标记所含主题之间的依赖关系,而文档标记被映射为局部主题和共享主题的组合,因此SBTL-LDA模型可以有效提升文档标记判别的准确性.同时SBTL-LDA模型还可以看成是一种半监督聚类模型,在对文档进行聚类分析的过程中模型可以有效的利用文档的标记信息提升文档聚类效果.实验证明SBTL-LDA模型能够有效解决PLDA模型中主题之间的相似性和依赖关系,具有良好的多标记判别能力,并且具有优于LDA、PLDA模型的文档聚类效果.
关键词
隐藏狄利克雷分配
文本分析
多标记学习
半监督聚类
Keywords
latent Dirichlet allocation
text analysis
multi-
label
learning
semi-supervised
cluster
ing
分类号
TN911.23 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于伪标签正则化损失的无监督行人重识别
11
作者
贾洁茹
张硕蕊
钱宇华
阮秋琦
机构
山西大学大数据科学与产业研究院
山西大学计算机与信息技术学院
山西省机器视觉与数据挖掘工程研究中心
北京交通大学信息科学研究所
出处
《电子学报》
EI
CAS
CSCD
北大核心
2024年第5期1743-1758,共16页
基金
国家自然科学基金(No.62106133)。
文摘
无监督行人重识别旨在不需要行人身份标签的情况下,将查询的行人图像与候选集中的行人图像相匹配.目前主流的无监督行人重识别方法通常先利用聚类算法生成伪标签,然后利用伪标签训练深度神经网络.然而由于模型初始表征能力不足和聚类算法的局限性等,伪标签中会引入大量噪声,严重误导模型优化过程,导致模型性能退化.为了减轻伪标签噪声的影响,本文提出了一种新的伪标签正则化损失函数,用伪标签的置信度分数和样本相似度对伪标签噪声进行约束.具体来说,本文首先提出了一种聚类引导的注意力机制,根据伪标签与聚类中心的语义相关程度来估计伪标签的置信度,以此来识别噪声标签并给正确标签分配更多的权重,有效降低伪标签噪声在总体损失函数中的作用.同时,为了充分利用伪标签的判别能力,本文利用伪标签进行在线软样本挖掘,构建mini-batch中的正负样本对并为每个正负样本对计算一个连续的权重分数.通过将以上两种权重引入到对比损失中,本文提出的伪标签正则化损失函数可以有效抑制伪标签噪声的影响,减轻标签噪声对训练过程的影响,提高模型的准确性和鲁棒性.在多个公开行人数据集上的实验结果验证了本文方法的有效性,在Market1501、DukeMTMC-reID和MSMT17数据集上mAP分别达到了85.9%、75.1%和29.3%.
关键词
行人重识别
无监督学习
伪标签噪声
对比学习
聚类优化
Keywords
person re-identification
unsupervised learning
pseudo
label
noise
contrastive learning
cluster
ing refinement
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于局部密度峰和标签传播的最小生成树聚类
12
作者
林钰莹
侯新民
机构
中国科学技术大学大数据学院
中国科学技术大学数学科学学院
中国科学院吴文俊数学重点实验室
合肥国家实验室
出处
《计算机系统应用》
2024年第8期18-29,共12页
基金
国家自然科学基金(12071453)
量子通信与量子计算机重大项目(2021ZD0302902)。
文摘
基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在保留原始数据集分布结构的同时,排除了噪声点,因此,将局部密度峰与最小生成树聚类算法相结合,采用标签传播,提出了基于局部密度峰和标签传播的最小生成树聚类算法(DPMST).该算法采用了局部密度峰之间基于共享邻的距离,利用局部密度峰之间的邻域信息,有效构造最小生成树和识别无效边,使算法能够发现具有复杂结构的簇.标签传播增强强标签,削弱弱标签,以细化错误的标签,特别是对于边界点以及揭示复杂流形,能够提高聚类结果的质量.人工和真实数据集上的实验结果表明,与经典聚类算法DPC、MST、K-means、DBSCAN、AP、SC和BIRCH比较,DPMST算法表现优异.
关键词
局部密度峰
最小生成树
标签传播
聚类
Keywords
local density peak
minimum spanning tree(MST)
label
propagation
cluster
ing
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于证据理论的三向密度峰值聚类
13
作者
赵乌吉斯古楞
凃云杰
机构
呼伦贝尔学院计算机学院
出处
《计算机应用与软件》
北大核心
2024年第5期264-273,共10页
基金
内蒙古自治区自然科学基金项目(2017MS(LH)0682)
呼伦贝尔学院科学技术研究项目(2018JYYB06,2019KCZD01)。
文摘
为避免聚类标签错误传播,并且充分挖掘邻域信息,提出一种基于证据理论的三向密度峰聚类方法。在分配非分组点时考虑到K近邻的聚类信息,有利于提升聚类精度;用证据理论来描述和合并这些近邻信息,使建立的三向聚类模型能够将它们分配到最可能的聚类中,从而有效地避免了密度峰值聚类算法中错误标签的传播。在多个数据集上的实验对比结果表明,提出的方法能够有效避免聚类标签错误传播,并且实现了较高的聚类精度。
关键词
密度峰值聚类
标签错误传播
三向理论
证据理论
Keywords
Density peak
cluster
ing
label
error propagation
Three-way theory
Evidence theory
分类号
TP393.06 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向目标机动类型的数据标签生成方法
14
作者
汪其林
曹志敏
高静
机构
江苏自动化研究所
出处
《指挥控制与仿真》
2024年第3期86-94,共9页
文摘
针对现有目标机动类型识别方法通用性不足、准确率较低等问题,提出基于改进K-medoids聚类的多层标签生成方法。以空中目标机动轨迹为例,设计多种数据预处理方法,采用动态时间规整作为聚类算法的距离度量,通过构建标签框架指导算法实施过程,进行迭代聚类以生成多层标签。在公开数据集上测试算法,实验结果表明,该方法在无监督情况下对第一层标签的识别准确率达到89.75%,接近传统有监督算法;同时,相对于没有引入标签框架的情况,能更有效地区分第二层模糊标签。该方法只需少量专家知识,便能简单地扩展到不同领域、不同机动类型。
关键词
标签生成
动态时间规整
K-medoids聚类
Keywords
label
generation
dynamic time warping
K-medoids
cluster
ing
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于方向权值标签传播的微学习单元聚类算法
15
作者
胡志远
张月琴
陈健
机构
太原理工大学信息与计算机学院
赛博大学信息技术综合学院
出处
《科学技术与工程》
北大核心
2024年第10期4189-4196,共8页
基金
日本学术振兴会科学研究费助成事业基础研究(C)(22K12323)。
文摘
为帮助学习者从大量在线学资源中找到适合自身个性化的学习资源及顺序集合,提出了一种基于有向边方向权值的标签传播算法(label propagation algorithm on directed edge weights,LPADEW)用于发现适合特定学习者并属于同一学习周期的微学习单元序列簇群。该算法对标签传播算法进行两个改进:根据单元节点的利用度确定标签的更新顺序,降低在节点更新顺序上的随机性;利用当前单元节点的前置邻居和后置邻居的有向边权累加值进行标签更新,并将标签权重引入标签更新策略,既可降低标签更新的随机性,也可避免形成巨型簇群。实验结果表明,LPADEW算法在微学习真实数据集和人工数据集中均取得了较好的结果。
关键词
微学习
有向图
图聚类
有向边权值
标签传播
Keywords
micro-learning
directed graph
graph
cluster
ing
directed edge weights
label
propagation
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于AEViT与先验知识的胶质瘤IDH1突变状态预测
16
作者
徐华畅
许倩
赵钰琳
梁峰宁
徐凯
朱红
机构
徐州医科大学医学信息与工程学院
徐州医科大学附属医院医学影像科
出处
《智能系统学报》
CSCD
北大核心
2024年第4期952-960,共9页
基金
江苏省卫生健康委医学科研项目(Z2020032)
徐州市重点研发计划项目(KC22117)
徐州市卫生健康委员会青年医学科技创新项目(XWKYHT20210586).
文摘
针对目前预测胶质瘤异柠檬酸脱氢酶1(isocitrate dehydrogenase1,IDH1)突变状态存在的数据不足、准确率较低等问题,提出一种基于AEViT(auto-encoder vision Transformer)与先验知识的胶质瘤IDH1突变状态预测方法。首先使用改进的K-Means聚类算法为无IDH1突变状态标签的胶质瘤磁共振成像(magnetic resonance imaging,MRI)数据标注伪标签,并采用ViT(vision Transformer)网络对伪标签进行修正,得到最终的胶质瘤IDH1突变状态。为避免不准确的伪标签数据影响模型精度,采用果蝇优化算法为伪标签数据赋予最优权重;然后提出基于Auto-Encoder和ViT的分类模型AEViT,利用Auto-Encoder提取胶质瘤MRI特征;再将特征输入ViT中对胶质瘤IDH1突变状态进行分类;最后将基于胶质瘤位置信息的先验知识加入模型,达到99.01%的预测准确率。结果表明该方法优于其他现有模型,能够实现胶质瘤数据扩增和术前无创、准确地预测胶质瘤IDH1突变状态,从而辅助诊疗过程。
关键词
胶质瘤
异柠檬酸脱氢酶1
K-MEANS聚类算法
伪标签
Auto-Encoder
vision
Transformer
果蝇优化算法
先验知识
Keywords
glioma
IDH1
K-Means
cluster
ing algorithm
pseudo-
label
Auto-Encoder
vision Transformer
fruit fly optimization algorithm
priori knowledge
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
利用多标签信息的聚类方法
17
作者
杨国安
王志岗
机构
天津朗誉科技发展有限公司
天津理工大学计算机科学与工程学院
出处
《天津理工大学学报》
2024年第1期15-21,共7页
基金
天津市教委科研计划项目(2017KJ254)。
文摘
k-means是当前使用最广泛的聚类算法,但其只对无标签信息的样本数据进行聚类,需用户提供初始聚类中心等信息且聚类花费时间长结果不稳定。当前很多数据集都带有多标签的信息,如何利用多标签信息更加快速有效的聚类是一个重要的研究方向。文中提出了多标签数据的聚类方法,首先对多标签信息进行聚类得到适当的初始聚类中心,然后再使用k-means算法对大量样本做聚类。试验结果表明,该聚类方法比使用随机初始聚类中心的k-means算法具有更好的时间性能和聚类结果。
关键词
多标签
聚类
K-MEANS
无标签
Keywords
multi-
label
cluster
ing
k-means
no-
label
分类号
TH122 [机械工程—机械设计及理论]
下载PDF
职称材料
题名
SAR ATR中标签噪声不确定性建模与纠正
18
作者
于跃
王琛
师君
陶重犇
李良
唐欣欣
周黎明
韦顺军
张晓玲
机构
苏州科技大学电子与信息工程学院
电子科技大学信息与通信工程学院
四川航天系统工程研究所
重庆交通大学信息科学与工程学院
电磁空间安全全国重点实验室
出处
《雷达学报(中英文)》
EI
CSCD
北大核心
2024年第5期974-984,共11页
基金
国家自然科学基金(62201375)
江苏省自然科学基金(BK20220635)
+1 种基金
重庆市自然科学基金面上项目(CSTB2024NSCQMSX1762)
重庆市教育委员会科学技术研究项目(KJQN202300756)。
文摘
深度监督学习在合成孔径雷达自动目标识别任务中的成功依赖于大量标签样本。但是,在大规模数据集中经常存在错误(噪声)标签,很大程度降低网络训练效果。该文提出一种基于损失曲线拟合的标签噪声不确定性建模和基于噪声不确定度的纠正方法:以损失曲线作为判别特征,应用无监督模糊聚类算法获得聚类中心和类别隶属度以建模各样本标签噪声不确定度;根据样本标签噪声不确定度将样本集划分为噪声标签样本集、正确标签样本集和模糊标签样本集,以加权训练损失方法分组处理训练集,指导分类网络训练实现纠正噪声标签。在MSTAR数据集上的实验证明,该文所提方法可处理数据集中混有不同比例标签噪声情况下的网络训练问题,有效纠正标签噪声。当训练数据集中标签噪声比例较小(40%)时,该文所提方法可纠正98.6%的标签噪声,并训练网络达到98.7%的分类精度。即使标签噪声比例很大(80%)时,该文方法仍可纠正87.8%的标签噪声,并训练网络达到82.3%的分类精度。
关键词
合成孔径雷达
标签噪声
标签噪声纠正
标签噪声不确定性建模
模糊聚类算法
Keywords
Synthetic Aperture Radar(SAR)
label
noise
label
noise correction
label
noise uncertainty modeling
Fuzzy
cluster
ing algorithm
分类号
TN957.52 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
基于数据挖掘和聚类分析的协同过滤推荐算法
19
作者
何岫钰
机构
北京语言大学商学院
出处
《电子设计工程》
2024年第9期47-50,共4页
文摘
为了提高推荐系统的可扩展性和用户满意度,设计基于数据挖掘和聚类分析的协同过滤推荐算法。基于双向关联规则原理,构建标签资源矩阵,利用K-means聚类算法对标签进行聚类。结合用户偏好标签,算法能计算标签与资源的紧密程度,实现基本推荐。通过标签计算用户与资源的兴趣度,实现个性化推荐。将基本推荐和个性化推荐线性组合,得出最终结果。实验表明,该算法不仅能保持数据集的平衡状态,准确性也高。通过聚类捕捉更复杂的用户兴趣模式,显著提高了推荐结果的命中率和NDCG值,为用户提供更符合个性化需求的资源。
关键词
数据挖掘
聚类分析
协同过滤推荐
标签相似度
偏好度
个性化推荐
Keywords
data mining
cluster
analysis
collaborative filtering recommendation
label
similarity
pref-erence degree
personalized recommendation
分类号
TN39 [电子电信—物理电子学]
下载PDF
职称材料
题名
样本标签污染条件下的雷达辐射源个体识别技术
20
作者
段可欣
闫文君
凌青
王艳艳
王艺卉
机构
海军航空大学
[
[
[
出处
《海军航空大学学报》
2024年第2期189-198,260,共11页
基金
国家自然科学基金面上项目(62271499)
电磁空间安全全国重点实验室开放基金。
文摘
针对辐射源个体识别(Specific Emitter Identification,SEI)中由于数据集存在错误标签导致识别率下降的问题,提出了1种有监督和无监督融合的错误标签识别和纠正方法。首先采用无监督密度峰值聚类方法将数据集中出现的标签错误样本找出,再使用K折交叉实验对这些标签异常的样本进行预测投票,将得票数多的标签作为错误标签纠正的结果。经过清洗的数据集再通过卷积神经网络进行训练,得到1个较为理想的辐射源个体识别的网络模型,保证了在样本污染条件下,辐射源个体识别网络仍能具有较好的识别率。文章所提方法的识别率相比未经处理的数据集的识别率在标签错误率小于30%时平均提高3.3%;在标签错误率大于30%时,也能使个体识别率达到90%左右,验证了文章所提方法在对错误标签的识别和纠正上可以取得较好的效果。
关键词
辐射源个体识别
错误标签
密度峰值聚类
K折交叉实验
卷积神经网络
Keywords
SEI
wrong
label
density peak
cluster
ing
K-fold crossover experiment
convolutional neural network
分类号
TN974 [电子电信—信号与信息处理]
TN957 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于密度峰值的标签传播算法
吴卫江
王星豪
潘雪玲
郑艺峰
郑猋
《计算机与数字工程》
2024
0
下载PDF
职称材料
2
增强学习标签相关性的多标签特征选择方法
滕少华
卢建磊
滕璐瑶
张巍
《计算机应用研究》
CSCD
北大核心
2024
0
下载PDF
职称材料
3
面向复杂网络舆情知识发现的事理图谱方法优化
肖亚龙
冯皓
朱承璋
冯杰
《情报杂志》
CSSCI
北大核心
2024
0
下载PDF
职称材料
4
基于聚类及长短时记忆神经网络预测油田产量
王洪亮
林霞
蒋丽维
刘宗尚
《石油科学通报》
CAS
2024
1
下载PDF
职称材料
5
伪标签指导下自适应聚类网络
张鑫煜
徐慧英
陈宇杭
朱信忠
《浙江师范大学学报(自然科学版)》
CAS
2024
0
下载PDF
职称材料
6
一种基于层次聚类的人力数据标签体系设计与实现
明丽洪
马永一
罗昌俊
付渲理
《兵工自动化》
北大核心
2024
0
下载PDF
职称材料
7
基于特征表达和模型预测的主动学习
姜海涛
邱保志
李向丽
《计算机工程与设计》
北大核心
2024
0
下载PDF
职称材料
8
多项正则化约束的伪标签传播优化脑电信号聚类
代成龙
李光辉
李栋
申佳华
皮德常
《计算机研究与发展》
EI
CSCD
北大核心
2024
0
下载PDF
职称材料
9
RFID标签冲突低复杂度聚类分离方法
郭佳雯
吴海锋
高威
曾玉
《计算机工程与设计》
北大核心
2024
0
下载PDF
职称材料
10
基于共享背景主题的Labeled LDA模型
江雨燕
李平
王清
《电子学报》
EI
CAS
CSCD
北大核心
2013
17
下载PDF
职称材料
11
基于伪标签正则化损失的无监督行人重识别
贾洁茹
张硕蕊
钱宇华
阮秋琦
《电子学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
12
基于局部密度峰和标签传播的最小生成树聚类
林钰莹
侯新民
《计算机系统应用》
2024
0
下载PDF
职称材料
13
基于证据理论的三向密度峰值聚类
赵乌吉斯古楞
凃云杰
《计算机应用与软件》
北大核心
2024
0
下载PDF
职称材料
14
面向目标机动类型的数据标签生成方法
汪其林
曹志敏
高静
《指挥控制与仿真》
2024
0
下载PDF
职称材料
15
基于方向权值标签传播的微学习单元聚类算法
胡志远
张月琴
陈健
《科学技术与工程》
北大核心
2024
0
下载PDF
职称材料
16
基于AEViT与先验知识的胶质瘤IDH1突变状态预测
徐华畅
许倩
赵钰琳
梁峰宁
徐凯
朱红
《智能系统学报》
CSCD
北大核心
2024
0
下载PDF
职称材料
17
利用多标签信息的聚类方法
杨国安
王志岗
《天津理工大学学报》
2024
0
下载PDF
职称材料
18
SAR ATR中标签噪声不确定性建模与纠正
于跃
王琛
师君
陶重犇
李良
唐欣欣
周黎明
韦顺军
张晓玲
《雷达学报(中英文)》
EI
CSCD
北大核心
2024
0
下载PDF
职称材料
19
基于数据挖掘和聚类分析的协同过滤推荐算法
何岫钰
《电子设计工程》
2024
0
下载PDF
职称材料
20
样本标签污染条件下的雷达辐射源个体识别技术
段可欣
闫文君
凌青
王艳艳
王艺卉
《海军航空大学学报》
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
14
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部