期刊文献+
共找到168篇文章
< 1 2 9 >
每页显示 20 50 100
基于共享最近邻的自适应密度峰值聚类算法
1
作者 王心耕 杜韬 +2 位作者 周劲 陈迪 仵匀政 《计算机科学》 CSCD 北大核心 2024年第8期97-105,共9页
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分... 密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法。首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生。在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能。 展开更多
关键词 共享最近 密度峰值 分配策略 中心 密度衰减
下载PDF
融合转移概率矩阵的多阶最近邻图聚类算法
2
作者 徐童童 解滨 +1 位作者 张春昊 张喜梅 《计算机应用》 CSCD 北大核心 2024年第5期1527-1538,共12页
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本... 聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本较高。为解决这两个问题,提出融合转移概率矩阵的多阶最近邻图聚类算法(MNNGC)。首先,综合样本的近邻关系和空间分布结构,将共享近邻定义的相似度进行趋密性加权,得到节点间的趋密性亲和矩阵;其次,利用节点间多阶概率转移预测非邻接点的关联程度,并通过融合多阶转移概率矩阵得到稳定的节点间亲和矩阵;再次,为进一步增强图局部结构,重新构建节点的多阶最近邻图,并对多阶最近邻图的局部结构分层聚类;最后,优化了边缘点分配策略。定位实验结果表明,MNNGC在合成数据集上的准确率(Acc)均优于对比算法,且在8个UCI数据集上的Acc为最大值。其中在Compound数据集上,MNNGC的Acc、调整互信息(AMI)、调整兰德指数(ARI)和FM指数(FMI)相较于基于局部密度峰值的谱聚类(LDP-SC)算法分别提高38.6、27.2、45.4、35.1个百分点。 展开更多
关键词 共享 趋密性 转移概率 多阶最近 分层
下载PDF
用于雷达信号分选的K中位最近邻聚类算法
3
作者 伍佳钰 甄佳奇 《黑龙江大学自然科学学报》 CAS 2024年第4期496-504,共9页
在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了... 在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了K中位最近邻(K-median nearest neighbor,KMNN)算法,通过引入自衰减系数并设置阈值上限对参数值列表进行二次处理,可以自适应根据聚类结果与不同参数时的K值之间的关系确定最优的邻域半径和最少点个数,提高了分选的正确率。通过仿真实验验证了算法利用雷达脉冲描述字特征进行自适应分选的有效性。 展开更多
关键词 雷达信号分选 DBSCAN K中位最近算法
下载PDF
VANET随机部署环境下基于改进型共享最近邻密度峰聚类的快速分簇算法
4
作者 陈靖宇 徐志林 《计算机测量与控制》 2023年第9期174-182,共9页
针对车辆高速移动场景下,网络拓扑变化过大导致网络分簇结果不稳定的问题,提出一种基于改进型共享最近邻密度峰聚类的快速成簇算法SNNCA(shared nearest neighbor clustering algorithm);通过综合考虑节点的链路生存周期和移动相似性,... 针对车辆高速移动场景下,网络拓扑变化过大导致网络分簇结果不稳定的问题,提出一种基于改进型共享最近邻密度峰聚类的快速成簇算法SNNCA(shared nearest neighbor clustering algorithm);通过综合考虑节点的链路生存周期和移动相似性,提出一种全新的节点连接稳定程度评估指标,并将该评估指标应用于节点共享最近邻的计算过程,以组织网络节点为划分合理的多跳簇结构;为适应网络环境的动态变化,提出一种簇维护策略,其中每个层级的簇成员承担着维护下一层级簇成员的任务,该策略能够对簇成员进行批量分离或合并,从而实现了算法的分布式快速收敛;根据随机部署场景中进行的仿真实验结果显示,相比其他较新算法,SNNCA算法降低了74%的簇数量,并且簇成员的平均存活时间增加了近1倍,表现出更好的网络稳定性和健壮性。 展开更多
关键词 车载自组织网络 快速分簇算法 共享最近 密度峰 随机部署场景 多跳簇结构
下载PDF
改进的共享最近邻聚类算法 被引量:3
5
作者 李霞 蒋盛益 《计算机工程与应用》 CSCD 北大核心 2011年第8期138-142,共5页
聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2... 聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2)没有明确给出参数阈值的简单指导性操作方法;(3)只能处理数值型属性数据集。对共享最近邻算法进行改进,使其能够处理混合属性数据集,并给出参数阈值的简单选择方法,改进后算法运行时间与数据集大小成近似线性关系,适用于大规模高维数据集。在真实数据集和人造数据集上的实验结果表明,提出的改进算法是有效可行的。 展开更多
关键词 共享最近算法 一趟算法 大规模数据集
下载PDF
基于共享最近邻的密度自适应邻域谱聚类算法 被引量:7
6
作者 葛君伟 杨广欣 《计算机工程》 CAS CSCD 北大核心 2021年第8期116-123,共8页
在谱聚类算法没有先验信息的情况下,对于具有复杂形状和不同密度变化的数据集很难构建合适的相似图,且基于欧氏距离的高斯核函数的相似性度量忽略了全局一致性。针对该问题,提出一种基于共享最近邻的密度自适应邻域谱聚类算法(SC-DANSN... 在谱聚类算法没有先验信息的情况下,对于具有复杂形状和不同密度变化的数据集很难构建合适的相似图,且基于欧氏距离的高斯核函数的相似性度量忽略了全局一致性。针对该问题,提出一种基于共享最近邻的密度自适应邻域谱聚类算法(SC-DANSN)。通过一种无参数的密度自适应邻域构建方法构建无向图,将共享最近邻作为衡量样本之间的相似性度量进而消除参数对构建相似图的影响,体现全局和局部的一致性。实验结果表明,SC-DANSN算法相比K-means算法和基于K最近邻的谱聚类算法(SC-KNN)具有更高的聚类精度,同时相比SC-KNN算法对参数的选取敏感性更低。 展开更多
关键词 相似性矩阵 密度自适应 共享最近 K最近
下载PDF
结合自然和共享最近邻的密度峰值聚类算法 被引量:7
7
作者 柏锷湘 罗可 罗潇 《计算机科学与探索》 CSCD 北大核心 2021年第5期931-940,共10页
基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在流形数据集上的处理效果不佳。针对这些问题,提出一种密度峰值聚类改进算法。该算法结合了自然和共享最... 基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在流形数据集上的处理效果不佳。针对这些问题,提出一种密度峰值聚类改进算法。该算法结合了自然和共享最近邻算法,重新定义了截断距离和局部密度的计算方法,并且算法融合了候选聚类中心计算概念,通过算法选出不同的候选聚类中心,然后以这些候选中心为新的数据集,再次开始密度峰值聚类,最后将剩余的点分配到所对应的候选中心点所在类簇中。改进的算法在合成数据集和UCI数据集上进行验证,并与K-means、DBSCAN和DPC算法进行比较。实验结果表明,提出的算法在性能方面有明显提升。 展开更多
关键词 密度峰值算法 自然最近 共享最近
下载PDF
罚处共享最近邻密度峰聚类算法 被引量:1
8
作者 高润峰 苏一丹 覃华 《计算机工程与设计》 北大核心 2021年第12期3407-3414,共8页
为解决传统密度峰聚类算法容易忽略低密度簇中心以及难以自动选择聚类中心的问题,提出罚处共享最近邻密度峰聚类算法。设计罚处系数,减少高密度簇中非中心点的共享最近邻局部密度值,降低低密度簇中心点被忽视的机率;采用迭代阈值法实现... 为解决传统密度峰聚类算法容易忽略低密度簇中心以及难以自动选择聚类中心的问题,提出罚处共享最近邻密度峰聚类算法。设计罚处系数,减少高密度簇中非中心点的共享最近邻局部密度值,降低低密度簇中心点被忽视的机率;采用迭代阈值法实现簇中心点的自动选择。在人工数据集、UCI真实数据集以及图像数据集上进行仿真实验,其结果表明,该算法能找到数据集的簇中心和簇数目,聚类精度优于相比较的其它算法,该算法是可行的、有效的。 展开更多
关键词 密度峰算法 共享最近局部密度 簇中心点 罚处系数 迭代阈值法
下载PDF
基于改进局部密度的可扩展层次聚类算法
9
作者 陈斌 谢文波 +2 位作者 付勋 张恒基 王欣 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期370-382,共13页
层次聚类是无监督学习的重点研究方向,由于其结果易于分析,因此被广泛应用于数据挖掘领域.目前大多数层次聚类算法都需要根据数据的成对距离进行簇合并操作,因此具有较高的复杂度(不论是时间或空间),无法用于大规模数据的处理.针对以上... 层次聚类是无监督学习的重点研究方向,由于其结果易于分析,因此被广泛应用于数据挖掘领域.目前大多数层次聚类算法都需要根据数据的成对距离进行簇合并操作,因此具有较高的复杂度(不论是时间或空间),无法用于大规模数据的处理.针对以上问题,提出了一种基于改进局部密度的可扩展层次聚类算法(Density-based Scalable Hierarchical Clustering,DBSC).该算法根据数据间的最近邻关系构造最近邻图,并在每个最近邻分量上根据互惠最近邻结点的局部密度选择代表点.为了降低孤立最近邻分量对计算局部密度的干扰,算法利用二阶最近邻将孤立最近邻分量重连至最近邻分量.通过以上步骤算法选择代表点,以迭代的方式自下而上地构建聚类树.大量真实数据集的实验结果表明,该算法可以在保证较高的聚类精度和较快的响应速度的前提下将处理数据的规模提升至数十万项. 展开更多
关键词 层次 局部密度 最近 互惠最近
下载PDF
融合相对密度和最近邻关系的密度峰值聚类 被引量:1
10
作者 王威娜 朱钰 任艳 《计算机科学与探索》 CSCD 北大核心 2023年第8期1879-1892,共14页
密度峰值算法在处理密度不均匀的数据时对中心点的选取不准确,并在样本分配时易产生连带错误,导致聚类效果不佳。针对上述问题,提出一种融合相对局部密度和最近邻关系的密度峰值聚类算法。在局部密度的定义中引入稀疏平和权重,提出相对... 密度峰值算法在处理密度不均匀的数据时对中心点的选取不准确,并在样本分配时易产生连带错误,导致聚类效果不佳。针对上述问题,提出一种融合相对局部密度和最近邻关系的密度峰值聚类算法。在局部密度的定义中引入稀疏平和权重,提出相对局部密度的定义,根据相对局部密度寻找密度峰值,避免稀疏差异较大的数据集在选取密度峰值时出现的错误,确保中心点选择的正确性;针对分配策略,结合最邻近点准则和阈值限制,提出最近邻分配策略,根据阈值条件有效抑制分配连带错误;基于类内距离均值定义距离比例,提出修正分配策略,提升算法对边界点聚类的准确性。在5个合成数据集和5个UCI数据集上,将提出算法与DPC、DPC-MND、FKNN-DPC、DBSCAN、OPTICS、AP、K-means算法进行比较,实验结果表明,所提算法在调整互信息、调整兰德系数和Fowlkes-Mallows指数上均表现出良好的聚类效果,并通过Friedman检验表明该算法具有最优的性能。 展开更多
关键词 算法 密度峰值 相对局部密度 最近关系 分配策略
下载PDF
改进的神经网络最近邻聚类学习算法及其应用 被引量:25
11
作者 孙延风 梁艳春 孟庆福 《吉林大学学报(信息科学版)》 CAS 2002年第1期63-66,共4页
提出了一种改进的 RBF (Radial Basis Functions,径向基函数 )神经网络最近邻聚类学习算法 ,并将其应用于股市预测问题。模拟结果表明 ,改进算法的拟合效果与拟合误差均明显好于常规最近邻聚类学习算法 ,可以较大幅度提高 RBF神经网络... 提出了一种改进的 RBF (Radial Basis Functions,径向基函数 )神经网络最近邻聚类学习算法 ,并将其应用于股市预测问题。模拟结果表明 ,改进算法的拟合效果与拟合误差均明显好于常规最近邻聚类学习算法 ,可以较大幅度提高 RBF神经网络的预测性能。 展开更多
关键词 神经网络 预测 径向基函数 最近算法
下载PDF
基于共享最近邻的客户交易数据聚类算法
12
作者 李遥 荀亚玲 《计算机技术与发展》 2022年第1期73-78,共6页
利用客户交易数据聚类分析,可得到更优异的客户细分效果,有助于企业更详实地了解消费者,制定精准的营销策略。PurTreeClust是一种新型的客户交易数据聚类算法,定义了一种新型的度量方式PurTree距离,可以很好地分析处理具有层次树结构的... 利用客户交易数据聚类分析,可得到更优异的客户细分效果,有助于企业更详实地了解消费者,制定精准的营销策略。PurTreeClust是一种新型的客户交易数据聚类算法,定义了一种新型的度量方式PurTree距离,可以很好地分析处理具有层次树结构的交易数据,但未考虑近邻点的影响,仅将交易树分配到距离最近的聚类中心所属类簇,容易出现错误的交易树分配。该文利用交易树之间的共享最近邻信息,提出一种客户交易数据聚类算法。该算法在聚类分配时,充分利用共享最近邻,首先分配类簇的从属交易树,然后分配类簇的可能从属交易树,实现聚类分配,可发现更加紧凑清晰的类簇,并避免了交易树错误分配,改善了客户细分效果。最后采用6个真实客户交易数据集进行实验,验证了该算法的有效性。 展开更多
关键词 交易数据 客户细分 交易树 共享最近
下载PDF
基于共享最近邻聚类和模糊集理论的分类器 被引量:5
13
作者 李订芳 胡文超 何炎祥 《控制与决策》 EI CSCD 北大核心 2006年第10期1103-1108,共6页
提出一种基于共享最近邻聚类和模糊集理论的分类器.首先,在提出与核点密切相关的核半径概念的基础上,应用共享最近邻聚类得到正常类空间的部分核点和核半径,建立求解正常类空间补充核点的多目标优化模型,从而获得刻画正常类空间的全部... 提出一种基于共享最近邻聚类和模糊集理论的分类器.首先,在提出与核点密切相关的核半径概念的基础上,应用共享最近邻聚类得到正常类空间的部分核点和核半径,建立求解正常类空间补充核点的多目标优化模型,从而获得刻画正常类空间的全部核点和核半径.然后,将模糊集理论引入正常类的类属划分中,利用核点和核半径定义正常类的隶属度函数,建立基于隶属度函数的分类函数或分类器.实验表明,该分类器能处理包含噪音、孤立点和不规则子类的高维数据集的分类问题. 展开更多
关键词 共享最近 模糊集 遗传算法 优化模型
下载PDF
一种新的最近邻聚类算法 被引量:8
14
作者 徐艺萍 邓辉文 李阳旭 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第6期114-116,共3页
在分析现有最近邻聚类算法所存在问题的基础上,提出了一种先利用均值规格化的思想来确定算法的初始半径,然后根据启发式规则修改聚类半径的新的最近邻聚类算法.同时,给出了聚类有效性函数对得到的聚类结果进行合理性判断.
关键词 最近算法 半径 启发式规则 有效性函数
下载PDF
一种改进的最近邻聚类学习算法 被引量:5
15
作者 李杰星 章云 符曦 《控制理论与应用》 EI CAS CSCD 北大核心 2000年第5期735-738,共4页
提出了一种自适应模糊逻辑系统 (AFLS)的改进自适应学习算法 ,该算法将无导师学习算法与基于梯度信息的寻优学习算法相结和 。
关键词 模糊神经网络 非线性系统 最近学习算法
下载PDF
动态最近邻聚类算法的优化研究 被引量:5
16
作者 储岳中 徐波 《计算机工程与设计》 CSCD 北大核心 2011年第5期1687-1690,共4页
针对最近邻聚类算法对聚类半径敏感、不易获得最优解的问题,提出了基于贝叶斯信息测度BIC(Bayesianinformationcriterion)的优化方法。通过DBSCAN算法对初始数据集进行预处理,去除噪声数据。在参数空间内逐步调整聚类半径,利用最近邻聚... 针对最近邻聚类算法对聚类半径敏感、不易获得最优解的问题,提出了基于贝叶斯信息测度BIC(Bayesianinformationcriterion)的优化方法。通过DBSCAN算法对初始数据集进行预处理,去除噪声数据。在参数空间内逐步调整聚类半径,利用最近邻聚类算法对数据集进行聚类,并计算每次聚类结果的贝叶斯信息测度值。比较各次聚类结果的贝叶斯信息测度值,最大贝叶斯信息测度值对应的聚类即为最优聚类结果。实验结果表明,优化的最近邻聚类算法很好地解决了合适的聚类半径选取问题。 展开更多
关键词 数据挖掘 密度算法 贝叶斯信息测度 最近 优化
下载PDF
基于遗传进化的最近邻聚类算法及其应用 被引量:1
17
作者 陈真勇 何永勇 +1 位作者 褚福磊 黄靖远 《控制与决策》 EI CSCD 北大核心 2002年第4期469-472,共4页
提出了基于遗传进化的最近邻聚类算法 ,该算法结合了遗传算法 (GA)与最近邻聚类算法(NN)。对要进行分类的样本和特征量进行优化选取 ,去除位于类交界的模糊样本 ,并对样本分类有效的特征量进行放大 ,对不利于样本分类的特征量进行抑制 ... 提出了基于遗传进化的最近邻聚类算法 ,该算法结合了遗传算法 (GA)与最近邻聚类算法(NN)。对要进行分类的样本和特征量进行优化选取 ,去除位于类交界的模糊样本 ,并对样本分类有效的特征量进行放大 ,对不利于样本分类的特征量进行抑制 ,从而提高了样本分类的精度。将该算法应用于抽水蓄能发电机组的工况分类 ,大大提高了机组工况的识别效果 。 展开更多
关键词 遗传算法 最近 特征选取 样本优化
下载PDF
基于AIC准则的最近邻聚类模型的优化算法 被引量:12
18
作者 秦宣云 《系统工程与电子技术》 EI CSCD 北大核心 2005年第2期257-259,共3页
聚类分析方法的困难在于聚类模型的类中心和类别数的确定。首先给出了最近邻聚类规则,并根据该规则建立了确定聚类模型的分类方法;其次针对不同的聚类模型提出了优化判别准则———AIC准则,为解决所聚类的紧凑性与类别数增加的矛盾给出... 聚类分析方法的困难在于聚类模型的类中心和类别数的确定。首先给出了最近邻聚类规则,并根据该规则建立了确定聚类模型的分类方法;其次针对不同的聚类模型提出了优化判别准则———AIC准则,为解决所聚类的紧凑性与类别数增加的矛盾给出了理论分析。通过实例仿真,验证了本方法的实用性和正确性。 展开更多
关键词 分析 AIC准则 最近算法
下载PDF
一种基于最近邻优先的知识聚类算法 被引量:2
19
作者 胡健 董跃华 《江西理工大学学报》 CAS 2008年第5期72-74,共3页
基于"同类相近"的思想,构建了一种改进的最短距离聚类算法——最近邻优先聚类算法NNPC.该算法可以快速获得不同层次的高质量聚类,进而找到满足要求的阚值参数和聚类,并能够高效处理以任意形状分布的具有噪声数据的大数据量高... 基于"同类相近"的思想,构建了一种改进的最短距离聚类算法——最近邻优先聚类算法NNPC.该算法可以快速获得不同层次的高质量聚类,进而找到满足要求的阚值参数和聚类,并能够高效处理以任意形状分布的具有噪声数据的大数据量高维数据,且用户需要的先验知识少.通过3个定理的提出和证明,体现算法的先进性. 展开更多
关键词 算法 最近优先 知识发现 阀值参数
下载PDF
一种基于动态最近邻聚类算法RBF网络非线性系统复合控制器设计 被引量:1
20
作者 李娟 李长奎 张绍德 《工业仪表与自动化装置》 2009年第1期49-52,共4页
针对RBF网络的设计难点,提出一种动态确定隐层节点数和聚类中心的新方法。并基于逆动力学的思想,提出一种RBF网络逆控制与PID控制相结合的在线自学习控制方案。辨识器采用RBF网络结构和动态最近邻聚类算法,实现了对系统逆动力学的动态... 针对RBF网络的设计难点,提出一种动态确定隐层节点数和聚类中心的新方法。并基于逆动力学的思想,提出一种RBF网络逆控制与PID控制相结合的在线自学习控制方案。辨识器采用RBF网络结构和动态最近邻聚类算法,实现了对系统逆动力学的动态辨识。并将辨识模型作为控制器模型,与被控对象串联,构成一个动态伪线性系统,从而使非线性对象的控制问题简化成线性对象的问题。仿真结果证明了该控制策略具有良好的动态跟踪性能和抗干扰能力,具有较强的鲁棒性。 展开更多
关键词 RBF神经网络 动态最近算法 在线自学习 复合控制器
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部