期刊文献+
共找到816篇文章
< 1 2 41 >
每页显示 20 50 100
局部标准差优化的密度峰值聚类算法
1
作者 谢娟英 张文杰 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期47-62,共16页
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密... 密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。 展开更多
关键词 密度峰值 标准差 局部密度 分配策略
下载PDF
考虑局部密度的电力通信大数据并行聚类算法
2
作者 高群 薛超凯 《计算机仿真》 2024年第10期59-62,472,共5页
由于电力通信大数据分布广、数量庞大且无规律可循,难以取得理想的并行聚类效果,为此,提出考虑局部密度的电力通信大数据并行聚类算法。利用欧式距离计算数据之间的相似度,获取数据局部密度,根据相似度得到并行聚类质心的准确位置;对并... 由于电力通信大数据分布广、数量庞大且无规律可循,难以取得理想的并行聚类效果,为此,提出考虑局部密度的电力通信大数据并行聚类算法。利用欧式距离计算数据之间的相似度,获取数据局部密度,根据相似度得到并行聚类质心的准确位置;对并行处理过程提出约束条件,并加权处理数据距离,完成高效率的大数据并行聚类。将所提方法与其它方法展开实验对比,结果表明,所提方法有着高于另外两种算法的聚类准确度和纯度,对于无序且数量庞大的典型电力数据也实现了精准聚类,有效降低了漏聚类和误聚类现象的发生概率。 展开更多
关键词 局部密度因子 大数据并行 欧式距离 并行处理
下载PDF
基于改进局部密度的可扩展层次聚类算法
3
作者 陈斌 谢文波 +2 位作者 付勋 张恒基 王欣 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期370-382,共13页
层次聚类是无监督学习的重点研究方向,由于其结果易于分析,因此被广泛应用于数据挖掘领域.目前大多数层次聚类算法都需要根据数据的成对距离进行簇合并操作,因此具有较高的复杂度(不论是时间或空间),无法用于大规模数据的处理.针对以上... 层次聚类是无监督学习的重点研究方向,由于其结果易于分析,因此被广泛应用于数据挖掘领域.目前大多数层次聚类算法都需要根据数据的成对距离进行簇合并操作,因此具有较高的复杂度(不论是时间或空间),无法用于大规模数据的处理.针对以上问题,提出了一种基于改进局部密度的可扩展层次聚类算法(Density-based Scalable Hierarchical Clustering,DBSC).该算法根据数据间的最近邻关系构造最近邻图,并在每个最近邻分量上根据互惠最近邻结点的局部密度选择代表点.为了降低孤立最近邻分量对计算局部密度的干扰,算法利用二阶最近邻将孤立最近邻分量重连至最近邻分量.通过以上步骤算法选择代表点,以迭代的方式自下而上地构建聚类树.大量真实数据集的实验结果表明,该算法可以在保证较高的聚类精度和较快的响应速度的前提下将处理数据的规模提升至数十万项. 展开更多
关键词 层次 局部密度 最近邻图 互惠最近邻
下载PDF
基于局部密度聚类的WSN多Sink节点部署研究 被引量:1
4
作者 李翠然 吕安琪 +1 位作者 谢健骊 孙振刚 《传感技术学报》 CAS CSCD 北大核心 2024年第2期326-331,共6页
针对无线传感器网络中传感器节点能量受限,网络生命周期短的问题,在考虑网络成本的情况下,提出一种基于节点局部密度聚类的多Sink节点优化部署算法。首先,基于多属性因子构建聚类决策函数确定Sink节点部署位置,完成传感器节点聚类;然后... 针对无线传感器网络中传感器节点能量受限,网络生命周期短的问题,在考虑网络成本的情况下,提出一种基于节点局部密度聚类的多Sink节点优化部署算法。首先,基于多属性因子构建聚类决策函数确定Sink节点部署位置,完成传感器节点聚类;然后,根据下一跳节点与Sink节点间距离最短准则搜索并形成数据传输路径;最后,以网络生命周期成本比最大化为依据确定最优的Sink节点数目,实现多Sink节点优化部署。仿真结果表明:与已有算法相比,所提算法能够有效延长网络生命周期,具有较高的网络生命周期能效比。 展开更多
关键词 无线传感器网络 Sink节点部署 局部密度 网络生命周期
下载PDF
局部线性下的函数型主成分聚类算法 被引量:1
5
作者 陈海龙 胡晓雪 《统计与决策》 北大核心 2024年第5期39-44,共6页
函数型聚类分析在统计学领域被广泛关注,其分析过程通常在降维目标实现后进行。为了有效解决函数型主成分聚类问题,文章结合局部线性嵌入算法(Locally Linear Embedding,LLE)在非线性空间下的适用性,提出了一种局部线性下的函数型主成... 函数型聚类分析在统计学领域被广泛关注,其分析过程通常在降维目标实现后进行。为了有效解决函数型主成分聚类问题,文章结合局部线性嵌入算法(Locally Linear Embedding,LLE)在非线性空间下的适用性,提出了一种局部线性下的函数型主成分分析模型(LLE Function Principle Component Analysis,LFPCA)。首先,采用函数型主成分分析法作为降维目标方法,改进了FPCA的算法模型,通过将LLE算法的权重系数矩阵与函数型主成分定义相结合,构建出一个适用于非线性空间下的聚类算法;其次,在求解算法的过程中定义了函数型主成分得分,并结合EM算法构建出GMM模型来近似函数型算法的概率密度函数,使模型更高效且适用性更强;最后,通过随机模拟实验及应用分析验证了LFPCA算法模型在真实数据集上具有良好的聚类效能。 展开更多
关键词 函数型主成分 局部线性嵌入算法 EM算法 GMM模型
下载PDF
面向密度分布不均数据的加权逆近邻密度峰值聚类算法
6
作者 吕莉 陈威 +2 位作者 肖人彬 韩龙哲 谭德坤 《智能系统学报》 CSCD 北大核心 2024年第1期165-175,共11页
针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首... 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。 展开更多
关键词 密度峰值 密度分布不均 逆近邻 共享逆近邻 样本相似度 局部密度 分配策略 数据挖掘
下载PDF
高光谱影像逆近邻密度峰值聚类的波段选择算法
7
作者 孙根云 李忍忍 +3 位作者 张爱竹 安娜 付航 潘兆杰 《测绘学报》 EI CSCD 北大核心 2024年第1期8-19,共12页
密度峰值聚类波段选择算法利用局部密度描述波段的密度信息,然而现有的局部密度容易忽略波段分布的全局信息,不能有效描述波段的分布特征,导致波段子集分类精度有限。为解决上述问题,本文提出一种基于逆近邻的密度峰值聚类波段选择算法... 密度峰值聚类波段选择算法利用局部密度描述波段的密度信息,然而现有的局部密度容易忽略波段分布的全局信息,不能有效描述波段的分布特征,导致波段子集分类精度有限。为解决上述问题,本文提出一种基于逆近邻的密度峰值聚类波段选择算法。首先,利用波段与其K近邻构建K近邻有向图,获取波段的逆近邻,以及波段之间的共享近邻和共享逆近邻;然后,利用共享近邻和共享逆近邻并集的个数作为波段之间的相似度,利用波段与其逆近邻的平均欧氏距离和相似度构造增强型局部密度;最后,将增强型局部密度、距离因子、信息熵三者的乘积作为权重值,根据权重值挑选波段子集。为提高试验效率和实用性,本文算法还提出一种自动获得K值的自适应K值方法。在3个高光谱标准数据集上的试验结果表明,本文算法得到的波段子集比其他先进算法挑选的波段有更好的分类性能,尤其是在波段数较少的情况下,而且计算效率较高。 展开更多
关键词 高光谱影像 波段选择 密度峰值 逆近邻 局部密度 自适应K值
下载PDF
融合密度和划分的文本聚类算法
8
作者 刘龙 刘新 +1 位作者 蔡林杰 唐朝 《计算机与数字工程》 2024年第1期178-183,共6页
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中... 文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中的K-均值算法可以有效地聚类文档,但是算法的性能非常依赖于初始中心点的选择。论文提出了一种新的融合密度和划分的文本聚类算法。首先,通过密度选择适当的聚类中心点集合,然后使用最远距离的想法逐渐选择初始类中心点,最后使用划分方法对数据集进行聚类。实验表明,该算法的聚类效果稳定,聚类效果良好。 展开更多
关键词 文档 BERT K-均值算法 密度 最远距离
下载PDF
融合优化可调Q因子小波变换的改进密度峰值聚类算法 被引量:1
9
作者 史曼曼 宋朝炀 张景祥 《计算机应用研究》 CSCD 北大核心 2024年第2期466-472,共7页
为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化... 为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。 展开更多
关键词 密度峰值算法 可调Q因子小波变换 粒子群优化算法 主成分分析
下载PDF
基于密度分布的鲁棒谱聚类算法
10
作者 李超 廖红梅 +2 位作者 徐晓 郭丽丽 丁世飞 《计算机学报》 EI CAS CSCD 北大核心 2024年第11期2645-2663,共19页
谱聚类作为一种基于图论的聚类方法,通过相似性矩阵对数据进行特征分解或将数据投影到低维空间以实现更好的数据划分.谱聚类因其适用于复杂数据和非凸子簇而受到广泛的关注,并已成功应用在很多领域.然而,计算复杂度高、噪声敏感等问题... 谱聚类作为一种基于图论的聚类方法,通过相似性矩阵对数据进行特征分解或将数据投影到低维空间以实现更好的数据划分.谱聚类因其适用于复杂数据和非凸子簇而受到广泛的关注,并已成功应用在很多领域.然而,计算复杂度高、噪声敏感等问题会限制其聚类效果的进一步提升.针对这些问题,本文提出了一种基于密度分布的鲁棒谱聚类算法.首先,设置噪声系数以过滤少量的低密度噪声点.其次,根据密度峰值聚类具有的特性,即尽可能多地划分数据能够保证子簇内数据标签的一致性,新提出的算法能够在较少的子簇数和更高的簇内标签一致性上达到平衡,实现了对数据更加优质的划分.最后,基于簇间密度分布的相似性度量改善了谱聚类在密度不均匀数据集上的聚类效果.合成数据以及真实数据上的实验充分证明了新算法在9个最新改进算法中的有效性.在保证聚类效率的前提下,新算法在真实数据上的准确率、调整兰德系数和调整互信息的平均值上至少分别提升了10.02%、22.11%和15.76%. 展开更多
关键词 密度分布 子簇相似性 局部峰值 噪声检测
下载PDF
基于局部密度聚类的雷达目标散射中心区域分割
11
作者 胡承鑫 曾曙光 +5 位作者 管灵 董纯柱 曾祥云 郑胜 黄瑶 罗骁域 《科学技术与工程》 北大核心 2024年第1期260-266,共7页
散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中... 散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中心的小区域,对每个小区域分别进行特征提取和参数计算。根据雷达目标散射中心的特点,提出了一种基于局部密度聚类的雷达目标散射中心区域分割技术。首先,对雷达图像进行Frost滤波、基于水平集方法(level set method,LSM)的图像分割和面积滤波的一系列图像预处理获得目标感兴趣(region of interest,ROI)区域,然后对预处理后的图像利用局部密度聚类算法检测散射中心并进行区域分割。实验中,采用模拟数据和真实数据对所提方法和传统图像分割算法展开数值实验,实验结果验证了所提方法在雷达目标散射中心区域分割的有效性和优越性。 展开更多
关键词 雷达目标 散射中心 局部密度 区域分割
下载PDF
基于类簇合并的无参数密度峰值聚类算法
12
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值算法 初始 簇合并 相似度 性能
下载PDF
基于人工鱼群的自适应密度峰值聚类算法
13
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
下载PDF
基于密度聚类算法和广度优先搜索算法的道岔摩擦电流智能分析系统
14
作者 邱晓莉 韩思远 +1 位作者 熊庆 余东 《城市轨道交通研究》 北大核心 2024年第4期114-118,共5页
[目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出... [目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出建立道岔摩擦电流的智能分析系统。阐述了该系统的功能及工作原理,设定了该系统的摩擦电流标准值及阈值范围。该系统可基于密度聚类算法和广度优先搜索算法自动获取道岔摩擦电流值。介绍了该系统的调试界面截图,以说明系统在获取道岔摩擦电流值如何为现场检修人员提供操作建议。[结果及结论]该智能系统具有良好的可用性,实现了节约检修时间、降低维护成本和提高检修效率的既定目的。 展开更多
关键词 城市轨道交通 信号 智能运维 道岔转辙机 摩擦电流 密度算法 广度优先搜索算法
下载PDF
基于局部密度峰和标签传播的最小生成树聚类
15
作者 林钰莹 侯新民 《计算机系统应用》 2024年第8期18-29,共12页
基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在... 基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在保留原始数据集分布结构的同时,排除了噪声点,因此,将局部密度峰与最小生成树聚类算法相结合,采用标签传播,提出了基于局部密度峰和标签传播的最小生成树聚类算法(DPMST).该算法采用了局部密度峰之间基于共享邻的距离,利用局部密度峰之间的邻域信息,有效构造最小生成树和识别无效边,使算法能够发现具有复杂结构的簇.标签传播增强强标签,削弱弱标签,以细化错误的标签,特别是对于边界点以及揭示复杂流形,能够提高聚类结果的质量.人工和真实数据集上的实验结果表明,与经典聚类算法DPC、MST、K-means、DBSCAN、AP、SC和BIRCH比较,DPMST算法表现优异. 展开更多
关键词 局部密度 最小生成树 标签传播
下载PDF
结合灰狼优化算法和动态邻域的三支密度峰值聚类算法
16
作者 陈沛琦 黄春梅 《长江信息通信》 2024年第1期70-73,77,共5页
针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhoue... 针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhouette指标作为目标函数,利用灰狼优化算法(GWO)的全局寻优能力求解最优的截断距离dc;为了使不确定数据的划分更加合理,结合动态邻域的思想,利用K近邻算法将二支聚类结果转化为三支聚类结果。通过在人工数据集以及UCI真实数据集的实验验证,该算法的聚类精度和总体性能优于其他5种对比算法。 展开更多
关键词 密度峰值 灰狼优化算法 三支 截断距离
下载PDF
基于密度峰值聚类算法的实验教学课程个性化推荐方法
17
作者 师海燕 齐芸 汪玲 《合肥师范学院学报》 2024年第3期110-114,共5页
海量的教学课程资源,增加了用户的选择困难性。面对这种情况,为帮助用户选择适合的课程资源,研究基于数据挖掘的实验教学课程个性化推荐方法。利用密度峰值聚类算法对用户进行聚类,并找出目标用户的最近邻。根据最近邻用户对课程的评分... 海量的教学课程资源,增加了用户的选择困难性。面对这种情况,为帮助用户选择适合的课程资源,研究基于数据挖掘的实验教学课程个性化推荐方法。利用密度峰值聚类算法对用户进行聚类,并找出目标用户的最近邻。根据最近邻用户对课程的评分,预测目标用户对每门实验课程的评分。从预测评分中选择得分最高的N个实验课程作为个性化课程推荐给目标用户。实验结果表明:当采用基于数据挖掘的推荐方法时,推荐新颖性为0.536,推荐覆盖率为95.63%,与三种传统推荐方法相比,推荐新颖性和推荐覆盖率均更大,由此说明所研究方法的推荐性能更好。 展开更多
关键词 数据挖掘 密度峰值算法 实验教学课程 个性化推荐
下载PDF
基于密度的聚类算法在数据挖掘中的应用与改进
18
作者 何珍珍 张馨雨 《信息记录材料》 2024年第6期116-118,共3页
本研究针对密度聚类算法在数据挖掘中的关键挑战,提出了一系列创新改进措施。通过自适应参数调整、局部核密度估计、噪声抑制和多尺度聚类分析,有效提高了聚类算法的性能。实验验证显示,这些改进在处理复杂数据集时,尤其是在噪声和多密... 本研究针对密度聚类算法在数据挖掘中的关键挑战,提出了一系列创新改进措施。通过自适应参数调整、局部核密度估计、噪声抑制和多尺度聚类分析,有效提高了聚类算法的性能。实验验证显示,这些改进在处理复杂数据集时,尤其是在噪声和多密度尺度场景下,显著增强了聚类的准确性和鲁棒性。研究结果为密度聚类算法在实际应用中的优化提供了新思路,并为相关领域的智能数据分析提供了有力工具。 展开更多
关键词 密度算法 数据挖掘 自适应参数优化 局部密度估计
下载PDF
融合最近邻矩阵与局部密度的自适应K-means聚类算法 被引量:6
19
作者 艾力米努尔·库尔班 谢娟英 姚若侠 《计算机科学与探索》 CSCD 北大核心 2023年第2期355-366,共12页
针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启... 针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启发,通过引入数据对象间的距离差异值构造邻近矩阵,根据邻近矩阵计算局部密度,不需要任何参数设置,采取最近邻矩阵与局部密度融合策略,自适应确定初始聚类中心数目和位置,同时完成非中心点的初分配。人工数据集和UCI数据集的实验测试,以及与传统K-means算法、基于离群点改进的K-means算法、基于密度改进的K-means算法的实验比较表明,提出的自适应K-means算法对人工数据集的孤立点免疫度较高,对UCI数据集具有更准确的聚类结果。 展开更多
关键词 自适应K-means算法 密度峰值原则 最邻近吸收原则 局部密度
下载PDF
基于相互K近邻的密度峰值聚类算法
20
作者 赵志忠 陈素根 《安庆师范大学学报(自然科学版)》 2024年第2期41-46,共6页
密度峰值聚类是一种原理简单、运行高效的聚类算法,但其存在密度定义方式不统一、聚类中心选择容易出错和样本分配可能产生“多米诺”现象等问题。针对上述问题,提出一种基于相互K近邻的密度峰值聚类算法(MKDPC)。首先,基于样本的相互K... 密度峰值聚类是一种原理简单、运行高效的聚类算法,但其存在密度定义方式不统一、聚类中心选择容易出错和样本分配可能产生“多米诺”现象等问题。针对上述问题,提出一种基于相互K近邻的密度峰值聚类算法(MKDPC)。首先,基于样本的相互K近邻定义一种改进的局部密度,统一了DPC算法密度定义方式,能够有效避免变密度数据集聚类中心选择出错的问题;其次,基于相互K近邻定义了样本间的共享相互K近邻和相似度,进而提出一种样本多步分配策略,该策略可以有效克服样本分配过程中的“多米诺”现象。在人工数据集和真实数据集上进行实验,并将MKDPC算法与其他4种算法进行比较,验证了所提MKDPC算法的有效性。 展开更多
关键词 密度峰值 相互K近邻 局部密度 分配策略
下载PDF
上一页 1 2 41 下一页 到第
使用帮助 返回顶部