期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
自适应截断距离与样本分配的密度峰值聚类算法
1
作者 张志壮 高文华 +1 位作者 石慧 董增寿 《太原科技大学学报》 2023年第2期91-96,共6页
针对密度峰值聚类算法中,样本局部密度截断距离需主观选择和样本分配策略的误差扩散问题,提出自适应截断距离和构造流形距离优化样本分配的改进型密度峰值聚类算法。该算法首先使用样本K近邻自适应的选取各点的截断距离,即在样本密度大... 针对密度峰值聚类算法中,样本局部密度截断距离需主观选择和样本分配策略的误差扩散问题,提出自适应截断距离和构造流形距离优化样本分配的改进型密度峰值聚类算法。该算法首先使用样本K近邻自适应的选取各点的截断距离,即在样本密度大的点,选用大截断距离,准确选取类簇中心,在样本密度小的点,选用小截断距离,判别离群点。其次对于剩余样本通过样本的连接路径构造流形距离,优化样本分配策略。最后选取人工数据集进行聚类分析算法实验,与传统的密度峰值聚类算法进行实验对比,验证所提改进算法对聚类中心选取和样本分配的准确性。 展开更多
关键词 密度峰值聚类 聚类中心 自适应截断距离 流形距离
下载PDF
基于人工鱼群的自适应密度峰值聚类算法
2
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 聚类算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
下载PDF
结合灰狼优化算法和动态邻域的三支密度峰值聚类算法
3
作者 陈沛琦 黄春梅 《长江信息通信》 2024年第1期70-73,77,共5页
针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhoue... 针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhouette指标作为目标函数,利用灰狼优化算法(GWO)的全局寻优能力求解最优的截断距离dc;为了使不确定数据的划分更加合理,结合动态邻域的思想,利用K近邻算法将二支聚类结果转化为三支聚类结果。通过在人工数据集以及UCI真实数据集的实验验证,该算法的聚类精度和总体性能优于其他5种对比算法。 展开更多
关键词 密度峰值聚类 灰狼优化算法 三支聚类 截断距离
下载PDF
基于TimeSVD++与DPC的推荐算法研究
4
作者 陈功进 孙士保 +1 位作者 卜卫锋 杨焕静 《计算机仿真》 2024年第8期286-291,共6页
针对使用奇异值分解(SVD)方法时需要填充矩阵的内容较多以及K-means算法受到K值的影响且数据集形状限制等问题,提出一种将TimeSVD++与改进的密度峰值聚类结合的方法。首先在SVD++的基础上引入参数时间因子,构建TimeSVD++模型;其次,采用... 针对使用奇异值分解(SVD)方法时需要填充矩阵的内容较多以及K-means算法受到K值的影响且数据集形状限制等问题,提出一种将TimeSVD++与改进的密度峰值聚类结合的方法。首先在SVD++的基础上引入参数时间因子,构建TimeSVD++模型;其次,采用将相似系数引入高斯核函数的方法,对密度峰聚类算法中的局部密度公式进行修正;引入信息熵确定最优截断距离,最后在数据集MovieLens-1M和MovieLens-100k上验证,并将实验结果与其它算法进行对比。结果表明:所提出的方法在MAE,RMSE,Recall和F1值指标上均优于其它的算法。 展开更多
关键词 时间因子 密度峰值聚类 局部密度 截断距离
下载PDF
基于自适应可达距离的密度峰值聚类算法 被引量:6
5
作者 章曼 张正军 +1 位作者 冯俊淇 严涛 《计算机应用》 CSCD 北大核心 2022年第6期1914-1921,共8页
针对基于快速搜索和发现密度峰值的聚类(CFSFDP)算法中截断距离需要人工选取,以及最近邻分配带来的误差导致的在具有不同密度簇的复杂数据集上的聚类效果不佳的问题,提出了一种基于自适应可达距离的密度峰值聚类(ARD-DPC)算法。该算法... 针对基于快速搜索和发现密度峰值的聚类(CFSFDP)算法中截断距离需要人工选取,以及最近邻分配带来的误差导致的在具有不同密度簇的复杂数据集上的聚类效果不佳的问题,提出了一种基于自适应可达距离的密度峰值聚类(ARD-DPC)算法。该算法利用非参数核密度估计方法计算点的局部密度,根据决策图选取聚类中心,并利用自适应可达距离分配数据点,从而得到最终的聚类结果。在4个合成数据集和6个UCI数据集上进行了仿真实验,将所提算法ARD-DPC与基于快速搜索和发现密度峰值的聚类(CFSFDP)、基于密度的噪声应用空间聚类(DBSCAN)、基于密度自适应距离的密度峰聚类(DADPC)算法进行了比较,实验结果表明,相比其他三种算法,ARD-DPC算法在7个数据集上的标准化互信息(NMI)、兰德指数(RI)和F1-measure取得了最大值,在2个数据集分别取得F1-measure和NMI的最大值,只对模糊度较高、聚类特征不明显的Pima数据集聚类效果不佳;同时,ARD-DPC算法在合成数据集上能准确地识别出聚类数目和具有复杂密度的簇。 展开更多
关键词 聚类算法 密度峰值 截断距离 非参数核密度估计 自适应可达距离
下载PDF
密度峰值聚类算法研究综述 被引量:2
6
作者 王森 邢帅杰 刘琛 《华东交通大学学报》 2023年第1期106-116,共11页
密度峰值聚类(DPC)是一种新提出的基于密度和距离的聚类算法,由于其原理简单,无需迭代和能处理形状数据集等优点,正在数据挖掘领域得到广泛应用。但DPC算法也有着一定的缺陷,如:对截断距离参数敏感,初始聚类中心的选择非自动化,后续标... 密度峰值聚类(DPC)是一种新提出的基于密度和距离的聚类算法,由于其原理简单,无需迭代和能处理形状数据集等优点,正在数据挖掘领域得到广泛应用。但DPC算法也有着一定的缺陷,如:对截断距离参数敏感,初始聚类中心的选择非自动化,后续标签分配存在链式问题,时间复杂度较高等。文章对DPC算法的研究现状进行了总结与整理,首先介绍了DPC的算法原理和流程;其次,针对DPC算法的不足对DPC算法的优化进行概括和分析,指出了优化算法的核心技术以及优缺点;最后,对DPC算法未来可能面对的挑战和发展趋势进行展望。 展开更多
关键词 聚类算法 密度峰值 截断距离 初始聚类中心 微簇合并 时间复杂度
下载PDF
区域相关融合纹理特征FDPC图书馆文档图像检索 被引量:4
7
作者 余琨 伍孝金 《西南师范大学学报(自然科学版)》 CAS 北大核心 2017年第7期91-98,共8页
为实现数字图书馆馆藏资源的检索效率和检测精度的提升,提出基于快速纹理密度极值的聚类算法(FDPC)的图像检索策略.首先,对图书馆图像资源检索问题进行基于内容的检索框架构建,然后采用直方均衡以及中值滤波策略实现图像资源的背景处理... 为实现数字图书馆馆藏资源的检索效率和检测精度的提升,提出基于快速纹理密度极值的聚类算法(FDPC)的图像检索策略.首先,对图书馆图像资源检索问题进行基于内容的检索框架构建,然后采用直方均衡以及中值滤波策略实现图像资源的背景处理和噪声过滤,并通过二值化对图书馆馆藏图像资源进行处理,获得检索框架图像输入的预处理操作;其次,利用极值密度聚类算法(DPC)对图像的分类问题进行研究,同时为了增强算法的聚类效果,基于动态距离截断策略对其进行改进,获得DPC算法性能的有效提高;最后,基于图书馆标准测试库(Corel)对所提算法的性能进行实验验证,试验结果表明所提方法具有更高的检索效率和检索精度. 展开更多
关键词 图书馆 动态距离截断 纹理特征 密度极值 图像检索
下载PDF
基于DTW度量和局部紧邻图的序列聚类设计 被引量:1
8
作者 汤敏 刘雅婷 +1 位作者 王永程 杨帆 《计算机仿真》 北大核心 2018年第4期246-249,共4页
时间序列是科研生产中广泛存在的重要的数据对象。由于时间序列形态复杂,对其进行相似性度量非常困难,因此设计高效的时间序列聚类算法成为一个很有价值的研究课题。提出了一种基于DTW度量和局部紧邻接图的聚类算法。新算法通过对DTW距... 时间序列是科研生产中广泛存在的重要的数据对象。由于时间序列形态复杂,对其进行相似性度量非常困难,因此设计高效的时间序列聚类算法成为一个很有价值的研究课题。提出了一种基于DTW度量和局部紧邻接图的聚类算法。新算法通过对DTW距离矩阵进行较小距离截断的办法分离出核心簇结构,进而确定聚类的簇数、划分核心点和边缘点,具有过程简单、物理意义明确的优点。在不同数据集上的仿真表明,新算法的聚类性能不仅超过了传统算法kmeans和hierarchy,同时优于最新的DP算法的DTW改进版。 展开更多
关键词 聚类 时间序列 动态时间规整 距离截断 局部紧邻接图 核心簇结构
下载PDF
空间密度聚类在数字图书馆图像检索中的应用 被引量:6
9
作者 王华秋 王重阳 聂珍 《现代情报》 CSSCI 北大核心 2016年第2期129-134,共6页
图像聚类为数字图书馆图像管理提供了新的技术支持,能够在大量图像数据中发掘使用户感兴趣的信息。传统应用于图像聚类的特征提取算法往往忽略图像颜色的空间分布信息,且适应性较差。通过等面积矩形环对图像进行划分并计算各空间区域的... 图像聚类为数字图书馆图像管理提供了新的技术支持,能够在大量图像数据中发掘使用户感兴趣的信息。传统应用于图像聚类的特征提取算法往往忽略图像颜色的空间分布信息,且适应性较差。通过等面积矩形环对图像进行划分并计算各空间区域的相关性,并根据空间区域相关性计算各区域的重要性,将空间信息与颜色信息进行融合。同时对快速搜索密度峰值聚类算法的截断距离进行了合理改进,在保证聚类精度的同时提高收敛速度。最后将该密度聚类算法应用于数字图书馆图像检索之中。通过实验验证,本文提出的方法是可行的、有效的。 展开更多
关键词 密度聚类 截断距离 空间相关性 数字图书馆 图像检索
下载PDF
基于密度峰值法的设计理性聚类方法 被引量:3
10
作者 王业东 李向前 +2 位作者 敬石开 魏振达 陈英 《计算机集成制造系统》 EI CSCD 北大核心 2017年第8期1662-1669,共8页
针对设计理性的自动聚类问题,提出一种基于密度峰值法的设计理性聚类方法。该方法结合设计理性的语义特点,利用单元本词汇频率/单元本频率值方法将设计理性转化为特征向量。然后基于密度峰值法求出每个特征向量的局部密度和距离两个参数... 针对设计理性的自动聚类问题,提出一种基于密度峰值法的设计理性聚类方法。该方法结合设计理性的语义特点,利用单元本词汇频率/单元本频率值方法将设计理性转化为特征向量。然后基于密度峰值法求出每个特征向量的局部密度和距离两个参数,绘制决策图确定聚类中心,并将其余的数据指派到相应所属的类别中。针对密度峰值法在处理密度分布不均的数据时聚类效果差的问题,利用K最近邻方法定义动态截断距离来改进局部密度函数。以某机械设计团队的55个设计理性为例验证了所提方法的有效性。 展开更多
关键词 设计理性 聚类方法 密度峰值法 动态截断距离 产品设计
下载PDF
一种基于密度峰值聚类的图像分割算法 被引量:12
11
作者 赵军 朱荽 +2 位作者 杨雯璟 许彦辉 庞宇 《计算机工程》 CAS CSCD 北大核心 2020年第2期274-278,285,共6页
聚类作为一种有效的图像分割方法,被广泛地应用于计算机视觉领域。相较于其他聚类方法,密度峰值聚类(DPC)具有参数少且能有效识别非球形聚类的特点。基于此,引入信息论中的不确定性度量熵,提出一种改进的DPC图像分割算法。将图像像素点... 聚类作为一种有效的图像分割方法,被广泛地应用于计算机视觉领域。相较于其他聚类方法,密度峰值聚类(DPC)具有参数少且能有效识别非球形聚类的特点。基于此,引入信息论中的不确定性度量熵,提出一种改进的DPC图像分割算法。将图像像素点的颜色空间CIE Lab值作为特征数据,通过计算信息熵求得自适应截断距离以取代经验取值,建立相应的决策图并确定聚类中心总数,归类非聚类中心点,剔除噪声点从而完成图像分割。在Berkeley数据集上的实验结果表明,该算法能较好地实现彩色图像的分割,其平均分割时间和PRI指标分别为14.658 s和0.721。 展开更多
关键词 密度峰值聚类 CIE Lab颜色空间 局部密度 截断距离 相对距离 信息熵
下载PDF
快速搜索密度峰值聚类在图像检索中的应用 被引量:5
12
作者 王华秋 聂珍 《计算机工程与设计》 北大核心 2016年第11期3045-3050,3057,共7页
为缩减图像检索和匹配范围,提高检索速度和准确率,将快速搜索密度峰值聚类用于对图像,按照特征相似性原则进行聚类,在类中心和最接近的一类中进行图像检索。考虑到传统的图像特征提取算法忽略了图像颜色的空间分布信息,提取的特征信息... 为缩减图像检索和匹配范围,提高检索速度和准确率,将快速搜索密度峰值聚类用于对图像,按照特征相似性原则进行聚类,在类中心和最接近的一类中进行图像检索。考虑到传统的图像特征提取算法忽略了图像颜色的空间分布信息,提取的特征信息无法突出感兴趣的图像区域,通过等面积矩形环对图像进行划分并计算各空间区域的相关性,根据空间区域相关性计算各区域的重要性,将空间信息与颜色信息进行融合;对聚类算法的截断距离进行合理改进,保证了聚类的精度;将该密度峰值聚类算法应用于图像检索之中。对比实验结果表明,所提聚类算法和空间特征提取方法提高了图像检索的效率和准确性。 展开更多
关键词 快速搜索 密度峰值聚类 截断距离 空间相关性 图像检索
下载PDF
布谷鸟优化的密度峰值快速搜索聚类算法 被引量:6
13
作者 郑虹 周丽媛 韩旭明 《长春工业大学学报》 CAS 2018年第3期253-260,共8页
针对密度峰值快速搜索聚类(Clustering by fast search and find of density peaks,DPC)算法截断距离dc需手动给出的缺陷,提出了布谷鸟优化的密度峰值快速搜索聚类算法(An Improved Cuckoo Search Optimization-based Density Peak Clus... 针对密度峰值快速搜索聚类(Clustering by fast search and find of density peaks,DPC)算法截断距离dc需手动给出的缺陷,提出了布谷鸟优化的密度峰值快速搜索聚类算法(An Improved Cuckoo Search Optimization-based Density Peak Clustering Algorithm,CS-DPC)。引入余弦相似度原理,将方向与实际距离相结合,更好区分两类簇中间区域数据点的归属度。选择5个人工数据集和3个标准UCI数据集进行了实验仿真。 展开更多
关键词 截断距离 聚类中心 密度聚类算法 布谷鸟算法
下载PDF
自适应密度峰值聚类算法 被引量:8
14
作者 吴斌 卢红丽 江惠君 《计算机应用》 CSCD 北大核心 2020年第6期1654-1661,共8页
密度峰值聚类(DPC)算法是一种新型的聚类算法,具有调节参数少、无需迭代求解、能够发现非球形簇等优点;但也存在截断距离无法自动调节、聚类中心需要人工指定等缺点。针对上述问题,提出了一种自适应DPC(ADPC)算法,实现了基于基尼系数的... 密度峰值聚类(DPC)算法是一种新型的聚类算法,具有调节参数少、无需迭代求解、能够发现非球形簇等优点;但也存在截断距离无法自动调节、聚类中心需要人工指定等缺点。针对上述问题,提出了一种自适应DPC(ADPC)算法,实现了基于基尼系数的自适应截断距离调节,并建立了一种聚类中心的自动获取策略。首先,综合考虑局部密度和相对距离两种因素以重新定义簇中心权值计算公式;然后,基于基尼系数建立自适应截断距离调节方法;最后,根据决策图和簇中心权值排序图提出自动选取聚类中心的策略。仿真实验结果表明,ADPC算法可以根据问题特征来自动调节截断距离并自动获取聚类中心点,而且在测试数据集上取得了比几种常用的聚类算法和DPC改进算法更好的结果。 展开更多
关键词 密度峰值 截断距离 自动聚类 基尼系数 聚类中心
下载PDF
密度峰值聚类算法研究现状与分析 被引量:1
15
作者 葛丽娜 陈园园 周永权 《广西科学》 CAS 北大核心 2022年第2期277-286,共10页
密度峰值聚类(Clustering by Fast Search and Find of Density Peaks,DPC)算法是一种新型的基于密度的聚类算法,通过选取自身密度高且距离其他更高密度点较远的样本点作为聚类中心,再根据样本间的局部密度和距离进行聚类。一方面,虽然... 密度峰值聚类(Clustering by Fast Search and Find of Density Peaks,DPC)算法是一种新型的基于密度的聚类算法,通过选取自身密度高且距离其他更高密度点较远的样本点作为聚类中心,再根据样本间的局部密度和距离进行聚类。一方面,虽然DPC算法参数唯一、简单、高效,但是其截断距离的取值是按经验策略设定,而截断距离值选取不当会导致局部密度和距离计算错误;另一方面,聚类中心的选取采用人机交互模式,对聚类结果的主观影响较大。针对DPC算法的这些缺陷,目前的改进方向主要有3个:改进截断距离的取值方式、改进局部密度和距离的计算方式以及改进聚类中心的选取方式。通过这3个方向的改进,使得DPC过程自适应。本文对DPC算法的自适应密度峰值聚类算法的研究现状进行比较分析,对进一步的工作进行展望并给出今后的研究方向:将DPC算法与智能算法有机结合实现算法自适应,对于算法处理高维数据集的性能也需要进一步探索。 展开更多
关键词 密度峰 聚类算法 自适应 截断距离 聚类中心
下载PDF
基于双重密度和簇间近邻度的密度峰值聚类算法 被引量:1
16
作者 李沛武 张永芳 +2 位作者 黄逸翠 刘紫亮 居翔 《南昌工程学院学报》 CAS 2022年第4期29-36,共8页
针对密度峰值聚类算法对密度分布不均衡数据聚类效果不佳及分配存在缺陷的问题,提出了一种基于双重密度和簇间近邻度的密度峰值聚类(DI-DPC)算法。首先,构造了双重密度计算公式,该公式不仅将基于截断距离与基于K近邻的密度计算方法相结... 针对密度峰值聚类算法对密度分布不均衡数据聚类效果不佳及分配存在缺陷的问题,提出了一种基于双重密度和簇间近邻度的密度峰值聚类(DI-DPC)算法。首先,构造了双重密度计算公式,该公式不仅将基于截断距离与基于K近邻的密度计算方法相结合,而且考虑全局范围内样本间的相互作用,使寻找的簇类中心更加准确;其次,将剩余样本点分配给距离最近、密度更大的样本点所在簇,生成微簇;最后,依据簇间近邻度进行微簇合并,提高样本分配的容错性。实验结果证明,改进算法在准确率、调整兰德系数和调整互信息上都有明显的提升,证明了DI-DPC算法的有效性。 展开更多
关键词 双重密度 K近邻 截断距离 簇间近邻度
下载PDF
一种截断距离和聚类中心自适应的聚类算法 被引量:16
17
作者 杨震 王红军 周宇 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第3期39-48,共10页
【目的】研究一种新的聚类算法,以改进密度峰值聚类算法无法自动计算截断距离以及需要人工参与选择聚类中心的不足。【方法】首先提出一种基于信息熵的截断距离自适应算法,实现了DPC算法截断距离的自适应;然后根据排序图中权值的斜率变... 【目的】研究一种新的聚类算法,以改进密度峰值聚类算法无法自动计算截断距离以及需要人工参与选择聚类中心的不足。【方法】首先提出一种基于信息熵的截断距离自适应算法,实现了DPC算法截断距离的自适应;然后根据排序图中权值的斜率变化趋势确定拐点,自动划分出聚类中心与非聚类中心的界限,实现聚类中心的自动选择。【结果】通过在UCI数据集与人工数据集上的仿真实验,对DBSCAN算法、DPC算法、DGCCD算法、ACP算法与ADPC算法进行聚类性能的比较,结果表明ADPC算法不仅能够自动选择截断距离与聚类中心,在准确率、标准互信息(NMI)、F-measure值等性能上也有较大的提升,同时证明了改进算法在处理移动终端定位数据上的有效性。【局限】主要针对低维度数据集,面对高维度数据集略显乏力,同时未能兼顾处理大数据集时的效率问题。【结论】ADPC算法能够准确选择聚类中心和截断距离,对于低维度、任意形状簇的处理效果良好。 展开更多
关键词 聚类 截断距离 斜率变化 ADPC
原文传递
基于非参数核密度估计的密度峰值聚类算法 被引量:7
18
作者 谢国伟 钱雪忠 周世兵 《计算机应用研究》 CSCD 北大核心 2018年第10期2956-2959,共4页
针对密度峰值聚类算法CFSFDP(clustering by fast search and find of density peaks)计算密度时人为判断截断距离和人工截取簇类中心的缺陷,提出了一种基于非参数核密度估计的密度峰值聚类算法。首先,应用非参数核密度估计方法计算数... 针对密度峰值聚类算法CFSFDP(clustering by fast search and find of density peaks)计算密度时人为判断截断距离和人工截取簇类中心的缺陷,提出了一种基于非参数核密度估计的密度峰值聚类算法。首先,应用非参数核密度估计方法计算数据点的局部密度;其次,根据排序图采用簇中心点自动选择策略确定潜在簇类中心点,将其余数据点归并到相应的簇类中心;最后,依据簇类间的合并准则对邻近相似子簇进行合并,并根据边界密度识别噪声点得到聚类结果。在人工测试数据集和UCI真实数据集上的实验表明,新算法较之原CFSFDP算法,不仅有效避免了人为判断截断距离和截取簇类中心的主观因素,而且可以取得更高的准确度。 展开更多
关键词 聚类 密度峰值 非参数核密度估计 截断距离
下载PDF
自适应快速搜索密度峰值聚类算法 被引量:8
19
作者 王军华 李建军 +1 位作者 李俊山 赖文达 《计算机工程与应用》 CSCD 北大核心 2019年第24期122-127,共6页
CFSFDP算法(Clustering by Fast Search and Find of Density Peaks)具有简单高效且需要较少参数的优点,但存在需要人为确定截断距离参数和聚类中心的不足。为克服以上不足,提出了自适应快速搜索密度峰值聚类算法。该算法针对截断距离... CFSFDP算法(Clustering by Fast Search and Find of Density Peaks)具有简单高效且需要较少参数的优点,但存在需要人为确定截断距离参数和聚类中心的不足。为克服以上不足,提出了自适应快速搜索密度峰值聚类算法。该算法针对截断距离参数的确定问题,构造关于截断距离参数的局部密度信息熵,通过最小化信息熵自适应地确定截断距离参数;针对聚类中心的确定问题,利用从非聚类中心到聚类中心数据点局部密度和距离的乘积,存在明显跳跃这一特征确定阈值,从而能自动确定聚类中心。实验结果表明该算法能够取得较好的聚类性能,且无需人为确定截断距离参数和聚类中心。 展开更多
关键词 聚类 密度峰值 截断距离参数 局部密度
下载PDF
结合鲸鱼优化算法的自适应密度峰值聚类算法 被引量:19
20
作者 王芙银 张德生 张晓 《计算机工程与应用》 CSCD 北大核心 2021年第3期94-102,共9页
针对密度峰值聚类算法(DPC)的聚类结果对截断距离dc的取值较为敏感、手动选取聚类中心存在着一定主观性的问题,提出了一种结合鲸鱼优化算法的自适应密度峰值聚类算法(WOA-DPC)。利用加权的局部密度和相对距离乘积的斜率变化趋势实现聚... 针对密度峰值聚类算法(DPC)的聚类结果对截断距离dc的取值较为敏感、手动选取聚类中心存在着一定主观性的问题,提出了一种结合鲸鱼优化算法的自适应密度峰值聚类算法(WOA-DPC)。利用加权的局部密度和相对距离乘积的斜率变化趋势实现聚类中心的自动选择,避免了手动选取导致的聚类中心少选或多选的情况;考虑到合理的截断距离dc是提高DPC算法聚类效果的重要因素,建立以ACC指标为目标函数的优化问题,利用鲸鱼优化算法(WOA)有效地寻优能力对目标函数进行优化,寻找最佳的截断距离dc;利用人工合成数据集与UCI上的真实数据集对WOA-DPC算法进行测试。实验结果表明,该算法在FMI、ARI和AMI指标上均优于DPC算法、DBSCAN算法以及K-Means算法,具有更好的聚类表现。 展开更多
关键词 密度峰值聚类算法 鲸鱼优化算法 聚类中心自适应 截断距离
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部