期刊文献+
共找到125篇文章
< 1 2 7 >
每页显示 20 50 100
Modeling of Energy Consumption and Effluent Quality Using Density Peaks-based Adaptive Fuzzy Neural Network 被引量:10
1
作者 Junfei Qiao Hongbiao Zhou 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2018年第5期968-976,共9页
Modeling of energy consumption(EC) and effluent quality(EQ) are very essential problems that need to be solved for the multiobjective optimal control in the wastewater treatment process(WWTP). To address this issue, a... Modeling of energy consumption(EC) and effluent quality(EQ) are very essential problems that need to be solved for the multiobjective optimal control in the wastewater treatment process(WWTP). To address this issue, a density peaks-based adaptive fuzzy neural network(DP-AFNN) is proposed in this study. To obtain suitable fuzzy rules, a DP-based clustering method is applied to fit the cluster centers to process nonlinearity.The parameters of the extracted fuzzy rules are fine-tuned based on the improved Levenberg-Marquardt algorithm during the training process. Furthermore, the analysis of convergence is performed to guarantee the successful application of the DPAFNN. Finally, the proposed DP-AFNN is utilized to develop the models of EC and EQ in the WWTP. The experimental results show that the proposed DP-AFNN can achieve fast convergence speed and high prediction accuracy in comparison with some existing methods. 展开更多
关键词 density peaks clustering effluent quality (EQ) energy consumption (EC) fuzzy neural network improved Levenberg-Marquardt algorithm wastewater treatment process (WWTP).
下载PDF
基于BDPCA聚类算法的航空发动机故障数据标记 被引量:9
2
作者 吕超 程弓 刘云清 《振动与冲击》 EI CSCD 北大核心 2020年第9期35-41,共7页
航空发动机作为飞行器的动力核心对飞行器的安全飞行有着举足轻重的作用,保证航空发动机的平稳运行对飞行安全有着重大意义。在基于有监督学习的航空发动机故障诊断技术不断取得进展的同时,如何将平时获取的大量未标记数据转换为能够用... 航空发动机作为飞行器的动力核心对飞行器的安全飞行有着举足轻重的作用,保证航空发动机的平稳运行对飞行安全有着重大意义。在基于有监督学习的航空发动机故障诊断技术不断取得进展的同时,如何将平时获取的大量未标记数据转换为能够用来训练故障诊断模型的带标记数据,成为了制约行业发展的一大瓶颈。针对这一问题引入了基于无监督学习的DPCA算法,用以实现对未标记数据集的准确分类与标记,并针对DPCA算法在局部密度计算与簇类别数选择方面的缺陷进行了优化:针对原始DPCA算法应用标准高斯核计算局部密度易造成误识别的状况,引入共享邻域算法对局部密度的计算方法进行优化;针对原始DPCA算法需要人工研判确定簇类别数易造成的误识别状况,引入BIC选择准则对簇类别数的选择方法进行优化;提出了原始DPCA算法与共享邻域算法以及BIC选择准则相结合的BDPCA算法。最后应用航空发动机转子故障数据对BDPCA算法进行了性能验证并取得了良好的结果,证实了BDPCA算法在航空发动机气路故障诊断领域有较高的实用价值。 展开更多
关键词 航空发动机 气路故障 密度峰值聚类分析(dpca) 贝叶斯信息准则(BIC) 共享邻域
下载PDF
基于BDPCA的驾驶员脑疲劳等级划分研究
3
作者 吕超 闫超 +1 位作者 徐亚茹 年锦涛 《计算机仿真》 北大核心 2022年第11期208-214,共7页
当人体产生疲劳状态时,大脑释放的脑电信号也会发生相应的变化。在以往对脑疲劳状态的研究中,研究者多从清醒与疲劳两种状态进行分析,忽略了对不同的疲劳状态程度的研究,且对不同疲劳状态划分的定义并不客观。针对脑疲劳状态等级划分研... 当人体产生疲劳状态时,大脑释放的脑电信号也会发生相应的变化。在以往对脑疲劳状态的研究中,研究者多从清醒与疲劳两种状态进行分析,忽略了对不同的疲劳状态程度的研究,且对不同疲劳状态划分的定义并不客观。针对脑疲劳状态等级划分研究不充分的问题,提出了一种基于非监督学习的聚类算法对疲劳状态等级进行客观性的划分。通过小波包分解提取脑电信号的节律能量和非线性特征作为特征向量,使用共同邻域参数(CNN)改进的DPCA聚类算法对提取到的特征向量进行分析训练。同时,使用贝叶斯准则(BIC)对类簇个数进行辅助判定。实验结果证明,改进后的BDPCA算法准确率可以达到85%以上,能够对脑电信号中表征的不同疲劳状态等级进行准确划分,实现了脑疲劳状态等级的客观性定义。 展开更多
关键词 疲劳等级 脑电信号 小波包分解 密度峰值聚类 贝叶斯准则
下载PDF
基于改进NSGA-Ⅱ的多目标车间物料配送方法
4
作者 詹燕 陈洁雅 +5 位作者 江伟光 鲁建厦 汤洪涛 宋新禹 许丽丽 刘赛淼 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第12期2510-2519,共10页
针对车间物料配送效率低的问题,建立以配送路径最短和时间窗惩罚值最小为目标的物料配送多目标优化模型,提出基于快速非支配排序遗传算法(NSGA-Ⅱ)的混合优化算法INSGA-Ⅱ.该算法采用密度峰值聚类(DPC)初始化种群,缩减问题规模;在NSGA-... 针对车间物料配送效率低的问题,建立以配送路径最短和时间窗惩罚值最小为目标的物料配送多目标优化模型,提出基于快速非支配排序遗传算法(NSGA-Ⅱ)的混合优化算法INSGA-Ⅱ.该算法采用密度峰值聚类(DPC)初始化种群,缩减问题规模;在NSGA-Ⅱ遗传操作阶段,采用差分进化(DE)算法,避免陷入局部最优;通过变异向量的差分操作与部分映射交叉加快迭代速度,同时提高种群多样性.通过求解不同基准函数与不同规模算例验证算法的有效性,结果表明,与传统NSGA-Ⅱ算法相比,改进算法具有更优帕累托前沿,同时算法结果的均匀性和多样性更好,求解时间更短.研究结果表明,新算法生成的结果更优;相比NSGA-Ⅱ算法、多目标粒子群算法(MOPSO),生成的总配送距离减少26.65%,总时间窗惩罚减少32.5%,能有效提高车间物料的配送效率. 展开更多
关键词 物料配送 多目标优化 密度峰值聚类 非支配排序遗传 差分进化
下载PDF
DCVAE与DPC融合的网络入侵检测模型研究 被引量:1
5
作者 李登辉 葛丽娜 +2 位作者 王哲 樊景威 张壕 《小型微型计算机系统》 CSCD 北大核心 2024年第4期998-1006,共9页
入侵检测是主动防御网络中攻击行为的技术,以往入侵检测模型因正常网络流量与未知攻击内在特征区分度不足,导致对未知攻击识别率不够高,本文设计基于判别条件变分自编码器与密度峰值聚类算法的入侵检测模型(DCVAE-DPC).利用判别条件变... 入侵检测是主动防御网络中攻击行为的技术,以往入侵检测模型因正常网络流量与未知攻击内在特征区分度不足,导致对未知攻击识别率不够高,本文设计基于判别条件变分自编码器与密度峰值聚类算法的入侵检测模型(DCVAE-DPC).利用判别条件变分自编码器能够生成指定类别样本的能力,学习正常网络流量特征的隐空间表示并计算其重建误差,增加其与未知攻击间的特征区分度,并使用密度峰值聚类算法求出正常网络流量重建误差的分布,提高未知攻击识别率.实验结果表明,在NSL-KDD数据集中与当前流行的入侵检测模型相比,模型的分类准确率可以达到97.08%,具有更高的未知攻击检测能力,面对当前复杂网络环境,有更强的入侵检测性能. 展开更多
关键词 入侵检测 判别条件变分自编码器 密度峰值聚类算法 未知攻击识别 细粒度攻击分类
下载PDF
基于类簇合并的无参数密度峰值聚类算法
6
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 聚类分析 密度峰值聚类算法 初始类簇 类簇合并 相似度 聚类性能
下载PDF
基于融合改进K-means聚类算法的数据检测技术 被引量:3
7
作者 郭克难 《电子设计工程》 2024年第5期41-45,共5页
针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密... 针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密度和高密度距离进行计算,进而优化簇中心的选择。同时融合PCA降维算法减少了数据的冗余信息,进一步提高了运行效率。通过引入LOF离群检测算法对分簇后的数据进行检测,从而得到异常数据结果。实验测试中,所提算法在人工数据集上的平均ARI指标为0.844,真实数据集的准确率则达到了79.2%,在所有对比算法中均为最优,表明该算法具有良好的性能,可以对财务异常数据进行准确地检测。 展开更多
关键词 K-MEANS聚类 密度峰值检测 主成分分析法 离群检测算法 异常数据检测
下载PDF
基于人工鱼群的自适应密度峰值聚类算法
8
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 聚类算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
下载PDF
结合灰狼优化算法和动态邻域的三支密度峰值聚类算法
9
作者 陈沛琦 黄春梅 《长江信息通信》 2024年第1期70-73,77,共5页
针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhoue... 针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhouette指标作为目标函数,利用灰狼优化算法(GWO)的全局寻优能力求解最优的截断距离dc;为了使不确定数据的划分更加合理,结合动态邻域的思想,利用K近邻算法将二支聚类结果转化为三支聚类结果。通过在人工数据集以及UCI真实数据集的实验验证,该算法的聚类精度和总体性能优于其他5种对比算法。 展开更多
关键词 密度峰值聚类 灰狼优化算法 三支聚类 截断距离
下载PDF
近邻关系约束和簇心扩散的密度峰值聚类算法
10
作者 杨重阳 徐华 张紫丹 《小型微型计算机系统》 CSCD 北大核心 2024年第12期2830-2837,共8页
研究表明,对于非球形簇和密度不均匀的聚类,DPC很难选择正确的簇中心;同时,DPC的分配方法存在多米诺骨牌效应,即不正确的分配一个区域中密度最高的点,将导致该区域中的所有点都指向同一个错误的聚类.为了解决这两个不足,本文提出了近邻... 研究表明,对于非球形簇和密度不均匀的聚类,DPC很难选择正确的簇中心;同时,DPC的分配方法存在多米诺骨牌效应,即不正确的分配一个区域中密度最高的点,将导致该区域中的所有点都指向同一个错误的聚类.为了解决这两个不足,本文提出了近邻关系约束和簇心扩散的密度峰值聚类算法(DPC-NCCD).首先,引入了k近邻和二阶k近邻来重新定义局部密度,避免了密度不均匀的数据集在选取密度峰值时候出现的错误,确保簇心选择的正确性;其次,对于剩余样本的分配,本文采用三阶段的分配策略,每个阶段中依据不同的近邻关系约束条件来逐步扩大类簇.这样的分配策略可以缓解多米诺效应,并提高在流形数据集上的正确性.通过人工数据和真实数据的测试,证明了该算法在密度不均匀的流形数据集上具有良好的聚类性能. 展开更多
关键词 聚类算法 密度峰值 K近邻 二阶K近邻
下载PDF
基于改进DPC-IGWO-Elman的负荷分解方法
11
作者 胡胜 袁功进 刘聪 《湖北工业大学学报》 2024年第5期1-7,共7页
针对现有负荷分解方法负荷特征单一、分解精度低的问题,提出一种结合改进密度峰值聚类算法与改进灰狼算法优化Elman神经网络的非侵入式负荷分解方法。首先针对密度峰值聚类算法(DPC)在处理复杂数据集时缺乏自适应能力的问题对局部密度... 针对现有负荷分解方法负荷特征单一、分解精度低的问题,提出一种结合改进密度峰值聚类算法与改进灰狼算法优化Elman神经网络的非侵入式负荷分解方法。首先针对密度峰值聚类算法(DPC)在处理复杂数据集时缺乏自适应能力的问题对局部密度的计算方法进行改进,再将改进DPC算法应用于用电器负荷数据的聚类分析,从而得到用电器的工作状态标签并进行编码;之后运用Elman神经网络构建分解模型同时引入改进灰狼优化算法(IGWO)对网络参数进行寻优,最后根据网络输出编码获取用电器工作状态标签并根据对应负荷特征信息进行有功功率拟合,完成负荷分解。经公开数据集测试和实验对比,IGWO-Elman模型的识别准确率以及有功功率拟合效果均优于其他模型。 展开更多
关键词 非侵入式负荷分解 密度峰值聚类算法 灰狼优化算法 ELMAN神经网络
下载PDF
基于偏好随机游动能量均衡算法的激光雷达数据低能耗传输
12
作者 田小东 《微型电脑应用》 2024年第8期56-58,67,共4页
为了优化激光雷达数据的传输性能,设计一种针对激光雷达数据的低能耗传输方法。利用密度峰值快速聚类方法分割激光雷达数据噪声点,完成数据的聚类处理;采用偏好随机游动能量均衡算法规范随机游动数据;通过分解激光雷达数据传输范围设计... 为了优化激光雷达数据的传输性能,设计一种针对激光雷达数据的低能耗传输方法。利用密度峰值快速聚类方法分割激光雷达数据噪声点,完成数据的聚类处理;采用偏好随机游动能量均衡算法规范随机游动数据;通过分解激光雷达数据传输范围设计数据传输方法,实现激光雷达数据的低能耗传输。实验结果表明,该方法在晴天、雨雪天气和雾霾天气3种不同天气下的激光雷达数据传输能耗均较低,传输激光雷达数据时可以有效减少平均节点跳数,受数据无序化影响较小,证明所提方法具有较高的实际应用价值。 展开更多
关键词 激光雷达 低能耗传输 偏好随机游动能量均衡算法 密度峰值快速聚类
下载PDF
密度峰值聚类算法综述 被引量:52
13
作者 陈叶旺 申莲莲 +3 位作者 钟才明 王田 陈谊 杜吉祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第2期378-394,共17页
密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度... 密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度峰值点,可以用来作为聚类中心.根据建构好的层次关系,该算法提供了2种不同的方式完成最后聚类:一种是与用户交互的决策图,另一种是自动化方式.跟踪了DPeak近年来的发展与应用动态,对该算法的各种改进或变种从以下3方面进行了总结和梳理:首先,介绍了DPeak算法原理,对其在聚类算法分类体系中的位置进行了讨论.将其与5个主要的聚类算法做了比较之后,发现DPeak与均值漂移聚类算法(mean shift)有诸多相似之处,因而认为其可能为mean shift的一个特殊变种.其次,讨论了DPeak的几个不足之处,如复杂度较高、自适应性不足、精度低和高维数据适用性差等,将针对这些缺点进行改进的相关算法做了分类讨论.此外,梳理了DPeak算法在不同领域中的应用,如自然语言处理、生物医学应用、光学应用等.最后,探讨了密度峰值聚类算法所存在的问题及挑战,同时对进一步的工作进行展望. 展开更多
关键词 聚类算法 密度峰值 大数据 数据挖掘 密度聚类
下载PDF
基于改进快速密度峰值算法的电力负荷曲线聚类分析 被引量:24
14
作者 陈俊艺 丁坚勇 +4 位作者 田世明 卜凡鹏 朱炳翔 黄事成 周凯 《电力系统保护与控制》 EI CSCD 北大核心 2018年第20期85-93,共9页
为解决传统聚类算法对大数据背景下高维海量、类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定、聚类效果较差、聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法。首先应用主成分分析法对归一... 为解决传统聚类算法对大数据背景下高维海量、类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定、聚类效果较差、聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法。首先应用主成分分析法对归一化后的负荷曲线集进行降维处理,以减少样本向量间欧式距离的计算量和加快后续操作。然后利用kd树算法对降维后的数据进行快速K近邻搜索生成KNN矩阵。最后以KNN矩阵代替原算法的距离矩阵作为输入数据。在基于KNN改进的样本局部密度和距离计算准则的基础上,运用快速密度峰值算法对负荷曲线进行聚类分析。通过实验和算例分析验证了所提改进算法的实用性和有效性。 展开更多
关键词 电力大数据 负荷曲线聚类 快速密度峰值算法 主成分分析 KD树 KNN算法
下载PDF
基于密度峰值层次聚类的短期光伏功率预测模型 被引量:26
15
作者 程启明 张强 +2 位作者 程尹曼 褚思远 杨小龙 《高电压技术》 EI CAS CSCD 北大核心 2017年第4期1214-1222,共9页
针对传统聚类算法不易选取初始聚类中心、对噪声值较敏感、收敛速度慢及易陷入局部最优等问题,提出一种基于密度峰值的层次聚类算法对天气类型进行聚类。首先确定气象数据的密度峰值参数,采用分层聚类算法将气象数据划分为不同类别,然... 针对传统聚类算法不易选取初始聚类中心、对噪声值较敏感、收敛速度慢及易陷入局部最优等问题,提出一种基于密度峰值的层次聚类算法对天气类型进行聚类。首先确定气象数据的密度峰值参数,采用分层聚类算法将气象数据划分为不同类别,然后利用支持向量机(SVM)对未知天气类型进行识别,最终采用径向基(RBF)神经网络建立光伏发电短期功率预测模型。仿真结果表明,该方法能有效提高气象类型的分类精度、加快寻优速度,提高离群样本点分离的鲁棒性,证明了其在小样本的情况下具有较高的精度,且在天气波动较大时仍能较好地实现功率值的预测。 展开更多
关键词 光伏功率预测 层次聚类算法 密度峰值 气象因子 支持向量机 径向基神经网络
下载PDF
基于密度峰值聚类算法的模态参数识别 被引量:9
16
作者 王飞宇 胡志祥 黄潇 《振动与冲击》 EI CSCD 北大核心 2019年第2期172-178,共7页
稀疏成分分析是解决欠定盲源分离问题的一种有效方法,其主要分为两步:计算振型矩阵和重构单模态信号。在计算振型矩阵时,针对无法预知源信号数量和高阶振动模态混叠的问题,利用一种基于密度峰值聚类算法识别模态振型。相比于传统的聚类... 稀疏成分分析是解决欠定盲源分离问题的一种有效方法,其主要分为两步:计算振型矩阵和重构单模态信号。在计算振型矩阵时,针对无法预知源信号数量和高阶振动模态混叠的问题,利用一种基于密度峰值聚类算法识别模态振型。相比于传统的聚类算法,该方法具有以下特点:①利用决策图直观地选出聚类中心和聚类数目;②算法可以自动分离噪声点,对噪声不敏感。在重构单模态信号时,利用可以快速重构稀疏信号的SL0算法,重构出单模态时频域信号,提取出各阶模态频率。通过振动结构仿真算例验证了该方法的有效性。 展开更多
关键词 模态分析 稀疏成分分析 密度峰值聚类(dpca) SL0算法
下载PDF
相对邻域与剪枝策略优化的密度峰值聚类算法 被引量:15
17
作者 纪霞 姚晟 赵鹏 《自动化学报》 EI CSCD 北大核心 2020年第3期562-575,共14页
针对Science发表的密度峰值聚类(Density peaks clustering,DPC)算法及其改进算法效率不高的缺陷,提出一种相对邻域和剪枝策略优化的密度峰值聚类(Relative neighborhood and pruning strategy optimized DPC,RP-DPC)算法.DPC聚类算法... 针对Science发表的密度峰值聚类(Density peaks clustering,DPC)算法及其改进算法效率不高的缺陷,提出一种相对邻域和剪枝策略优化的密度峰值聚类(Relative neighborhood and pruning strategy optimized DPC,RP-DPC)算法.DPC聚类算法主要有两个阶段:聚类中心点的确定和非聚类中心点样本的类簇分配,并且时间复杂度集中在第1个阶段,因此RP-DPC算法针对该阶段做出改进研究.RP-DPC算法去掉了DPC算法预先计算距离矩阵的步骤,首先利用相对距离将样本映射到相对邻域中,再从相对邻域来计算各样本的密度,从而缩小各样本距离计算及密度统计的范围;然后在计算各样本的δ值时加入剪枝策略,将大量被剪枝样本δ值的计算范围从样本集缩小至邻域以内,极大地提高了算法的效率.理论分析和在人工数据集及UCI数据集的对比实验均表明,与DPC算法及其改进算法相比,RP-DPC算法在保证聚类质量的同时可以实现有效的时间性能提升. 展开更多
关键词 聚类算法 密度峰值 相对邻域 剪枝策略
下载PDF
密度峰值优化初始中心的K-medoids聚类算法 被引量:27
18
作者 谢娟英 屈亚楠 《计算机科学与探索》 CSCD 北大核心 2016年第2期230-247,共18页
针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算... 针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法。算法采用样本x i的t最近邻距离之和倒数度量其局部密度ρi,并定义样本x i的新距离δi,构造样本距离相对于样本密度的决策图。局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本。选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数。为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数。在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性。 展开更多
关键词 聚类 K-medoids算法 初始聚类中心 密度峰值 准则函数
下载PDF
基于层次与密度的任意形状聚类算法 被引量:8
19
作者 许合利 牛丽君 《计算机工程》 CAS CSCD 北大核心 2016年第7期159-164,共6页
结合层次聚类算法和密度聚类算法,提出一种新的任意形状聚类算法,以密度峰值点为初始聚类中心将数据集划分为大量子簇。根据聚类合并准则,对簇间边界区域密度大于等于其中任何一个簇平均密度的相邻子簇进行合并。通过动态建模方法进行... 结合层次聚类算法和密度聚类算法,提出一种新的任意形状聚类算法,以密度峰值点为初始聚类中心将数据集划分为大量子簇。根据聚类合并准则,对簇间边界区域密度大于等于其中任何一个簇平均密度的相邻子簇进行合并。通过动态建模方法进行子簇合并,无需人工输入终止参数即可自动确定聚类终止点。在测试数据集和真实数据集上的实验结果表明,该算法对输入参数的选择具有鲁棒性,能有效识别任意形状、大小和密度的聚类,并且适用于密度分布不均匀的数据集。 展开更多
关键词 层次聚类算法 密度聚类算法 任意形状聚类 动态模型 边界区域密度 密度峰值点
下载PDF
复杂高维数据的密度峰值快速搜索聚类算法 被引量:13
20
作者 陈俊芬 张明 赵佳成 《计算机科学》 CSCD 北大核心 2020年第3期79-86,共8页
机器学习的无监督聚类算法已被广泛应用于各种目标识别任务。基于密度峰值的快速搜索聚类算法(DPC)能快速有效地确定聚类中心点和类个数,但在处理复杂分布形状的数据和高维图像数据时仍存在聚类中心点不容易确定、类数偏少等问题。为了... 机器学习的无监督聚类算法已被广泛应用于各种目标识别任务。基于密度峰值的快速搜索聚类算法(DPC)能快速有效地确定聚类中心点和类个数,但在处理复杂分布形状的数据和高维图像数据时仍存在聚类中心点不容易确定、类数偏少等问题。为了提高其处理复杂高维数据的鲁棒性,文中提出了一种基于学习特征表示的密度峰值快速搜索聚类算法(AE-MDPC)。该算法采用无监督的自动编码器(AutoEncoder)学出数据的最优特征表示,结合能刻画数据全局一致性的流形相似性,提高了同类数据间的紧致性和不同类数据间的分离性,促使潜在类中心点的密度值成为局部最大。在4个人工数据集和4个真实图像数据集上将AE-MDPC与经典的K-means,DBSCAN,DPC算法以及结合了PCA的DPC算法进行比较。实验结果表明,在外部评价指标聚类精度、内部评价指标调整互信息和调整兰德指数上,AE-MDPC的聚类性能优于对比算法,而且提供了更好的可视化性能。总之,基于特征表示学习且结合流形距离的AE-MDPC算法能有效地处理复杂流形数据和高维图像数据。 展开更多
关键词 聚类 密度峰值 DPC算法 特征表示 流形距离
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部