期刊文献+
共找到952篇文章
< 1 2 48 >
每页显示 20 50 100
基于改进快速密度峰值聚类算法的电力大数据异常值检测 被引量:26
1
作者 刘凤魁 邓春宇 +1 位作者 王晓蓉 王新迎 《电力信息与通信技术》 2017年第6期36-41,共6页
异常值检测是数据挖掘的一个重要分支。在电力行业,异常值检测可用于电网故障检测、设备故障检测、用电异常检测等领域。文章根据电力大数据的特点,研究适用于电力大数据的异常值检测算法。针对快速密度峰值聚类算法用于异常值检测时未... 异常值检测是数据挖掘的一个重要分支。在电力行业,异常值检测可用于电网故障检测、设备故障检测、用电异常检测等领域。文章根据电力大数据的特点,研究适用于电力大数据的异常值检测算法。针对快速密度峰值聚类算法用于异常值检测时未考虑数据的局部特点以及局部密度依赖于截断距离选取的不足,利用KNN(K-Nearest Neighbors)思想重新定义局部密度和距离,提出了基于KNN的快速密度峰值异常值检测算法,从而实现更加准确的异常值检测,并基于某省配电变压器的日负荷数据异常检测仿真实验证明了该算法的有效性。 展开更多
关键词 电力大数据 异常值检测 KNN算法 密度
下载PDF
半监督约束集成的快速密度峰值聚类算法 被引量:23
2
作者 刘如辉 黄炜平 +2 位作者 王凯 刘创 梁军 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2018年第11期2191-2200,2242,共11页
为了解决2014年在Science上提出的快速密度峰值聚类(CFDP)算法存在的自动选择时误选和漏选中心点、簇的数量需要主观先验判断、算法使用受场景局限的缺陷,从半监督角度出发,结合集成学习思想提出半监督约束集成的快速密度峰值聚类(SiCE-... 为了解决2014年在Science上提出的快速密度峰值聚类(CFDP)算法存在的自动选择时误选和漏选中心点、簇的数量需要主观先验判断、算法使用受场景局限的缺陷,从半监督角度出发,结合集成学习思想提出半监督约束集成的快速密度峰值聚类(SiCE-CFDP)算法. SiCE-CFDP算法使用相对密度方式度量节点密度,从多角度分析决策图,自动选择候选中心点,并最终自动确定簇的数量.在只标注有限约束关系的前提下,算法能以集成学习指导约束信息的扩充,提升聚类性能.在方法验证中,通过3个人工数据集、4个公开数据集以及1个空调系统数据集进行仿真研究.结果表明,在相同的约束量前提下,针对大样本数据,SiCE-CFDP算法相比其他半监督聚类算法具有更高的聚类精度. 展开更多
关键词 半监督约束 集成学习 快速密度峰值 决策图
下载PDF
基于小波变换和改进快速密度峰值聚类算法的负荷曲线聚类研究 被引量:9
3
作者 刘凤魁 邓春宇 王新迎 《电力信息与通信技术》 2017年第3期55-61,共7页
负荷曲线聚类分析是智能电网大数据研究的重要组成部分,是负荷预测、需求侧响应、电网规划、经济运行、费率制定、能效提升等研究与工作的基础。文章利用离散小波变换提取用户负荷数据多时间尺度特征,进而对负荷数据进行聚类分析。针对... 负荷曲线聚类分析是智能电网大数据研究的重要组成部分,是负荷预测、需求侧响应、电网规划、经济运行、费率制定、能效提升等研究与工作的基础。文章利用离散小波变换提取用户负荷数据多时间尺度特征,进而对负荷数据进行聚类分析。针对快速密度峰值聚类算法中局部密度依赖于截断距离和需要人为识别决策图中聚类中心的不足,利用K近邻(K-Nearest Neighbors,KNN)算法的思想重新定义局部密度和距离,并根据向外统计检验的方法实现聚类中心的自动选取。基于某省某行业用户实际负荷数据进行实验,结果将该行业负荷曲线分为正常生产型、双峰型、夜晚生产型、白天生产型、晚高峰型、早高峰型6类,表明了该算法的有效性。 展开更多
关键词 智能电网 负荷曲线 小波变换 密度 KNN算法
下载PDF
基于改进快速密度峰值聚类算法的电力大数据异常值检测分析 被引量:3
4
作者 杨峰 刘胜强 《电子设计工程》 2022年第3期113-116,121,共5页
针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进。对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题。提出了快速密度峰... 针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进。对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题。提出了快速密度峰值聚类算法的改进,对自适应参数与聚类中心自动的选择,通过标准化局部密度与距离对大数据异常值进行评测,能够得出异常点。对本文所设计的聚类算法实现算例分析,通过算例分析表示,本文所设计的算法能够满足实际用户的需求,提高电力大数据异常值的检测精准度。 展开更多
关键词 电力大数据 异常值检测 密度峰值 算法
下载PDF
面向密度分布不均数据的加权逆近邻密度峰值聚类算法
5
作者 吕莉 陈威 +2 位作者 肖人彬 韩龙哲 谭德坤 《智能系统学报》 CSCD 北大核心 2024年第1期165-175,共11页
针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首... 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。 展开更多
关键词 密度峰值 密度分布不均 逆近邻 共享逆近邻 样本相似度 局部密度 分配策略 数据挖掘
下载PDF
高光谱影像逆近邻密度峰值聚类的波段选择算法
6
作者 孙根云 李忍忍 +3 位作者 张爱竹 安娜 付航 潘兆杰 《测绘学报》 EI CSCD 北大核心 2024年第1期8-19,共12页
密度峰值聚类波段选择算法利用局部密度描述波段的密度信息,然而现有的局部密度容易忽略波段分布的全局信息,不能有效描述波段的分布特征,导致波段子集分类精度有限。为解决上述问题,本文提出一种基于逆近邻的密度峰值聚类波段选择算法... 密度峰值聚类波段选择算法利用局部密度描述波段的密度信息,然而现有的局部密度容易忽略波段分布的全局信息,不能有效描述波段的分布特征,导致波段子集分类精度有限。为解决上述问题,本文提出一种基于逆近邻的密度峰值聚类波段选择算法。首先,利用波段与其K近邻构建K近邻有向图,获取波段的逆近邻,以及波段之间的共享近邻和共享逆近邻;然后,利用共享近邻和共享逆近邻并集的个数作为波段之间的相似度,利用波段与其逆近邻的平均欧氏距离和相似度构造增强型局部密度;最后,将增强型局部密度、距离因子、信息熵三者的乘积作为权重值,根据权重值挑选波段子集。为提高试验效率和实用性,本文算法还提出一种自动获得K值的自适应K值方法。在3个高光谱标准数据集上的试验结果表明,本文算法得到的波段子集比其他先进算法挑选的波段有更好的分类性能,尤其是在波段数较少的情况下,而且计算效率较高。 展开更多
关键词 高光谱影像 波段选择 密度峰值 逆近邻 局部密度 自适应K值
下载PDF
局部标准差优化的密度峰值聚类算法
7
作者 谢娟英 张文杰 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期47-62,共16页
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密... 密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。 展开更多
关键词 密度峰值 标准差 局部密度 分配策略
下载PDF
基于网格近邻优化的密度峰值聚类算法
8
作者 刘继 杨金瑞 《计算机应用研究》 CSCD 北大核心 2024年第4期1058-1063,共6页
密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG... 密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG-DPC算法)。首先对数据空间进行网格化,减少了样本数据点之间距离的计算量;在计算局部密度时不仅考虑了网格自身的密度值,而且考虑了周围k个近邻的网格密度值,降低了主观选择截断距离对聚类结果的影响,提高了聚类准确率,设定网格密度阈值,保证了聚类结果的稳定性。通过实验结果表明,KG-DPC算法比DBSCAN、DPC和SDPC算法在聚类准确率上有很大提升,在聚类平均消耗时间上DPC、SNN-DPC和DPC-NN算法分别降低38%、44%和44%。在保证基本聚类准确率的基础上,KG-DPC算法在聚类效率上有特定优势。 展开更多
关键词 密度峰值 密度阈值 网格 近邻优化
下载PDF
基于密度峰值聚类的Tri-training算法
9
作者 罗宇航 吴润秀 +3 位作者 崔志华 张翼英 何业慎 赵嘉 《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1189-1198,共10页
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类... Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。 展开更多
关键词 TRI-TRAINING 半监督学习 密度峰值 空间结构
下载PDF
基于共享最近邻的自适应密度峰值聚类算法
10
作者 王心耕 杜韬 +2 位作者 周劲 陈迪 仵匀政 《计算机科学》 CSCD 北大核心 2024年第8期97-105,共9页
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分... 密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法。首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生。在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能。 展开更多
关键词 共享最近邻 密度峰值 分配策略 中心 密度衰减
下载PDF
基于密度峰值的进化数据流聚类算法
11
作者 翁佳桥 吕莉 +1 位作者 樊棠怀 康平 《计算机仿真》 2024年第6期448-454,共7页
针对现有数据流聚类算法聚类精度低、不能检测数据流簇进化等问题,提出一种基于密度峰值的进化数据流聚类(DPStream)算法。DPStream采用在线微聚类与离线宏聚类两阶段处理框架,引入密度衰减反映数据流近期演化信息;在线微聚类阶段借助... 针对现有数据流聚类算法聚类精度低、不能检测数据流簇进化等问题,提出一种基于密度峰值的进化数据流聚类(DPStream)算法。DPStream采用在线微聚类与离线宏聚类两阶段处理框架,引入密度衰减反映数据流近期演化信息;在线微聚类阶段借助核心微簇与潜在微簇反映簇的生成、进化和衰退,通过生成和维护机制对微簇进行增量维护;当用户聚类请求到来时,使用密度峰值聚类算法进行离线宏聚类,找出核心微簇的簇中心,将剩余核心微簇分配给相应的簇中心所在簇,得到最终的聚类结果。DPStream算法能在数据流的任意时间给出聚类结果,聚类数据流的聚类纯度在小窗口时保持在95%以上,能高质量、高响应的完成数据流聚类。 展开更多
关键词 密度峰值 数据流 两阶段框架 微簇 簇进化 密度衰减
下载PDF
基于类簇合并的无参数密度峰值聚类算法
12
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值算法 初始 簇合并 相似度 性能
下载PDF
时序加权密度峰值聚类算法及用电负荷特性分类模型
13
作者 邹竞成 李鹏 +1 位作者 苏适 沈鑫 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期237-245,共9页
针对现有的密度峰值快速搜索算法没有考虑数据的时序性、无法处理动态时间序列数据的问题,在密度峰值快速搜索算法基础之上,增加时序加权因子对数据点间的拓扑关系进行改进,提出了时序加权密度峰值聚类算法,使密度峰值快速搜索算法具有... 针对现有的密度峰值快速搜索算法没有考虑数据的时序性、无法处理动态时间序列数据的问题,在密度峰值快速搜索算法基础之上,增加时序加权因子对数据点间的拓扑关系进行改进,提出了时序加权密度峰值聚类算法,使密度峰值快速搜索算法具有处理动态时序数据的能力.使用基于时序加权密度峰值聚类算法的用户负荷分类模型对OpenEI公布的用户电力负荷数据集进行处理,其聚类效果对比基于密度峰值聚类算法的用户负荷分类模型结果更准确,且统计学评价指标均有所提升. 展开更多
关键词 密度峰值 时间序列 智能电网 数据驱动
下载PDF
基于人工鱼群的自适应密度峰值聚类算法
14
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
下载PDF
融合优化可调Q因子小波变换的改进密度峰值聚类算法
15
作者 史曼曼 宋朝炀 张景祥 《计算机应用研究》 CSCD 北大核心 2024年第2期466-472,共7页
为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化... 为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。 展开更多
关键词 密度峰值算法 可调Q因子小波变换 粒子群优化算法 主成分分析
下载PDF
基于共享邻近度和概率分配的密度峰值聚类算法
16
作者 朱鸿祥 吴根秀 王兆辉 《计算机工程与应用》 CSCD 北大核心 2024年第12期74-90,共17页
针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享... 针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享邻近度重新定义了样本点的局部密度,从而找到正确的类簇中心;利用样本点的K近邻信息,提出传递概率分配策略和证据概率分配策略共同优化剩余样本点的分配,从而避免分配连带错误;在17个合成数据集和12个UCI数据集上进行实验,将SP-DPC算法与DPC算法、SKM-DPC算法、DPC-NN算法、DBSCAN算法、K-means算法进行对比,实验结果表明SP-DPC算法在AMI、ARI、FMI这3个评价指标上整体取得了相对最优值,聚类效果优于其他对比算法。 展开更多
关键词 密度峰值 K近邻 共享邻近度 概率分配 证据理论
下载PDF
基于改进密度峰值算法的轨迹聚类
17
作者 钟超 刘漫丹 贺帆 《计算机工程与设计》 北大核心 2024年第1期130-138,共9页
为解决用户群体移动轨迹划分和密度峰值聚类算法自身局限性的问题,以校园轨迹为对象,考虑时间和位置语义信息层面的信息,建立网络用户间的相似性度量模型,提出一种基于共享近邻贡献度的密度峰值聚类算法(density peak clustering based ... 为解决用户群体移动轨迹划分和密度峰值聚类算法自身局限性的问题,以校园轨迹为对象,考虑时间和位置语义信息层面的信息,建立网络用户间的相似性度量模型,提出一种基于共享近邻贡献度的密度峰值聚类算法(density peak clustering based on shared nearest neighbor contribution,SNNC-DPC),结合信息熵理论,通过最小化局部密度熵自适应选择截断距离;在局部密度计算上,利用共享近邻贡献度重新计算局部密度,更加全面地反映数据分布的特性;采用非线性变换方法选取决策值,解决聚类中心选取困难且方法单一的问题。在真实校园轨迹数据集上实验,验证了改进算法的有效性。 展开更多
关键词 无线网络 密度峰值 语义信息 相似性度量 信息熵 中心 共享近邻贡献度
下载PDF
自适应引力密度峰值聚类优化算法
18
作者 罗岚 詹凤 +2 位作者 周传华 任太娇 周昊 《微电子学与计算机》 2024年第3期21-28,共8页
针对密度峰值聚类(Density Peak Clustering,DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Cluster... 针对密度峰值聚类(Density Peak Clustering,DPC)算法对截断距离的取值较为敏感,密度度量标准不统一且人为选取聚类中心存在主观性的问题,提出了一种自适应引力密度峰值聚类优化(Optimized Adaptive Gravitational Density Peak Clustering Algorithm,OAGDPC)算法。首先采用模糊加权K-近邻技术(Fuzzy Weighted KNearest Neighbors Density Peak Clustering,FKNN-DPC)重新定义了局部密度,统一了密度度量的标准;然后提出一种自适应选择聚类中心的策略,结合基于引力的密度峰值(Gravitational Density Peak Clustering,GDPC)算法中牛顿万有引力定律与DPC算法的参数映射,使用引力类比距离,并设置综合考虑局部密度和引力的决策参数,依据决策参数降序折线图的顶角变化自适应确定聚类中心;最后聚集非中心点并识别异常点。实验选取DPC、GDPC、FKNN-DPC和OAGDPC在人工和UCI数据集上进行测试,结果表明,OAGDPC算法在各数据集上都有良好的表现,特别在聚类结果准确性、自适应能力、鲁棒性方面相对于对比算法具有明显优势。 展开更多
关键词 密度峰值 中心自适应 K最近邻 模糊邻域
下载PDF
改进密度峰值聚类的多源数据异常值检测算法
19
作者 侯立 王健 《计算机仿真》 2024年第6期565-569,共5页
多源数据集中的数据类杂、数据量大,其中异常数据识别困难。针对多源数据异常值检测准确率低、稳定性差的问题,提出一种基于改进峰值密度聚类算法(NDPC算法)的多源数据处理方法,并在该算法的基础上构建出NDPC-SVM多源数据异常检测模型... 多源数据集中的数据类杂、数据量大,其中异常数据识别困难。针对多源数据异常值检测准确率低、稳定性差的问题,提出一种基于改进峰值密度聚类算法(NDPC算法)的多源数据处理方法,并在该算法的基础上构建出NDPC-SVM多源数据异常检测模型。模型首先使用数据预处理的方式对多源姿态图像数据进行数字化转换,以提高数据的可操作性;然后采用差分隐私保护算法对数据进行加密保护,并构建出隐私数据查询机制,提高数据的隐私性;接着利用NDPC算法对数据进行聚类处理,提高模型构建的鲁班性;最后利用交叉验证的方式优化构建出NDPC-SVM多源数据异常检测模型。消融仿真结果表明,四类优化算法的叠加显著的提高了异常数据检测的准确率与稳定性。对比仿真结果表明,与基线聚类算法模型相比,NDPC-SVM模型的准确率高达93.14%,召回率平均提升了2.48,综合性能上升了3.35%。因此,基于NDPC算法构建的NDPC-SVM多源数据异常检测模型在解决多源数据处理难度大的同时,提升了异常值检测的准确性与稳定性。 展开更多
关键词 密度峰值 多源数据 异常检测
下载PDF
基于网格的半监督密度峰值聚类算法
20
作者 杨金瑞 刘继 《软件工程》 2024年第5期1-6,共6页
为了有效利用已知信息快速地进行数据聚类,提出了一种基于网格的半监督密度峰值聚类(GS-DPC)算法。利用统计信息网格对数据集进行划分,将落在网格内数据点的个数作为局部密度值,计算出每一个网格代表点;根据局部密度值和相对距离值确定... 为了有效利用已知信息快速地进行数据聚类,提出了一种基于网格的半监督密度峰值聚类(GS-DPC)算法。利用统计信息网格对数据集进行划分,将落在网格内数据点的个数作为局部密度值,计算出每一个网格代表点;根据局部密度值和相对距离值确定聚类中心;利用成对约束集指导聚类过程后得到聚类结果。实验结果表明,GS-DPC算法进行数据聚类算法的平均消耗时间比密度峰值聚类算法(DPC)降低32百分点;GS-DPC算法在6个数据集上的平均精确度(ACC)约为0.84,平均调整互信息(AMI)约为0.68,平均调整兰德系数(ARI)约为0.67,因此GS-DPC算法可以快速且有效地进行数据聚类并获得较好的聚类结果。 展开更多
关键词 密度峰值 网格 半监督 STING 成对约束
下载PDF
上一页 1 2 48 下一页 到第
使用帮助 返回顶部