期刊文献+
共找到1,136篇文章
< 1 2 57 >
每页显示 20 50 100
基于局部密度聚类的WSN多Sink节点部署研究
1
作者 李翠然 吕安琪 +1 位作者 谢健骊 孙振刚 《传感技术学报》 CAS CSCD 北大核心 2024年第2期326-331,共6页
针对无线传感器网络中传感器节点能量受限,网络生命周期短的问题,在考虑网络成本的情况下,提出一种基于节点局部密度聚类的多Sink节点优化部署算法。首先,基于多属性因子构建聚类决策函数确定Sink节点部署位置,完成传感器节点聚类;然后... 针对无线传感器网络中传感器节点能量受限,网络生命周期短的问题,在考虑网络成本的情况下,提出一种基于节点局部密度聚类的多Sink节点优化部署算法。首先,基于多属性因子构建聚类决策函数确定Sink节点部署位置,完成传感器节点聚类;然后,根据下一跳节点与Sink节点间距离最短准则搜索并形成数据传输路径;最后,以网络生命周期成本比最大化为依据确定最优的Sink节点数目,实现多Sink节点优化部署。仿真结果表明:与已有算法相比,所提算法能够有效延长网络生命周期,具有较高的网络生命周期能效比。 展开更多
关键词 无线传感器网络 Sink节点部署 局部密度 网络生命周期
下载PDF
高光谱影像逆近邻密度峰值聚类的波段选择算法
2
作者 孙根云 李忍忍 +3 位作者 张爱竹 安娜 付航 潘兆杰 《测绘学报》 EI CSCD 北大核心 2024年第1期8-19,共12页
密度峰值聚类波段选择算法利用局部密度描述波段的密度信息,然而现有的局部密度容易忽略波段分布的全局信息,不能有效描述波段的分布特征,导致波段子集分类精度有限。为解决上述问题,本文提出一种基于逆近邻的密度峰值聚类波段选择算法... 密度峰值聚类波段选择算法利用局部密度描述波段的密度信息,然而现有的局部密度容易忽略波段分布的全局信息,不能有效描述波段的分布特征,导致波段子集分类精度有限。为解决上述问题,本文提出一种基于逆近邻的密度峰值聚类波段选择算法。首先,利用波段与其K近邻构建K近邻有向图,获取波段的逆近邻,以及波段之间的共享近邻和共享逆近邻;然后,利用共享近邻和共享逆近邻并集的个数作为波段之间的相似度,利用波段与其逆近邻的平均欧氏距离和相似度构造增强型局部密度;最后,将增强型局部密度、距离因子、信息熵三者的乘积作为权重值,根据权重值挑选波段子集。为提高试验效率和实用性,本文算法还提出一种自动获得K值的自适应K值方法。在3个高光谱标准数据集上的试验结果表明,本文算法得到的波段子集比其他先进算法挑选的波段有更好的分类性能,尤其是在波段数较少的情况下,而且计算效率较高。 展开更多
关键词 高光谱影像 波段选择 密度峰值聚 逆近邻 局部密度 自适应K值
下载PDF
面向密度分布不均数据的加权逆近邻密度峰值聚类算法
3
作者 吕莉 陈威 +2 位作者 肖人彬 韩龙哲 谭德坤 《智能系统学报》 CSCD 北大核心 2024年第1期165-175,共11页
针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首... 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。 展开更多
关键词 密度峰值聚 密度分布不均 逆近邻 共享逆近邻 样本相似度 局部密度 分配策略 数据挖掘
下载PDF
改进的密度聚类精确自适应提取LiDAR电力线点云方法
4
作者 纪凯 武永彩 《安徽职业技术学院学报》 2024年第1期26-30,85,共6页
原有邻域半径r_(Eps)与密度阈值p_(MinPts)两个参数的初始赋值导致电力线点云的提取结果存在不确定性,在密度聚类的基础上增添了点云簇类自适应判别方法,该方法避免人员重复测试初始参数的繁琐过程,采用C++语言完成了对该算法电力线精... 原有邻域半径r_(Eps)与密度阈值p_(MinPts)两个参数的初始赋值导致电力线点云的提取结果存在不确定性,在密度聚类的基础上增添了点云簇类自适应判别方法,该方法避免人员重复测试初始参数的繁琐过程,采用C++语言完成了对该算法电力线精确提取及电力线拟合程序的开发与测试。结果表明:改进后的密度聚类法在电力线点云提取的损失率仅0.02%,三维重建残差为0.213 m;该方法大幅提高了电力线点云提取的准确性与便捷性,适用于高压电力走廊的电力巡检与三维重建等工作。 展开更多
关键词 机载LIDAR 点云数据 密度 自适应 三维重建
下载PDF
基于网格近邻优化的密度峰值聚类算法
5
作者 刘继 杨金瑞 《计算机应用研究》 CSCD 北大核心 2024年第4期1058-1063,共6页
密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG... 密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG-DPC算法)。首先对数据空间进行网格化,减少了样本数据点之间距离的计算量;在计算局部密度时不仅考虑了网格自身的密度值,而且考虑了周围k个近邻的网格密度值,降低了主观选择截断距离对聚类结果的影响,提高了聚类准确率,设定网格密度阈值,保证了聚类结果的稳定性。通过实验结果表明,KG-DPC算法比DBSCAN、DPC和SDPC算法在聚类准确率上有很大提升,在聚类平均消耗时间上DPC、SNN-DPC和DPC-NN算法分别降低38%、44%和44%。在保证基本聚类准确率的基础上,KG-DPC算法在聚类效率上有特定优势。 展开更多
关键词 密度峰值聚 密度阈值 网格 近邻优化
下载PDF
局部标准差优化的密度峰值聚类算法
6
作者 谢娟英 张文杰 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期47-62,共16页
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密... 密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。 展开更多
关键词 密度峰值聚 标准差 局部密度 分配策略
下载PDF
密度峰值聚类在塔机损伤诊断中的应用研究
7
作者 王胜春 安宏 +1 位作者 安增辉 李文豪 《机械设计与制造》 北大核心 2024年第2期98-104,共7页
建立塔机有限元模型,获取塔机完好状态和各损伤工况的各采集点的动态位移。提出了两种模型建立方法,基于悬臂梁的双输入单输出模型和基于时域数据的动态双输入单输出模型,对基于时域数据的双输入单输出模型首先利用最小二乘法计算参数初... 建立塔机有限元模型,获取塔机完好状态和各损伤工况的各采集点的动态位移。提出了两种模型建立方法,基于悬臂梁的双输入单输出模型和基于时域数据的动态双输入单输出模型,对基于时域数据的双输入单输出模型首先利用最小二乘法计算参数初值,进一步利用粒子群优化方法进行参数优化,提高了模型精度。以完好工况的塔机数据为基础,建立基于悬臂梁的双输入单输出模型和基于时域数据的双输入单输出模型,计算参数,建立损伤识别模型,用待检状态的位移数值拟合模型,用两种模型计算出的残差方差做损伤因子,利用密度峰值聚类方法对损伤因子进行分析,实现了对塔机的损伤判定和损伤位置的确定。这种基于密度峰值聚类的诊断方法可对塔机微小损伤进行智能诊断和位置确定,该方法只需要塔机完好状态的数据和待检状态的数据即可自动诊断,解决了塔机损伤识别中损伤数据难以获取,因而无法实现智能训练和诊断的问题。 展开更多
关键词 塔机 双输入单输出模型 粒子群优化 密度峰值聚 损伤因子
下载PDF
时序加权密度峰值聚类算法及用电负荷特性分类模型 被引量:1
8
作者 邹竞成 李鹏 +1 位作者 苏适 沈鑫 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期237-245,共9页
针对现有的密度峰值快速搜索算法没有考虑数据的时序性、无法处理动态时间序列数据的问题,在密度峰值快速搜索算法基础之上,增加时序加权因子对数据点间的拓扑关系进行改进,提出了时序加权密度峰值聚类算法,使密度峰值快速搜索算法具有... 针对现有的密度峰值快速搜索算法没有考虑数据的时序性、无法处理动态时间序列数据的问题,在密度峰值快速搜索算法基础之上,增加时序加权因子对数据点间的拓扑关系进行改进,提出了时序加权密度峰值聚类算法,使密度峰值快速搜索算法具有处理动态时序数据的能力.使用基于时序加权密度峰值聚类算法的用户负荷分类模型对OpenEI公布的用户电力负荷数据集进行处理,其聚类效果对比基于密度峰值聚类算法的用户负荷分类模型结果更准确,且统计学评价指标均有所提升. 展开更多
关键词 密度峰值聚 时间序列 智能电网 数据驱动
下载PDF
基于局部密度聚类的雷达目标散射中心区域分割
9
作者 胡承鑫 曾曙光 +5 位作者 管灵 董纯柱 曾祥云 郑胜 黄瑶 罗骁域 《科学技术与工程》 北大核心 2024年第1期260-266,共7页
散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中... 散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中心的小区域,对每个小区域分别进行特征提取和参数计算。根据雷达目标散射中心的特点,提出了一种基于局部密度聚类的雷达目标散射中心区域分割技术。首先,对雷达图像进行Frost滤波、基于水平集方法(level set method,LSM)的图像分割和面积滤波的一系列图像预处理获得目标感兴趣(region of interest,ROI)区域,然后对预处理后的图像利用局部密度聚类算法检测散射中心并进行区域分割。实验中,采用模拟数据和真实数据对所提方法和传统图像分割算法展开数值实验,实验结果验证了所提方法在雷达目标散射中心区域分割的有效性和优越性。 展开更多
关键词 雷达目标 散射中心 局部密度 区域分割
下载PDF
基于密度峰值聚类的Tri-training算法
10
作者 罗宇航 吴润秀 +3 位作者 崔志华 张翼英 何业慎 赵嘉 《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1189-1198,共10页
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类... Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。 展开更多
关键词 TRI-TRAINING 半监督学习 密度峰值聚 空间结构
下载PDF
基于密度峰值聚类的宽角域散射中心聚类
11
作者 贺俊杰 郑胜 +3 位作者 曾曙光 曾祥云 胡承鑫 金汉乐 《科学技术与工程》 北大核心 2024年第13期5415-5420,共6页
宽角域合成孔径雷达(wide-angle synthetic aperture radar,WA-SAR)有着更广泛的角度覆盖范围,基于此得到的宽角域散射中心(wide-angle scattering centers,WA-SCs)包含了目标物体更加丰富的电磁散射特征,这对雷达的目标建模、目标识别... 宽角域合成孔径雷达(wide-angle synthetic aperture radar,WA-SAR)有着更广泛的角度覆盖范围,基于此得到的宽角域散射中心(wide-angle scattering centers,WA-SCs)包含了目标物体更加丰富的电磁散射特征,这对雷达的目标建模、目标识别等有着重要的意义。为了克服WA-SCs数据维度高、所含信息复杂的特点,并从中提取出所需的目标物体特征,采取密度峰值聚类(density peak clustering,DPC)算法研究WA-SCs。基于SLICY模型数据,从聚类内部评价指标、聚类可视化和算法自动化程度3个方面,将本文算法与经典的K-means、DBSCAN和MeanShift算法进行了对比实验。结果表明,DPC算法具有自动化程度高、高维数据适应性强、聚类精度高等优点,有望为后续的一系列基于WA-SCs的目标建模、目标识别等工作提供技术支撑。 展开更多
关键词 宽角域合成孔径雷达 目标识别 散射中心 密度峰值聚
下载PDF
基于密度聚类的复杂装备健康监测方法
12
作者 余彦 蔡霖 +1 位作者 张冲 冀弘帅 《指挥控制与仿真》 2024年第2期69-77,共9页
针对复杂装备历史数据往往存在非球形的特征,提出了一种基于密度聚类的复杂装备健康监测模型。从历史数据中估计各个样本的局部密度和类间距离,并综合考虑两者的统计特性以确定数据的聚类中心,对于新采集的复杂装备健康状态监测数据,如... 针对复杂装备历史数据往往存在非球形的特征,提出了一种基于密度聚类的复杂装备健康监测模型。从历史数据中估计各个样本的局部密度和类间距离,并综合考虑两者的统计特性以确定数据的聚类中心,对于新采集的复杂装备健康状态监测数据,如果它与聚类中心密度可达,就认为该复杂装备处于健康状态,否则就处于非健康状态。通过数值仿真技术分析了一个实际的复杂装备数据集,以及利用散点图、盒图和平行坐标系等可视化技术来验证计算结果的可靠性,仿真结果表明提出的方法能够有效监测复杂装备的健康状态。 展开更多
关键词 密度 健康监测 局部密度 间距离 平行坐标系 密度可达
下载PDF
基于共享最近邻的自适应密度峰值聚类算法
13
作者 王心耕 杜韬 +2 位作者 周劲 陈迪 仵匀政 《计算机科学》 CSCD 北大核心 2024年第8期97-105,共9页
密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分... 密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,该算法虽能自动发现簇中心,实现任意形状数据的高效聚类,但依然存在一些缺陷。针对密度峰值聚类算法在定义相关度量值时未考虑数据的位置信息、聚类中心数目需要人工预先设定且分配样本点时易出现连锁反应这3个缺陷,提出一种基于共享最近邻的自适应密度峰值聚类算法。首先,利用共享最近邻重新定义局部密度等度量值,充分考虑了数据分布的局部特点,使样本点的空间分布特征得以更好地体现;其次,通过引入密度衰减现象让样本点自动聚集成微簇,实现了簇个数自适应确定和簇中心自适应选取;最后,提出一种两阶段的分配方法,先将微簇合并形成簇的主干部分,再用上一步分配好的簇主干指导剩余点的分配,避免了链式反应的发生。在二维合成数据集以及UCI数据集上的实现表明,相较于经典的密度峰值聚类算法及近年来对其提出的改进算法,在大多数情况下,所提算法表现出更优异的性能。 展开更多
关键词 共享最近邻 密度峰值聚 分配策略 中心 密度衰减
下载PDF
基于自适应密度聚类的多准则主动学习方法
14
作者 贺忠海 朱温涵 +1 位作者 陈旭旺 张晓芳 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第3期179-187,共9页
主动学习能够以更少的标注成本训练出更好的机器学习模型。现有的RD算法与QBC算法的结合有效地解决了只考虑单一标准的问题。然而,RD所基于的K-means聚类会将离群点也包括在内进而造成模型性能降低,而QBC则需要维护于多个模型而间接返... 主动学习能够以更少的标注成本训练出更好的机器学习模型。现有的RD算法与QBC算法的结合有效地解决了只考虑单一标准的问题。然而,RD所基于的K-means聚类会将离群点也包括在内进而造成模型性能降低,而QBC则需要维护于多个模型而间接返回样本的信息性.针对上述问题,本文提出了一种基于自适应密度聚类的高斯过程回归(ADC-GPR)算法,通过先聚类后直接利用不确定性进而高效选择样本。该算法中的ADC聚类不仅对离群点鲁棒,还能根据数据集分布特性自适应聚类,并为后续的AL提供了代表性样本点和其对应的簇,该方法在无监督选择时保证了代表性和多样性,在有监督选择时考虑了信息性、代表性和多样性。实验结果表明,在相同的抽样次数下将ADC-GPR算法与RS、KS以及RD-GPR算法相比,其平均性能分别提升了37.3%、8%和2.8%,ADC-GPR算法的选择效率更高。 展开更多
关键词 主动学习 自适应密度 高斯过程回归 离群点鲁棒 多标准融合
下载PDF
基于密度峰值的进化数据流聚类算法
15
作者 翁佳桥 吕莉 +1 位作者 樊棠怀 康平 《计算机仿真》 2024年第6期448-454,共7页
针对现有数据流聚类算法聚类精度低、不能检测数据流簇进化等问题,提出一种基于密度峰值的进化数据流聚类(DPStream)算法。DPStream采用在线微聚类与离线宏聚类两阶段处理框架,引入密度衰减反映数据流近期演化信息;在线微聚类阶段借助... 针对现有数据流聚类算法聚类精度低、不能检测数据流簇进化等问题,提出一种基于密度峰值的进化数据流聚类(DPStream)算法。DPStream采用在线微聚类与离线宏聚类两阶段处理框架,引入密度衰减反映数据流近期演化信息;在线微聚类阶段借助核心微簇与潜在微簇反映簇的生成、进化和衰退,通过生成和维护机制对微簇进行增量维护;当用户聚类请求到来时,使用密度峰值聚类算法进行离线宏聚类,找出核心微簇的簇中心,将剩余核心微簇分配给相应的簇中心所在簇,得到最终的聚类结果。DPStream算法能在数据流的任意时间给出聚类结果,聚类数据流的聚类纯度在小窗口时保持在95%以上,能高质量、高响应的完成数据流聚类。 展开更多
关键词 密度峰值聚 数据流 两阶段框架 微簇 簇进化 密度衰减
下载PDF
基于密度聚类算法和广度优先搜索算法的道岔摩擦电流智能分析系统
16
作者 邱晓莉 韩思远 +1 位作者 熊庆 余东 《城市轨道交通研究》 北大核心 2024年第4期114-118,共5页
[目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出... [目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出建立道岔摩擦电流的智能分析系统。阐述了该系统的功能及工作原理,设定了该系统的摩擦电流标准值及阈值范围。该系统可基于密度聚类算法和广度优先搜索算法自动获取道岔摩擦电流值。介绍了该系统的调试界面截图,以说明系统在获取道岔摩擦电流值如何为现场检修人员提供操作建议。[结果及结论]该智能系统具有良好的可用性,实现了节约检修时间、降低维护成本和提高检修效率的既定目的。 展开更多
关键词 城市轨道交通 信号 智能运维 道岔转辙机 摩擦电流 密度算法 广度优先搜索算法
下载PDF
基于共享邻近度和概率分配的密度峰值聚类算法
17
作者 朱鸿祥 吴根秀 王兆辉 《计算机工程与应用》 CSCD 北大核心 2024年第12期74-90,共17页
针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享... 针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享邻近度重新定义了样本点的局部密度,从而找到正确的类簇中心;利用样本点的K近邻信息,提出传递概率分配策略和证据概率分配策略共同优化剩余样本点的分配,从而避免分配连带错误;在17个合成数据集和12个UCI数据集上进行实验,将SP-DPC算法与DPC算法、SKM-DPC算法、DPC-NN算法、DBSCAN算法、K-means算法进行对比,实验结果表明SP-DPC算法在AMI、ARI、FMI这3个评价指标上整体取得了相对最优值,聚类效果优于其他对比算法。 展开更多
关键词 密度峰值聚 K近邻 共享邻近度 概率分配 证据理论
下载PDF
面向Shapelet空间的多变量时间序列密度聚类算法 被引量:1
18
作者 盛锦超 杜明晶 +1 位作者 孙嘉睿 李宇蕊 《计算机科学与探索》 CSCD 北大核心 2024年第2期387-402,共16页
多变量时间序列聚类问题已经成为时间序列分析任务中重要的研究课题,相较于单变量时间序列,多变量时间序列的研究复杂性更高,难度更大。尽管当前已经提出了许多针对多变量时间序列的聚类算法,但是这些算法在精度和解释性方面仍旧不足。... 多变量时间序列聚类问题已经成为时间序列分析任务中重要的研究课题,相较于单变量时间序列,多变量时间序列的研究复杂性更高,难度更大。尽管当前已经提出了许多针对多变量时间序列的聚类算法,但是这些算法在精度和解释性方面仍旧不足。其一,当前大部分工作并未考虑多变量时间序列的长度冗余性和变量相关性等问题,导致最终得到的相似性矩阵具有较大误差;其二,数据在聚类过程中普遍采用划分范式,当数值空间呈现复杂分布时该思想表现不佳,并且不具备对各个变量及空间的解释力。针对上述问题,提出了一种面向Shapelet(富有高信息量的连续子序列)空间的多变量时间序列自适应权重密度聚类算法(MDCS)。算法首先对各个变量进行Shapelet搜索,通过自适应策略获取到各自的Shapelet空间,接着对各个变量产生的数值分布进行组合加权,得到了更符合数据分布特征的相似度矩阵,最后利用改进密度计算和二次分配的共享最近邻密度峰值聚类算法对数据进行最终分配。在真实数据集上的实验结果证明,与目前先进的聚类算法相比,MDCS拥有更好的聚类结果,在标准化互信息和兰德系数指标上平均提高了0.344与0.09,兼顾了性能与可解释性。 展开更多
关键词 多变量时间序列 子序列 Shapelet空间 密度峰值聚 数据挖掘
下载PDF
改进密度峰值聚类的多源数据异常值检测算法
19
作者 侯立 王健 《计算机仿真》 2024年第6期565-569,共5页
多源数据集中的数据类杂、数据量大,其中异常数据识别困难。针对多源数据异常值检测准确率低、稳定性差的问题,提出一种基于改进峰值密度聚类算法(NDPC算法)的多源数据处理方法,并在该算法的基础上构建出NDPC-SVM多源数据异常检测模型... 多源数据集中的数据类杂、数据量大,其中异常数据识别困难。针对多源数据异常值检测准确率低、稳定性差的问题,提出一种基于改进峰值密度聚类算法(NDPC算法)的多源数据处理方法,并在该算法的基础上构建出NDPC-SVM多源数据异常检测模型。模型首先使用数据预处理的方式对多源姿态图像数据进行数字化转换,以提高数据的可操作性;然后采用差分隐私保护算法对数据进行加密保护,并构建出隐私数据查询机制,提高数据的隐私性;接着利用NDPC算法对数据进行聚类处理,提高模型构建的鲁班性;最后利用交叉验证的方式优化构建出NDPC-SVM多源数据异常检测模型。消融仿真结果表明,四类优化算法的叠加显著的提高了异常数据检测的准确率与稳定性。对比仿真结果表明,与基线聚类算法模型相比,NDPC-SVM模型的准确率高达93.14%,召回率平均提升了2.48,综合性能上升了3.35%。因此,基于NDPC算法构建的NDPC-SVM多源数据异常检测模型在解决多源数据处理难度大的同时,提升了异常值检测的准确性与稳定性。 展开更多
关键词 密度峰值聚 多源数据 异常检测
下载PDF
基于类簇合并的无参数密度峰值聚类算法
20
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值聚算法 初始 簇合并 相似度 性能
下载PDF
上一页 1 2 57 下一页 到第
使用帮助 返回顶部