期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
基于轮廓系数的聚类有效性分析 被引量:120
1
作者 朱连江 马炳先 赵学泉 《计算机应用》 CSCD 北大核心 2010年第12期139-141,198,共4页
针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果... 针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果的判断,在标准数据集上的实验结果有效地验证了这点。并进一步将此有效性分析方法应用于文本聚类。 展开更多
关键词 聚类 K均值算法 轮廓系数 有效性分析 无监督
下载PDF
基于轮廓系数的参数无关空中交通轨迹聚类方法 被引量:12
2
作者 孙石磊 王超 赵元棣 《计算机应用》 CSCD 北大核心 2019年第11期3293-3297,共5页
为消除专家经验的主观性、避免依赖轨迹特征并且减轻实验调参的负担,提出一种基于轮廓系数的参数无关聚类分析(PICBASIC)算法。首先,比较了现有基于欧氏距离的航迹配对方法,并且建立基于动态时间弯曲(DWT)距离和高斯核函数的轨迹相似度... 为消除专家经验的主观性、避免依赖轨迹特征并且减轻实验调参的负担,提出一种基于轮廓系数的参数无关聚类分析(PICBASIC)算法。首先,比较了现有基于欧氏距离的航迹配对方法,并且建立基于动态时间弯曲(DWT)距离和高斯核函数的轨迹相似度计算模型;其次,利用谱聚类对空中交通轨迹进行聚类划分;最后,提出一种基于轮廓系数的最佳簇数寻优方法,并且其具有对聚类结果量化评价功能。利用真实进场轨迹进行实验验证,PICBASIC判断将28L跑道的365条轨迹聚为5个簇,28R跑道的530条轨迹聚为6个簇时聚类质量最佳,平均轮廓系数分别为0.8099和0.8056。相同实验数据条件下,PICBASIC与MeanShift聚类的平均轮廓系数差异率分别为-1.23%和0.19%。实验结果表明:PICBASIC包容轨迹的速度和长度差异,全程无需人工指导或实验调参,而且能够筛除异常轨迹对聚类质量的不利影响。 展开更多
关键词 空中交通轨迹 聚类分析 轮廓系数 谱聚类 动态时间弯曲 高斯核函数 参数无关
下载PDF
基于改进轮廓系数法的航空公司客户分群研究 被引量:15
3
作者 马鑫 段刚龙 +1 位作者 王建仁 薛宏全 《运筹与管理》 CSSCI CSCD 北大核心 2021年第1期140-146,共7页
鉴于航空公司在客户聚类分群中对聚类效果进行评价并确定最佳k值的轮廓系数法存在时间复杂度过高O(n2)以及准确率较低问题,文章首先采用对象与同簇或不同簇中心间距离计算来替换同类或异类对象间的距离计算,并通过聚类效果变化率确定轮... 鉴于航空公司在客户聚类分群中对聚类效果进行评价并确定最佳k值的轮廓系数法存在时间复杂度过高O(n2)以及准确率较低问题,文章首先采用对象与同簇或不同簇中心间距离计算来替换同类或异类对象间的距离计算,并通过聚类效果变化率确定轮廓系数调节位置及调节权重,提出一种改进的轮廓系数法;其次,基于预处理且特征选择后真实航空公司客户数据构建聚类模型,借助改进轮廓系数法确定最优客户分群,并构建用户画像;最后,针对不同航空公司分群客户进行特征描述并提出相应个性化服务措施,辅助航空公司为客户提供个性化产品与服务。实证研究结果表明:不同样本量下改进轮廓系数法的精确率和运行效率均有所提升;基于改进轮廓系数法的航空公司客户分群结果符合客观实际,所提服务措施为航空公司最大化客户需求、提高客户满意度提供借鉴。 展开更多
关键词 改进轮廓系数 最佳k值 客户分群 特征选择 用户画像
下载PDF
基于互信息和轮廓系数的聚类结果评估方法 被引量:17
4
作者 尹世庄 王韬 +3 位作者 谢方方 刘丽君 曲直 张斌 《兵器装备工程学报》 CAS 北大核心 2020年第8期207-213,共7页
在采用改进k-means对未知二进制协议聚类的基础上,引入调整互信息和轮廓系数两种参数,分别对聚类的簇内聚类效果和整体聚类效果进行评估,并以真实的二进制协议数据为例,验证了评估的有效性。实验表明,基于调整互信息的评估方法类簇中样... 在采用改进k-means对未知二进制协议聚类的基础上,引入调整互信息和轮廓系数两种参数,分别对聚类的簇内聚类效果和整体聚类效果进行评估,并以真实的二进制协议数据为例,验证了评估的有效性。实验表明,基于调整互信息的评估方法类簇中样本判定的准确率大于90%,并且与数据报文真实的类别相符;基于轮廓系数的评估方法对不同数据集聚类结果的评估与聚类结果准确率的分布也相一致。该方法运算速度快,并且准确率优于代表点法,更符合二进制协议特征。 展开更多
关键词 二进制协议 聚类 互信息 轮廓系数 评估
下载PDF
基于LRWD轮廓系数的社团检测新方法 被引量:1
5
作者 孟雪 许英 《太原科技大学学报》 2021年第5期423-428,共6页
在近几十年中,复杂网络在数据挖掘和知识发现起着越来越重要的作用。复杂网络中的社团检测引起了许多领域的极大关注。提出了一种基于局部随机游走距离LRWD轮廓系数的网络社团检测新算法(SIL算法)。此外,通过一些具有代表性的真实世界... 在近几十年中,复杂网络在数据挖掘和知识发现起着越来越重要的作用。复杂网络中的社团检测引起了许多领域的极大关注。提出了一种基于局部随机游走距离LRWD轮廓系数的网络社团检测新算法(SIL算法)。此外,通过一些具有代表性的真实世界网络和计算机生成网络(GN准则和LFR准则)来测试该算法的准确性和效率。实验结果表明,SIL算法可以准确有效地检测这些网络的真实社团结构。 展开更多
关键词 复杂网络 社团结构 局部随机游走 轮廓系数
下载PDF
基于优化初始聚类中心和轮廓系数的K-means聚类算法 被引量:45
6
作者 孙林 刘梦含 徐久成 《模糊系统与数学》 北大核心 2022年第1期47-65,共19页
传统K-means聚类算法初始聚类中心以及聚类数目K是随机确定的,聚类结果受其影响较大,这样容易造成聚类结果不稳定且准确率较低。针对上述问题,本文提出一种基于优化初始聚类中心和轮廓系数的K-means聚类算法。首先,为了选出准确的初始... 传统K-means聚类算法初始聚类中心以及聚类数目K是随机确定的,聚类结果受其影响较大,这样容易造成聚类结果不稳定且准确率较低。针对上述问题,本文提出一种基于优化初始聚类中心和轮廓系数的K-means聚类算法。首先,为了选出准确的初始聚类中心,引入平均样本距离和误差平方和,构造初始聚类中心的选取方法,使得选取的初始聚类中心是样本相对集中的点,有效避免选择离群点;然后,为了选择出最佳聚类数目K,基于最近簇中心进行簇的合并,基于中位数构造轮廓系数,设计基于中位数的平均轮廓系数评价指标,判断簇合并之后的最佳K;最后,通过以上两种方法选择合理的初始聚类中心和K,进而设计了基于优化初始聚类中心和轮廓系数的K-means聚类算法。在选取的合成数据集和UCI数据集上进行测试与分析。实验结果表明,本文所提算法能够选取最优的K和唯一的初始中心点,获得了更好的聚类结果,同时也提升了聚类算法的稳定性。 展开更多
关键词 K-MEANS算法 聚类中心 K值 中位数 轮廓系数
原文传递
多标度数据轮廓相似性的度量公理与计算 被引量:9
7
作者 包研科 赵凤华 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2012年第5期797-800,共4页
为了完善轮廓相似性度量的概念和计算,拓展轮廓相似度计算公式的应用,讨论了样本几何轮廓的序结构和表示定理,修正了轮廓相似性的度量公理与计算公式.在样本几何轮廓和"轮廓优"序的定义下,证明了"轮廓优"序的"... 为了完善轮廓相似性度量的概念和计算,拓展轮廓相似度计算公式的应用,讨论了样本几何轮廓的序结构和表示定理,修正了轮廓相似性的度量公理与计算公式.在样本几何轮廓和"轮廓优"序的定义下,证明了"轮廓优"序的"严格弱序"结构,证明了在轮廓相似性分析问题中表示定理成立,奠定了约定"轮廓相似性度量公理"的逻辑基础,进而定义了样本几何轮廓的"相似度"序,证明了"相似度"序的"严格偏序"结构,并修正了轮廓相似度计算公式.使轮廓相似分析的概念与相似度计算公式能适应不同背景下的多标度数据分析的要求. 展开更多
关键词 多标度数据 几何轮廓 序结构 相似性度量公理 址联系数 标联系数 轮廓相似系数 轮廓相似度
下载PDF
跳跃跟踪SSA交叉迭代AP聚类算法 被引量:1
8
作者 黄鹤 李文龙 +3 位作者 杨澜 王会峰 高涛 陈婷 《电子学报》 EI CAS CSCD 北大核心 2024年第3期977-990,共14页
针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入... 针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入者位置更新不足的问题,设计了一种跳跃跟踪优化策略,通过考虑偏好阻尼因子的跳跃策略设计大步长更新发现者,增加麻雀搜索算法的全局勘探能力和寻优速度,加入者设计动态小步长跟踪领头雀更新位置,同时,利用自适应种群划分机制更新发现者和加入者的比重,增加算法的后期局部开发能力和寻优速度;其次,设计基于扰动因子的Tent映射,在此基础上增加3个参数,使映射分布范围增大,并避免了陷入小周期点和不稳周期点;最后,引入轮廓系数作为评价函数,跳跃跟踪麻雀搜索算法自动寻找较优的p和λ,代替手动输入参数,并融合基于扰动因子的Tent映射优化近邻传播算法,交叉迭代确定最优簇数.使用多种算法聚类University of California Irvine数据集的10种公共数据集,仿真结果表明,本文提出的聚类算法与经典近邻传播算法、基于差分改进的仿射传播聚类算法、基于麻雀搜索算法优化的近邻传播聚类算法和进化近邻传播算法相比具有更优的搜索效率以及聚类精度.对国家信息数据进行了聚类分析,提出的方法更加准确有效合理,具有较好的应用价值. 展开更多
关键词 近邻传播聚类 改进Tent映射 改进麻雀搜索算法 轮廓系数 聚类数据集
下载PDF
基于罗茨泵平均理论流量的转子容积利用系数反求法
9
作者 肖荣和 李玉龙 《机械传动》 北大核心 2022年第6期73-77,共5页
为简单高效推导出泵用罗茨转子的容积利用系数,基于容积利用系数与平均理论流量间的因果关系,巧妙地提出了一种容积利用系数的反求方法;分析了有无余隙的两种轮廓构造对容积利用系数的不同影响。结果表明,由“果”(即平均理论流量)到“... 为简单高效推导出泵用罗茨转子的容积利用系数,基于容积利用系数与平均理论流量间的因果关系,巧妙地提出了一种容积利用系数的反求方法;分析了有无余隙的两种轮廓构造对容积利用系数的不同影响。结果表明,由“果”(即平均理论流量)到“因”(即容积利用系数)的反求方法简单高效,结果准确可靠,通用性普适性强;有余隙的轮廓构造利于实现容积利用系数的最大化;共轭轮廓的曲线类型通过控制轮廓系数的上限取值,对形状系数及其容积利用系数的间接影响较大;容积利用系数可简化为形状系数的单变量函数,轮廓系数给定下的共轭轮廓曲线类型对容积利用系数的影响甚微。研究结果为转子泵诸如容积利用系数及轮廓特征的其他计算提供了一种新思路与新方法。 展开更多
关键词 罗茨泵 容积利用系数 平均理论流量 因果关系 反求法 形状系数 轮廓系数
下载PDF
基于改进K-means算法的物流配送中心选址研究 被引量:2
10
作者 姚佼 吴秀荣 +3 位作者 李皓 谢贝贝 王诗璇 梁益铭 《物流科技》 2024年第5期10-13,19,共5页
针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类... 针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类别的影响因素,构建了相应的影响因素指标体系,提出的模型能够识别输入数据的数值型及类别型数据,实现样本的有效聚类。相关的案例分析结果表明,相比传统K-means聚类,文章的改进K-means算法选址结果可使物流总成本降低8.76%,运营成本降低14.85%,固定成本降低8.09%,效果显著。 展开更多
关键词 物流配送中心选址 K-MEANS聚类算法 肘部法 轮廓系数 独热编码
下载PDF
基于自适应LTTB与DTW-DBA-Means的动力电池组不一致性评估方法
11
作者 吴凤和 柴海宁 +4 位作者 章正柱 张宁 王正明 蒋展鹏 郭保苏 《计量学报》 CSCD 北大核心 2024年第6期890-898,共9页
针对电动汽车动力电池组不一致性难以通过外部参数有效评估问题,在对电池组电压数据进行分析时,引入轮廓系数作为不一致性评价指标,并融合自适应降采样(LTTB)与时序聚类(DTW-DBA-Means)算法,提出一种新的动力电池组不一致性评估方法。... 针对电动汽车动力电池组不一致性难以通过外部参数有效评估问题,在对电池组电压数据进行分析时,引入轮廓系数作为不一致性评价指标,并融合自适应降采样(LTTB)与时序聚类(DTW-DBA-Means)算法,提出一种新的动力电池组不一致性评估方法。自适应LTTB能够根据电池组电压序列特点自适应分配压缩区间采样点数目并调整压缩比,可提高DTW-DBA-Means运算效率的同时保证聚类效果。通过运行9个月的实车数据进行实验验证,结果表明,自适应LTTB降采样效果优于动态LTTB与LTTB,且DTW-DBA-Means时序聚类效果优于k-Shape,所提方法在保证评估准确性同时可节省约96.7%的运算时间。 展开更多
关键词 电学计量 动力电池组 不一致性评估 轮廓系数 降采样 时序数据聚类
下载PDF
STK:基于对比学习嵌入的聚类方法
12
作者 刘晋霞 张曦 《计算机科学》 CSCD 北大核心 2024年第S02期621-626,共6页
SimCSE作为一种对比学习方法,在文本嵌入和聚类中表现出了良好的性能。文中旨在优化SimCSE训练模型生成的句子嵌入使其适用于聚类任务,通过多个算法组合和训练参数调整,解决聚类算法选择、噪声及异常值的影响等问题。文中提出一种联合K... SimCSE作为一种对比学习方法,在文本嵌入和聚类中表现出了良好的性能。文中旨在优化SimCSE训练模型生成的句子嵌入使其适用于聚类任务,通过多个算法组合和训练参数调整,解决聚类算法选择、噪声及异常值的影响等问题。文中提出一种联合KL散度和KMeans算法的无监督聚类模型STK(SimCSE t-SNE KMeans),使用SimCSE对文本进行编码;随后采用t-SNE算法对高维嵌入进行降维,通过最小化KL散度保留低维空间中高维数据点之间的相似性关系,降维的同时改善文本嵌入表示;最后使用KMeans算法对降维后的嵌入进行聚类,得到聚类结果。通过将本研究的聚类结果与Bert,UMAP,HDBSCAN等算法得到的结果进行比较,发现文中提出的模型在制氢领域专利和论文数据集上表现出更好的聚类效果,尤其在轮廓系数这一评价指标上。 展开更多
关键词 SimCSE 句嵌入 KL散度 聚类 轮廓系数
下载PDF
贝叶斯优化模糊聚类地级行政区声环境
13
作者 曾宇 姚琨 +1 位作者 任爽 户文成 《应用声学》 CSCD 北大核心 2024年第2期385-392,共8页
声环境功能区划是噪声污染管理的重要手段。当前声环境功能区划研究大多是基于某个特定的地级行政区来进行的,难以反映各地级行政区声环境的异同。该文基于134个地级行政区的人口、面积、各声环境功能区面积和及面积占比,进行地级行政... 声环境功能区划是噪声污染管理的重要手段。当前声环境功能区划研究大多是基于某个特定的地级行政区来进行的,难以反映各地级行政区声环境的异同。该文基于134个地级行政区的人口、面积、各声环境功能区面积和及面积占比,进行地级行政区声环境表征和归一化处理。以轮廓系数作为聚类有效性评价指标,基于贝叶斯优化模糊聚类方法对地级行政区声环境表征进行聚类分析。通过与谱聚类、K-medoids聚类、高斯混合模型聚类的聚类性能对比,验证了该方法的有效性。结果表明,我国地级行政区声环境分为9类,城市规模和用地情况发生显著变化导致其声环境表征和归类发生变化后应重新评估当前噪声污染管理政策,并借鉴同类的地级行政区的噪声污染管理政策做出必要的调整。 展开更多
关键词 声环境功能区 地级行政区 模糊聚类 贝叶斯优化 轮廓系数
下载PDF
基于自适应布谷鸟优化特征选择的K-means聚类 被引量:4
14
作者 孙林 刘梦含 《计算机应用》 CSCD 北大核心 2024年第3期831-841,共11页
K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首... K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首先,为提升CS算法的搜索速度和精度,在莱维飞行阶段,设计了自适应步长因子;为调节CS算法全局搜索和局部搜索之间的平衡、加快CS算法的收敛,动态调整发现概率,进而提出改进的动态CS算法(IDCS),在IDCS的基础上构建了结合动态CS的特征选择算法(DCFS)。其次,为提升传统欧氏距离的计算精确度,设计同时考虑样本和特征对距离计算贡献程度的加权欧氏距离;为了确定最佳聚类数目的选取方法,依据改进的加权欧氏距离构造了加权簇内距离和簇间距离。最后,为克服传统K-means聚类目标函数仅考虑簇内的距离而未考虑簇间距离的缺陷,提出基于中位数的轮廓系数的目标函数,进而设计了DCFSK。实验结果表明,在10个基准测试函数上,IDCS的各项指标取得了较优的结果;相较于K-means、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等算法,在6个合成数据集与6个UCI数据集上,DCFSK的聚类效果最佳。 展开更多
关键词 布谷鸟搜索算法 K-MEANS聚类 欧氏距离 特征选择 轮廓系数
下载PDF
基于人工鱼群的自适应密度峰值聚类算法
15
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 聚类算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
下载PDF
基于时间戳间距的用户在线时长聚类方法
16
作者 叶倩 高明 +2 位作者 田亮亮 韦雨萌 刘翼 《现代电子技术》 北大核心 2024年第16期47-50,共4页
在网络用户行为分析中,以时序维度为基础,研究用户网络行为的变化趋势,提出并挖掘更多有价值的信息,可为管理或商业决策提供有力支持。为此,文中提出一种基于时间戳间距的用户在线时长聚类方法,以用户访问日志文件中时间戳之间的间距作... 在网络用户行为分析中,以时序维度为基础,研究用户网络行为的变化趋势,提出并挖掘更多有价值的信息,可为管理或商业决策提供有力支持。为此,文中提出一种基于时间戳间距的用户在线时长聚类方法,以用户访问日志文件中时间戳之间的间距作为特征,首先将获取的日志数据进行预处理,获得用户的在线时长统计;然后采用K-Means聚类算法对用户进行聚类,并使用轮廓系数对K值进行评价分析,确定聚类K值范围,准确判定用户单次访问在线时长及类型。采用真实校园网用户访问日志数据对所提方法进行评价,实验结果表明,该方法的准确度达到0.9180,精确度达到0.7685,召回率达到0.8093。 展开更多
关键词 用户在线时长 用户聚类 K-MEANS聚类算法 数据预处理 时间戳间距 轮廓系数
下载PDF
基于K-means的水下控制系统集成测试风险分析 被引量:1
17
作者 陈泽峰 李华山 +2 位作者 张宪阵 孙广斌 李海寿 《中国海洋平台》 2024年第1期45-50,共6页
采用危险源辨识分析(HAZID)工具对南海某水下控制系统集成测试进行风险识别,研究水下电力和通信设备的联合测试等过程存在的风险,针对HAZID技术识别的测试风险,定义风险的3个指标,包括风险发生可能性、风险后果严重程度和风险预防控制能... 采用危险源辨识分析(HAZID)工具对南海某水下控制系统集成测试进行风险识别,研究水下电力和通信设备的联合测试等过程存在的风险,针对HAZID技术识别的测试风险,定义风险的3个指标,包括风险发生可能性、风险后果严重程度和风险预防控制能力,将风险进行K-means聚类分析,采用SPSS软件将风险分为重大风险、高风险、中风险、低风险等4个聚类等级,识别4类共21个测试风险。在实际运用中,该方法可为水下控制系统集成测试风险制定有针对性的措施,可高效、科学和系统地指导水下控制系统集成测试工作开展。 展开更多
关键词 水下控制系统 集成测试 风险分析 HAZID K-MEANS 聚类 轮廓系数
下载PDF
船用开关柜局部放电异常检测
18
作者 李浩 陈亚杰 杨帆 《机电设备》 2024年第2期35-41,共7页
针对船用开关柜现场带电检测数据,提出了一种基于多维特征量的主成分(PCA)聚类离群算法,对柜体的局部放电程度进行异常识别。首先采用运行时间的年限系数以及局部放电检测数据的离散度、均值距离度和极差度等指标全面量化开关柜局部放... 针对船用开关柜现场带电检测数据,提出了一种基于多维特征量的主成分(PCA)聚类离群算法,对柜体的局部放电程度进行异常识别。首先采用运行时间的年限系数以及局部放电检测数据的离散度、均值距离度和极差度等指标全面量化开关柜局部放电状态程度,构建PCA-多维样本数据集;通过轮廓系数法选择聚类离群算法最佳的簇参数;考虑聚类后各类别之间的密度差异性,引入相对距离量化局部放电的程度,由此实现局放程度异常识别。对现场带电检测实际数据进行实例分析,验证该方法的可行性,为船用开关柜的局部放电状态异常识别提供一定的理论依据。 展开更多
关键词 开关柜 PCA-多维样本 轮廓系数 相对距离 聚类离群
下载PDF
基于Python的加权K-means聚类算法研究
19
作者 孙晶 《中国新技术新产品》 2024年第19期1-3,共3页
本文针对K均值聚类算法在现实问题中的复杂性提出一种加权的聚类算法。K-means算法是一种经典的聚类算法,针对这种算法中的问题,目前有很多处理方法,例如确定初始聚类数K值、选择初始聚类中心点、数据点的权重影响以及孤立点的处理方式... 本文针对K均值聚类算法在现实问题中的复杂性提出一种加权的聚类算法。K-means算法是一种经典的聚类算法,针对这种算法中的问题,目前有很多处理方法,例如确定初始聚类数K值、选择初始聚类中心点、数据点的权重影响以及孤立点的处理方式等。在实际问题中,坐标数据点的权重不同,本文将权值附加在数据点中,再使用肘部法则计算聚类数K值的最佳选择,分析数据点归属的簇。在数据集中进行比较,试验结果表明,与原算法相比,本文算法更接近实际数据分布,轮廓系数更接近1,聚类效果更好。 展开更多
关键词 加权K-means算法 肘部法则 轮廓系数
下载PDF
基于改进DBSCAN算法的电力设备坐标研究
20
作者 陆嘉铭 朱洪志 +4 位作者 贺静 张一彦 高翔 陆慧玲 李丹戎 《电力大数据》 2024年第1期10-17,共8页
本文旨在解决采用密度聚类算法分析电力设备位置坐标时,因手动设置超参数导致聚类结果不稳定的问题。通过引入粒子群优化算法,自动调整邻域半径和最小邻域点数,并以轮廓系数作为优化目标,实现了PSO-DBSCAN(particle swarm optimization ... 本文旨在解决采用密度聚类算法分析电力设备位置坐标时,因手动设置超参数导致聚类结果不稳定的问题。通过引入粒子群优化算法,自动调整邻域半径和最小邻域点数,并以轮廓系数作为优化目标,实现了PSO-DBSCAN(particle swarm optimization for DBSCAN)算法。该算法能够更好地适应不同电力设备位置坐标的数据特征,提高了聚类分析的准确性和稳定性。实验结果表明,PSO-DBSCAN算法在电力设备位置坐标分析中表现出色,成功克服了传统手动设置超参数的局限性。本研究为电力系统管理提供了一种更智能、自适应的密度聚类分析方法,为电力设备位置坐标分析提供了可靠而高效的解决方案,为电力系统的管理和优化提供了新的思路和工具。 展开更多
关键词 密度聚类 电力系统 轮廓系数 位置坐标 粒子群算法
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部