期刊文献+
共找到4,403篇文章
< 1 2 221 >
每页显示 20 50 100
融合最近邻矩阵与局部密度的自适应K-means聚类算法 被引量:6
1
作者 艾力米努尔·库尔班 谢娟英 姚若侠 《计算机科学与探索》 CSCD 北大核心 2023年第2期355-366,共12页
针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启... 针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启发,通过引入数据对象间的距离差异值构造邻近矩阵,根据邻近矩阵计算局部密度,不需要任何参数设置,采取最近邻矩阵与局部密度融合策略,自适应确定初始聚类中心数目和位置,同时完成非中心点的初分配。人工数据集和UCI数据集的实验测试,以及与传统K-means算法、基于离群点改进的K-means算法、基于密度改进的K-means算法的实验比较表明,提出的自适应K-means算法对人工数据集的孤立点免疫度较高,对UCI数据集具有更准确的聚类结果。 展开更多
关键词 自适应k-means聚类算法 密度峰值原则 最邻近吸收原则 局部密度
下载PDF
融合PCA与自适应K-Means聚类的水电机组故障检测在线方法 被引量:13
2
作者 徐雄 林海军 +1 位作者 刘悠勇 胡边 《电子测量与仪器学报》 CSCD 北大核心 2022年第3期260-267,共8页
灯泡贯流式水电机组在运行过程中,由于受水力因素、机械、工况等因素影响,很容易导致转轮叶片与转轮室发生故障,严重影响水电机组安全运行。在分析灯泡贯流式水电机组转轮叶片与转轮室故障信号特征的基础上,提出了一种基于K均值(K-Means... 灯泡贯流式水电机组在运行过程中,由于受水力因素、机械、工况等因素影响,很容易导致转轮叶片与转轮室发生故障,严重影响水电机组安全运行。在分析灯泡贯流式水电机组转轮叶片与转轮室故障信号特征的基础上,提出了一种基于K均值(K-Means)和莱特准则(Wright′s criterion)的水电机组故障在线检测方法。该方法利用主元分析(PCA)对水电机组振动和噪声信号特征降维后,融合莱特准则改进传统K均值算法,以实现K值的自适应选择,对特征进行在线聚类,能快速准确识别水轮机变负荷状态与金属扫膛故障。将本文方法应用到五凌电力近尾洲水电站灯泡贯流式机组故障检测中,实验结果表明,采用该方法的故障在线检测准确率为100%、变负荷在线检测准确率为96.7%,运行近10个月没有出现故障误报和漏报,表明了该方法的有效性。 展开更多
关键词 水电机组 故障在线检测 变负荷检测 自适应k-means聚类 主元分析
下载PDF
基于数据特征提取与自适应K-means聚类算法的用户用电画像 被引量:1
3
作者 王红斌 王勇 +3 位作者 罗林欢 肖天为 徐硕 罗思敏 《电工技术》 2021年第17期31-33,共3页
随着大数据研究的不断深入与配电自动化建设的逐步完善,电网的态势感知功能正在发挥越来越大的作用,也越来越受到电力公司的重视,其中实现用户用电特征的画像是最重要与基础的一部分。首先对现有用电数据进行特征提取,通过这种方式实现... 随着大数据研究的不断深入与配电自动化建设的逐步完善,电网的态势感知功能正在发挥越来越大的作用,也越来越受到电力公司的重视,其中实现用户用电特征的画像是最重要与基础的一部分。首先对现有用电数据进行特征提取,通过这种方式实现了初步的用电特征提取,同时大大降低了后续算法运行所需的计算资源,随后通过自适应K-means聚类算法对用电特征进行自适应聚类。最后,将得到的结果与常规方法进行准确率比对,验证了该方法的有效性。 展开更多
关键词 用户画像 数据特征提取 自适应k-means聚类算法 大数据技术
下载PDF
基于FM度量的自适应K-Means聚类的工业生产运行基准挖掘
4
作者 李华 贾雪 《长春大学学报》 2022年第4期22-27,共6页
针对工业生产传统运行优化方法计算复杂,以及优化目标往往很难达到稳态的问题,提出基于FM度量的自适应K-Means聚类的工业生产运行基准挖掘方法。首先,以运行负荷等变量作为筛选标准,提出基于方差的稳态判别算法,筛选出历史数据中的稳态... 针对工业生产传统运行优化方法计算复杂,以及优化目标往往很难达到稳态的问题,提出基于FM度量的自适应K-Means聚类的工业生产运行基准挖掘方法。首先,以运行负荷等变量作为筛选标准,提出基于方差的稳态判别算法,筛选出历史数据中的稳态工况,并根据实际运行参数,对稳态工况进行细分;其次,由于K-Means算法需要预先设定K值,提出基于FM度量的自适应算法确定K值进行K-Means聚类,并利用能耗指标确定最优的聚类中心;最后,采用某实际生产企业的历史运行数据进行模型验证。 展开更多
关键词 历史运行数据 稳态判别 k-means 稳定性算法 FM度量
下载PDF
基于自适应布谷鸟优化特征选择的K-means聚类 被引量:1
5
作者 孙林 刘梦含 《计算机应用》 CSCD 北大核心 2024年第3期831-841,共11页
K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首... K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首先,为提升CS算法的搜索速度和精度,在莱维飞行阶段,设计了自适应步长因子;为调节CS算法全局搜索和局部搜索之间的平衡、加快CS算法的收敛,动态调整发现概率,进而提出改进的动态CS算法(IDCS),在IDCS的基础上构建了结合动态CS的特征选择算法(DCFS)。其次,为提升传统欧氏距离的计算精确度,设计同时考虑样本和特征对距离计算贡献程度的加权欧氏距离;为了确定最佳聚类数目的选取方法,依据改进的加权欧氏距离构造了加权簇内距离和簇间距离。最后,为克服传统K-means聚类目标函数仅考虑簇内的距离而未考虑簇间距离的缺陷,提出基于中位数的轮廓系数的目标函数,进而设计了DCFSK。实验结果表明,在10个基准测试函数上,IDCS的各项指标取得了较优的结果;相较于K-means、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等算法,在6个合成数据集与6个UCI数据集上,DCFSK的聚类效果最佳。 展开更多
关键词 布谷鸟搜索算法 k-means 欧氏距离 特征选择 轮廓系数
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
6
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 k-means 特征空间增强 mixup算法
下载PDF
基于改进K-means聚类和遗传算法的混合算法求解异构车辆路径问题
7
作者 吴麟麟 吕一鸣 +1 位作者 何美玲 韩珣 《物流技术》 2024年第7期48-62,共15页
由于目前单一车型配送存在资源浪费和效率低下等问题,选取确定数量的不同车型对各客户点进行配送服务往往可以得到更优的配送路径方案。针对这一点,描述了一种异构车辆路径问题,并建立了具有固定车辆数且考虑固定成本、可变成本以及时... 由于目前单一车型配送存在资源浪费和效率低下等问题,选取确定数量的不同车型对各客户点进行配送服务往往可以得到更优的配送路径方案。针对这一点,描述了一种异构车辆路径问题,并建立了具有固定车辆数且考虑固定成本、可变成本以及时间窗惩罚成本的混合整数规划模型。同时,提出了一种基于改进K-means聚类和遗传算法的混合算法对模型进行求解。实验仿真先求解不考虑时间窗的问题初步证明混合算法的有效性,再在带时间窗的问题中求解不同规模算例的单一及异构车型结果,以证明异构车型配送更优。最后,对该混合算法的求解结果与其他混合算法的求解结果进行对比分析,证明了混合算法的优越性。研究结果表明:该混合算法求解的异构车型结果优于单一车型,并且比其他混合算法求解的异构车型结果更优,异构车辆配送使用的配送车辆数更少,总成本也更低,该混合算法具有更好的效率和性能。 展开更多
关键词 异构车辆路径问题 改进k-means算法 遗传算法 混合算法
下载PDF
管制扇区运行稳度K-means聚类与分析
8
作者 岳仁田 杨果果 《中国安全科学学报》 CAS CSCD 北大核心 2024年第7期98-104,共7页
为更好地分析管制扇区运行存在的稳定亚安全状态和不稳定亚安全状态,使用K-means算法划分超容比(ECR)、滞留度和飞行姿态混合比3个管制扇区运行稳度评价指标聚类,确定管制扇区运行稳度最佳等级划分;聚类分析单一指标,获得各等级对应的... 为更好地分析管制扇区运行存在的稳定亚安全状态和不稳定亚安全状态,使用K-means算法划分超容比(ECR)、滞留度和飞行姿态混合比3个管制扇区运行稳度评价指标聚类,确定管制扇区运行稳度最佳等级划分;聚类分析单一指标,获得各等级对应的指标阈值,结合熵权法计算的指标权重,遵循隶属度最大原则,获取各时间段的管制扇区运行稳度等级,构建管制扇区运行稳度综合评价模型;选取厦门01号扇区的实际飞行数据,从稳度和趋度2个角度更加全面地分析管制扇区运行态势。结果表明:管制扇区运行稳度等级划分为3类时效果最好;稳度受空中交通流和管制状况的影响会随时间而变化,尤其7:30—9:15和20:00—21:00这2个时间段管制扇区运行稳度的变化最为明显,需引起管制员高度重视,提高空域运行安全。 展开更多
关键词 管制扇区 运行稳度 趋度 k-means 综合评价
下载PDF
基于蚁群算法的三支k-means聚类算法
9
作者 朱金 徐天杰 王平心 《江苏科技大学学报(自然科学版)》 CAS 2024年第3期63-69,共7页
在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法... 在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法中随机概率选择策略和信息素的正负反馈机制,动态调整权重的方法,对三支k-means聚类算法进行优化.在UCI数据集上实验证明,该方法对聚类结果的性能指标有所提高. 展开更多
关键词 三支k-means k-means算法 中心 蚁群算法
下载PDF
基于交通拥堵信息的高速公路拥堵路段ACK-Means聚类
10
作者 陈昕 阮永娇 肇毓 《科学技术与工程》 北大核心 2024年第21期9194-9200,共7页
为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇... 为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇类密度、簇类间距以及簇类强度,同时又考虑到数据样本的偶然性,对离群点进行合理分配,ACK-Means算法可实现自适应确定聚类中心C和类别K值。基于实际交通拥堵信息构建数据集,Python编程实现高速公路拥堵路段ACK-Means聚类,巧妙解决了高速公路拥堵路段聚类数目K和聚类中心C设定问题。聚类结果表明,ACK-Means算法实现高速公路拥堵路段无监督聚类,聚类结果完全基于实际的高速公路交通拥堵信息,具有更高的实用性。 展开更多
关键词 交通拥堵 ACk-means算法 自适应中心 自适应K值 交通拥堵信息
下载PDF
启发式k-means聚类算法的改进研究
11
作者 殷丽凤 栗庆杰 《大连交通大学学报》 CAS 2024年第2期115-119,共5页
启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结... 启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。 展开更多
关键词 算法 k-means 启发式算法 仔细播种 局部异常因子 离群点
下载PDF
基于k-means聚类算法的兴义维蚋幼虫龄数的估算
12
作者 赵娜 王毅 +4 位作者 杨曜铭 吴慧 修江帆 寻慧 杨明 《贵州医科大学学报》 CAS 2024年第8期1120-1127,共8页
目的探讨基于k-means聚类算法估算兴义维蚋幼虫的龄数,以明确虫龄与日龄及鳃斑发育阶段的关系。方法采集贵州青岩河流中兴义维蚋虫卵,于实验室的蚋类饲养系统中培育至幼虫,每日收集幼虫至大量化蛹,持续20 d;收集到幼虫1112头,于体视显... 目的探讨基于k-means聚类算法估算兴义维蚋幼虫的龄数,以明确虫龄与日龄及鳃斑发育阶段的关系。方法采集贵州青岩河流中兴义维蚋虫卵,于实验室的蚋类饲养系统中培育至幼虫,每日收集幼虫至大量化蛹,持续20 d;收集到幼虫1112头,于体视显微镜下测量头壳长(HCW)、后颊长(PGL)、上颚基横骨长(MPL)及体长(BL),观察不同虫龄幼虫的破卵器、鳃斑及性腺的形态学特征,并判断其龄期、分析虫龄与日龄和鳃斑发育关系;选取具有明显腮斑发育的兴义维蚋幼虫10头、制作石蜡切片,采用HE染色鉴定精巢和卵巢、辅助确认性别鉴定结果;采用k-means聚类方法划分形态计量学数据、利用Brooks-Dyar定律检测k-means聚类结果,R语言下行聚类与Brooks-Dyar定律检验、t检验等,根据拟合度分析判断兴义维蚋幼虫龄数。结果1112头兴义维蚋幼虫中有破卵器89头,出现鳃斑发育334头,6~7龄幼虫320头,有预蛹特征34头;Brooks-Dyar定律与破卵器、鳃斑形态特征显示7龄幼虫假设符合昆虫幼虫生长规律;组织学观察见幼虫精巢为椭圆形、体积大、外有几丁质层包裹,卵巢为长条形、体积小、后端有色素细胞包裹;鉴定6、7龄幼虫性别结果,仅7龄幼虫雌雄性PGL有差异(P<0.05);幼虫虫龄与日龄、鳃斑发育关系结果显示,约2~3 d对应1个幼虫生长龄期,第17天首见幼虫蛹化,6龄幼虫出现明显的鳃斑。结论兴义维蚋幼虫具7龄,实验室下幼虫发育约需3周,最短17 d;腮斑发育起始于6龄,7龄出现明显形态学特征。 展开更多
关键词 蚋科 组织学 性腺 龄数 形态计量学 k-means
下载PDF
基于改进K-means聚类的轨道交通基础设施分布式光伏发电典型场景生成及出力特性分析
13
作者 陈凯 雷琪 李豆萌 《电气工程学报》 CSCD 北大核心 2024年第2期364-372,共9页
受限于自然条件,光伏出力具有很强的随机性。为准确评估轨道交通基础设施分布式光伏发电的光伏出力特性,提出一种基于改进K-means聚类算法的轨道交通基础设施分布式光伏发电典型场景生成方法,并基于此进行光伏出力特性分析。首先,基于... 受限于自然条件,光伏出力具有很强的随机性。为准确评估轨道交通基础设施分布式光伏发电的光伏出力特性,提出一种基于改进K-means聚类算法的轨道交通基础设施分布式光伏发电典型场景生成方法,并基于此进行光伏出力特性分析。首先,基于分布式光伏发电设施以及气象数据,利用PVsyst软件模拟光伏发电出力数据。然后,针对基本K-means聚类算法聚类参数和初始聚类中心盲目性高的问题,结合聚类有效性指标(Density based index,DBI)和层次聚类对其进行改进并利用改进K-means聚类算法生成光伏典型日出力场景。最后,基于华中地区某地轨道交通基础设施分布式光伏系统对所提方法的有效性和优越性进行验证,并通过定性和定量分析各典型场景的出力特性揭示轨道交通基础设施分布式光伏出力的规律和特点。 展开更多
关键词 分布式光伏出力 改进k-means算法 典型出力场景 出力特性分析
下载PDF
基于K-means聚类和BP神经网络的电梯能耗实时监测方法
14
作者 彭诚 《通化师范学院学报》 2024年第4期50-56,共7页
针对现有方法在对电梯能耗进行监测时,存在监测精度低、用时长、监测结果不理想的问题,该文提出一种基于K-means聚类算法和BP神经网络相结合的电梯能耗实时监测方法 .在经过清洗的能耗数据中提取影响建筑能耗实时监测的主要因素特征值,... 针对现有方法在对电梯能耗进行监测时,存在监测精度低、用时长、监测结果不理想的问题,该文提出一种基于K-means聚类算法和BP神经网络相结合的电梯能耗实时监测方法 .在经过清洗的能耗数据中提取影响建筑能耗实时监测的主要因素特征值,利用相似系数法进行相似度计算,获取相似系数.对相似电梯能耗数据进行小波分解获取高低频序列,分别采用LSSVM-GSA检测方法和均方加权处理方法对低频和高频部分进行处理,将两个结果进行重构,得到最终的实时监测结果 .仿真实验结果表明:所提方法能够获取高精度、低耗时、高稳定性的监测结果 . 展开更多
关键词 电梯能耗 k-means算法 BP神经网络 数据清洗
下载PDF
一种融合乌鸦搜索算法的K-means聚类算法
15
作者 高海宾 《新乡学院学报》 2024年第3期19-25,共7页
传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全... 传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全局搜索能力,自动确定最佳的聚类数目K,从而提高聚类的质量和效率。通过在Seeds数据集进行实验计算卡林斯基-哈拉巴斯(Calinski-Harabasz)指数等评价指标,发现该算法聚类效果明显优于传统的K-means算法。 展开更多
关键词 k-means算法 乌鸦搜索算法 Calinski-Harabasz指数
下载PDF
基于改进K-means数据聚类算法的网络入侵检测
16
作者 黄俊萍 《成都工业学院学报》 2024年第2期58-62,97,共6页
随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算... 随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算法求取最优初始聚类中心,实现K-means数据聚类算法的改进;最后以计算得出的特征值为输入项,实现对网络入侵行为的精准检测。结果表明:K-means算法改进后较改进前的戴维森堡丁指数更小,均低于0.6,达到了改进目的。改进K-means算法各样本的准确率均高于90%,相对更高,检测时间均低于10 s,相对更少,说明该方法能够以高效率完成更准确的网络入侵检测。 展开更多
关键词 改进k-means数据算法 防火墙日志 入侵检测特征 粒子群算法 网络入侵检测
下载PDF
基于改进K-means聚类算法的网络异常数据挖掘与分类方法
17
作者 贺萌 《无线互联科技》 2024年第18期119-122,共4页
为了解决网络异常数据挖掘过程中漏报率、误报率较高的问题,文章提出一种基于改进K-means聚类算法的网络异常数据挖掘与分类方法。文章通过构建并行化频繁项集挖掘环境加速数据处理,利用局部离群点检测剔除异常值,同时引入K-means聚类... 为了解决网络异常数据挖掘过程中漏报率、误报率较高的问题,文章提出一种基于改进K-means聚类算法的网络异常数据挖掘与分类方法。文章通过构建并行化频繁项集挖掘环境加速数据处理,利用局部离群点检测剔除异常值,同时引入K-means聚类对数据的最大最小距离展开计算,融合隶属度函数与密度峰值优化算法,改进聚类初始中心选择及簇边界调整,从而提高异常识别准确性和分类效率。通过实验结果证明,该方法能够明显改善聚类效果与性能。 展开更多
关键词 k-means算法 网络异常 数据挖掘 数据分 离群点检测
下载PDF
一种基于K-means聚类算法的沙尘天气客观识别方法 被引量:1
18
作者 段赛男 焦瑞莉 吴成来 《气候与环境研究》 CSCD 北大核心 2024年第2期178-192,共15页
鉴于以往基于污染物浓度时间序列进行分析的沙尘天气识别方法在判断标准上存在一定的主观性,本文提出一种基于K-means聚类算法的沙尘天气客观识别方法。本方法利用环境监测总站的PM2.5和PM10小时浓度资料进行聚类,首先选取最优的分类数... 鉴于以往基于污染物浓度时间序列进行分析的沙尘天气识别方法在判断标准上存在一定的主观性,本文提出一种基于K-means聚类算法的沙尘天气客观识别方法。本方法利用环境监测总站的PM2.5和PM10小时浓度资料进行聚类,首先选取最优的分类数目K进行聚类,其次对聚类结果中离散程度较高的类别进行再次聚类,直到无需分类。将本方法应用于西安市2018年2~4月沙尘天气的识别中,结果表明,本方法可有效识别主要沙尘天气。此外,利用本方法可得到沙尘天气典型特征:PM2.5占PM10浓度的比例小于43.5%、PM10浓度高于228μg/m^(3,)符合沙尘天气期间PM10浓度较高且以粗颗粒物为主的物理特征。总体上看,本方法物理基础清晰,可操行性强,适用于大规模数据处理,具有较好的实用价值和应用前景。 展开更多
关键词 沙尘天气识别 k-means 客观识别 PM2.5 PM10
下载PDF
基于改进K-means聚类和皮尔逊相关系数户变关系异常诊断 被引量:4
19
作者 周纲 黄瑞 +3 位作者 刘度度 张芝敏 胡军华 高云鹏 《电测与仪表》 北大核心 2024年第3期76-82,152,共8页
用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降... 用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降维,建立改进K-means聚类提取电压数据特征,提出改进皮尔逊相关系数算法分析待检测用户,据此建立基于改进K-means聚类和改进皮尔逊相关系数的户变关系异常诊断方法,实现多异常用户所属正确台区诊断。实际算例分析结果表明,文中提出算法在识别同一台区一个及多个异常用户、不同台区多个异常用户情况下均能有效实现异常用户的准确检测与分析,相比传统检测方法,实现简单且准确性更高。 展开更多
关键词 户变关系 GIS系统 主成分分析 改进k-means
下载PDF
基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估 被引量:1
20
作者 管筝 印涌强 +1 位作者 张晓祥 陈跃红 《应用科学学报》 CAS CSCD 北大核心 2024年第3期388-404,共17页
为了更好地分析空间异质性对山洪灾害易发性评估的影响,建立了基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估模型。首先,选取中国江西省12338个小流域为研究区,对各时段不同频率降雨量指标进行K-means聚类。其次,以误差平... 为了更好地分析空间异质性对山洪灾害易发性评估的影响,建立了基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估模型。首先,选取中国江西省12338个小流域为研究区,对各时段不同频率降雨量指标进行K-means聚类。其次,以误差平方和与平均轮廓系数为聚类效果评价指标,将小流域分为2个类内聚集、类外分散的子集。最后,针对不同子集,从几何特征、环境特征以及降水特征3个方面选取平均坡度、形心高程、形状系数、最长汇流路径比降、地形湿度指数、归一化植被指数、距离河流最近距离、降雨量、洪峰模数以及汇流时间10个山洪影响因素,应用自适应增强算法与极致梯度提升算法进行山洪灾害易发性评估。研究发现,降水是导致山洪灾害的重要因素,江西省高降水区域山洪灾害易发程度普遍高于低降水区,同时省内高风险区分布较为分散,主要分布在东北区域与西北边缘区域。对聚类后两类相似小流域分别进行山洪易发性评估,接受者操作特征曲线下面积值均在0.90以上,精度较聚类前有所提高。聚类策略作为易发性评估模型的前驱过程,可以有效解决小流域异质性问题。 展开更多
关键词 空间异质性 k-means 集成学习 自适应增强 极致梯度提升 山洪灾害
下载PDF
上一页 1 2 221 下一页 到第
使用帮助 返回顶部