期刊文献+
共找到4,355篇文章
< 1 2 218 >
每页显示 20 50 100
基于距离聚类与K-means动态聚类的棉田土壤养分评价研究 被引量:4
1
作者 范向龙 吕新 +4 位作者 张泽 高攀 张强 印彩霞 易翔 《干旱区研究》 CSCD 北大核心 2021年第4期980-989,共10页
为了解棉田土壤养分状况及确定养分丰缺程度,研究采用主成分结合距离聚类、K-means动态聚类以及土壤养分综合评价方法对新疆棉田土壤进行分析评价。结果表明:(1)在主成分分析中,有效铜、有效锰和碱解氮起主要作用,有效铜含量为1.82 mg&#... 为了解棉田土壤养分状况及确定养分丰缺程度,研究采用主成分结合距离聚类、K-means动态聚类以及土壤养分综合评价方法对新疆棉田土壤进行分析评价。结果表明:(1)在主成分分析中,有效铜、有效锰和碱解氮起主要作用,有效铜含量为1.82 mg·kg^(-1),丰缺评价状况属于高等水平,有效锰含量为11.36 mg·kg^(-1),属于较低水平,碱解氮含量为122.07 mg·kg^(-1),属于高等水平,土壤速效磷、速效钾、有效锌和有效铁含量较低,土壤养分含量分布不均匀。在距离聚类和K-means动态聚类中,有机质、碱解氮、有效锰含量较低,其余养分含量较高。在距离聚类中,土壤各类养分可表示为:第Ⅰ类>第Ⅴ类>第Ⅳ类>第Ⅱ类>第Ⅲ类,而在K-means动态聚类中可以表示为:第Ⅲ类>第Ⅰ类>第Ⅴ类>第Ⅱ类>第Ⅳ类。(2)在土壤综合肥力指数评价值中(IFI),1连和16连的等级高;2连、3连、4连、6连、15连、19连和二监区的等级较高;8连、9连、10连、11连、12连、17连、18连和20连在中等水平。5连、7连、一监区和农市站的等级较低。K-means动态聚类比距离聚类分类效果好,可以更加科学合理、准确有效地对土壤养分进行综合评价。 展开更多
关键词 土壤养分 距离 k-means动态聚类 综合评价值
下载PDF
基于KD-树和K-means动态聚类方法研究 被引量:16
2
作者 万静 张义 +1 位作者 何云斌 李松 《计算机应用研究》 CSCD 北大核心 2015年第12期3590-3595,共6页
针对传统K-means聚类算法对初始中心点比较敏感、易陷入局部最优,首先提出基于KD-树的初始聚类中心点选取方法。该方法通过建立KD-树将数据集分割成矩形单元,计算每个矩形的矩形单元中心、矩形单元密度,并将计算所得矩形单元密度降序排... 针对传统K-means聚类算法对初始中心点比较敏感、易陷入局部最优,首先提出基于KD-树的初始聚类中心点选取方法。该方法通过建立KD-树将数据集分割成矩形单元,计算每个矩形的矩形单元中心、矩形单元密度,并将计算所得矩形单元密度降序排列,通过选取前k个矩形单元中心作为初始聚类中心,可有效克服传统算法对初始中心点的敏感。此外,针对传统K-means聚类算法不能有效处理动态数据聚类的问题,进一步提出了KDTK-means聚类算法。该算法对基于KD-树优化选取的k个聚类中心和增量数据建立新的KD-树,利用近邻搜索策略将增量数据分配到相应的聚类簇中并完成聚类。实验结果表明,与传统的K-means聚类算法相比,提出的基于KD-树优化初始聚类中心点选取的算法能够有效选取具有代表性的初始中心,提出的KDTKmeans聚类算法能够快速高效地处理增量数据聚类问题。 展开更多
关键词 k-means KD-树 增量 初始中心
下载PDF
基于信息熵改进的K-means动态聚类算法 被引量:20
3
作者 杨玉梅 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2016年第2期254-259,共6页
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题。因此,提出一个改进的K-means算法。改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始... 初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题。因此,提出一个改进的K-means算法。改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果。实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升。 展开更多
关键词 k-means算法 信息熵 数据挖掘 动态
下载PDF
基于K-Means动态聚类的投影寻踪分类模型 被引量:1
4
作者 姚奕 倪勤 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期16-20,共5页
投影寻踪分类模型作为一种多因素影响问题的综合评价方法,已经被研究者广泛应用在各个领域并取得了良好的效果.然而模型本身还存在密度窗宽不确定以及模型无分类规则等尚需解决的问题.针对这些问题,提出一个基于K-Means动态分类的投影... 投影寻踪分类模型作为一种多因素影响问题的综合评价方法,已经被研究者广泛应用在各个领域并取得了良好的效果.然而模型本身还存在密度窗宽不确定以及模型无分类规则等尚需解决的问题.针对这些问题,提出一个基于K-Means动态分类的投影寻踪分类模型,定义了一个新的投影指标.实证分析说明了该模型的可靠性和可操作性. 展开更多
关键词 投影寻踪分 动态 投影指标 遗传算法
下载PDF
电网需求侧资源动态分布式k-means聚类算法
5
作者 黄静 饶尧 刘政 《大连交通大学学报》 CAS 2024年第2期109-114,共6页
为有效聚合电网需求侧资源,合理、高效利用电网资源,提出基于分布式k-means的电网需求侧资源动态聚类算法。通过基于置信半径的分布式k-means算法聚类采集到的电网需求侧资源数据,在模糊C均值进化神经网络中,以聚类得到的电网需求侧资... 为有效聚合电网需求侧资源,合理、高效利用电网资源,提出基于分布式k-means的电网需求侧资源动态聚类算法。通过基于置信半径的分布式k-means算法聚类采集到的电网需求侧资源数据,在模糊C均值进化神经网络中,以聚类得到的电网需求侧资源数据为输入向量,输出电网需求侧资源场景,依据场景存在概率,以电网侧资源日均峰谷差最小、DG消纳程度最高与日均负荷波动率最小为目标函数,以电网需求侧资源曲线波动率与负荷互补为约束条件,构建电网需求侧资源多场景聚类模型,经动态改变惯性因子(DCW)粒子群算法求解模型后,实现电网需求侧资源多场景聚类。试验结果表明:该方法可实现电网需求侧资源动态聚类,应用该方法聚类不同场景电网需求侧资源时的日负荷率较低,聚类效果较好,可满足实际电力需求侧资源动态聚类工作的需要。 展开更多
关键词 电网需求 侧资源 动态 分布式 k-means算法 模型
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
6
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 k-means 特征空间增强 mixup算法
下载PDF
基于蚁群算法的三支k-means聚类算法
7
作者 朱金 徐天杰 王平心 《江苏科技大学学报(自然科学版)》 CAS 2024年第3期63-69,共7页
在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法... 在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法中随机概率选择策略和信息素的正负反馈机制,动态调整权重的方法,对三支k-means聚类算法进行优化.在UCI数据集上实验证明,该方法对聚类结果的性能指标有所提高. 展开更多
关键词 三支k-means k-means算法 中心 蚁群算法
下载PDF
启发式k-means聚类算法的改进研究
8
作者 殷丽凤 栗庆杰 《大连交通大学学报》 CAS 2024年第2期115-119,共5页
启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结... 启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。 展开更多
关键词 算法 k-means 启发式算法 仔细播种 局部异常因子 离群点
下载PDF
基于K-means聚类和BP神经网络的电梯能耗实时监测方法
9
作者 彭诚 《通化师范学院学报》 2024年第4期50-56,共7页
针对现有方法在对电梯能耗进行监测时,存在监测精度低、用时长、监测结果不理想的问题,该文提出一种基于K-means聚类算法和BP神经网络相结合的电梯能耗实时监测方法 .在经过清洗的能耗数据中提取影响建筑能耗实时监测的主要因素特征值,... 针对现有方法在对电梯能耗进行监测时,存在监测精度低、用时长、监测结果不理想的问题,该文提出一种基于K-means聚类算法和BP神经网络相结合的电梯能耗实时监测方法 .在经过清洗的能耗数据中提取影响建筑能耗实时监测的主要因素特征值,利用相似系数法进行相似度计算,获取相似系数.对相似电梯能耗数据进行小波分解获取高低频序列,分别采用LSSVM-GSA检测方法和均方加权处理方法对低频和高频部分进行处理,将两个结果进行重构,得到最终的实时监测结果 .仿真实验结果表明:所提方法能够获取高精度、低耗时、高稳定性的监测结果 . 展开更多
关键词 电梯能耗 k-means算法 BP神经网络 数据清洗
下载PDF
一种融合乌鸦搜索算法的K-means聚类算法
10
作者 高海宾 《新乡学院学报》 2024年第3期19-25,共7页
传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全... 传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全局搜索能力,自动确定最佳的聚类数目K,从而提高聚类的质量和效率。通过在Seeds数据集进行实验计算卡林斯基-哈拉巴斯(Calinski-Harabasz)指数等评价指标,发现该算法聚类效果明显优于传统的K-means算法。 展开更多
关键词 k-means算法 乌鸦搜索算法 Calinski-Harabasz指数
下载PDF
基于改进K-means聚类和皮尔逊相关系数户变关系异常诊断 被引量:1
11
作者 周纲 黄瑞 +3 位作者 刘度度 张芝敏 胡军华 高云鹏 《电测与仪表》 北大核心 2024年第3期76-82,152,共8页
用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降... 用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降维,建立改进K-means聚类提取电压数据特征,提出改进皮尔逊相关系数算法分析待检测用户,据此建立基于改进K-means聚类和改进皮尔逊相关系数的户变关系异常诊断方法,实现多异常用户所属正确台区诊断。实际算例分析结果表明,文中提出算法在识别同一台区一个及多个异常用户、不同台区多个异常用户情况下均能有效实现异常用户的准确检测与分析,相比传统检测方法,实现简单且准确性更高。 展开更多
关键词 户变关系 GIS系统 主成分分析 改进k-means
下载PDF
一种基于K-means聚类算法的沙尘天气客观识别方法
12
作者 段赛男 焦瑞莉 吴成来 《气候与环境研究》 CSCD 北大核心 2024年第2期178-192,共15页
鉴于以往基于污染物浓度时间序列进行分析的沙尘天气识别方法在判断标准上存在一定的主观性,本文提出一种基于K-means聚类算法的沙尘天气客观识别方法。本方法利用环境监测总站的PM2.5和PM10小时浓度资料进行聚类,首先选取最优的分类数... 鉴于以往基于污染物浓度时间序列进行分析的沙尘天气识别方法在判断标准上存在一定的主观性,本文提出一种基于K-means聚类算法的沙尘天气客观识别方法。本方法利用环境监测总站的PM2.5和PM10小时浓度资料进行聚类,首先选取最优的分类数目K进行聚类,其次对聚类结果中离散程度较高的类别进行再次聚类,直到无需分类。将本方法应用于西安市2018年2~4月沙尘天气的识别中,结果表明,本方法可有效识别主要沙尘天气。此外,利用本方法可得到沙尘天气典型特征:PM2.5占PM10浓度的比例小于43.5%、PM10浓度高于228μg/m^(3,)符合沙尘天气期间PM10浓度较高且以粗颗粒物为主的物理特征。总体上看,本方法物理基础清晰,可操行性强,适用于大规模数据处理,具有较好的实用价值和应用前景。 展开更多
关键词 沙尘天气识别 k-means 客观识别 PM2.5 PM10
下载PDF
基于K-means聚类和图像分割的紫色土发生层边界识别
13
作者 杨凯 慈恩 +2 位作者 刘彬 陈洋洋 谢宇 《土壤学报》 CAS CSCD 北大核心 2024年第4期939-951,共13页
土壤学始于对土壤剖面及其形态特征的观察,剖面发生层的划分与发生层边界特征的描述是土壤调查的基础。实地划分发生层需要丰富的土壤学实践经验,存在主观和缺乏统一划分标准的问题。以紫色土剖面图像为研究对象,采用K-means聚类和图像... 土壤学始于对土壤剖面及其形态特征的观察,剖面发生层的划分与发生层边界特征的描述是土壤调查的基础。实地划分发生层需要丰富的土壤学实践经验,存在主观和缺乏统一划分标准的问题。以紫色土剖面图像为研究对象,采用K-means聚类和图像分割技术,结合图像的颜色特征(CIELab色彩空间)和纹理特征(Entropy)识别紫色土剖面发生层边界,并与实地划分的结果进行比较。结果表明:(1)CIELab色彩空间的a、b通道和Entropy纹理特征,可以划分出供试剖面的主要发生层(A、B、C)和基岩(R);(2)聚类识别的发生层数量和发生层深度与实地识别的结果基本一致;除Z2剖面的C层和Z6剖面的Ap层聚类识别与实地识别的发生层下边界深度相差较大(分别为13cm和8cm)外,其余发生层下边界深度相差均在3 cm以内;(3)聚类识别的发生层边界形状更为不规则,明显度更为模糊。K-means聚类和图像分割技术实现了紫色土剖面发生层边界的客观识别,可为土壤剖面智能辨识系统的开发提供科学参考。 展开更多
关键词 剖面图像 发生层 k-means 图像分割 颜色 纹理
下载PDF
基于改进的K-means聚类分区均匀化空间学习索引
14
作者 傅晨华 张丰 +1 位作者 胡林舒 王立君 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2024年第2期153-161,195,共10页
传统空间索引的体量随数据量的增加而膨胀,查询效率较低。学习索引的体量不随数据量的增加而膨胀,同时避免了层级比较查询,性能优异。将学习索引应用于空间索引存在2个难点:一是选取合适的降维方法实现空间数据的排序;二是对降维后数据... 传统空间索引的体量随数据量的增加而膨胀,查询效率较低。学习索引的体量不随数据量的增加而膨胀,同时避免了层级比较查询,性能优异。将学习索引应用于空间索引存在2个难点:一是选取合适的降维方法实现空间数据的排序;二是对降维后数据序列进行有效的简化分布计算,使其易于拟合。基于此,提出了一种网格混合聚类分区学习索引(grid-ml),用z曲线进行降维,用双层网格结构优化查询策略,用改进的K-means聚类算法进行数据分区,实现数据分布均匀化。对比实验发现,grid-ml构建速度快、存储空间小、查询效率高,较传统空间索引优势显著。 展开更多
关键词 学习索引 k-means 空间填充曲线 空间索引
下载PDF
结合人工蜂群与K-means聚类的特征选择
15
作者 孙林 刘梦含 薛占熬 《计算机科学与探索》 CSCD 北大核心 2024年第1期93-110,共18页
K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚... K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚类的特征选择方法。首先,为了使同一簇中样本的相似度高而不同簇中样本的相似度低,基于簇内聚集度和簇间离散度构建了新的适应度函数,更好地反映各样本的特性,进而构建了蜜源被选择新的概率表达式;其次,设计了随着迭代次数的增加而数值逐渐减小的权重,提出了使蜂群搜索范围动态缩进的蜜源位置更新表达式;然后,为了弥补传统的欧氏距离在计算距离时仅考虑向量之间的累积差异而表现出的局限性,构造了同时考虑样本影响程度不同以及样本的相似性的加权欧氏距离表达式;最后,引入标准差和距离相关系数,定义了特征区分度与特征代表性,以二者之积度量特征重要性。实验结果表明,所提算法加快了人工蜂群算法的收敛速度并提高了K-means算法的聚类效果,同时也有效地提升了特征选择的分类效果。 展开更多
关键词 特征选择 人工蜂群 k-means 特征重要度
下载PDF
基于K-means聚类的多种群麻雀搜索算法 被引量:1
16
作者 闫少强 刘卫东 +2 位作者 杨萍 吴丰轩 阎哲 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期508-518,共11页
为改善麻雀搜索算法(SSA)在单种群搜索中收敛速度过快导致其收敛速度出现冗余,易忽略优质解而陷入局部最优的缺陷,提出一种基于K-means聚类的多种群麻雀搜索算法(KSSA)。将多种群机制引入SSA,减弱单种群的收敛能力,并减小陷入局部最优... 为改善麻雀搜索算法(SSA)在单种群搜索中收敛速度过快导致其收敛速度出现冗余,易忽略优质解而陷入局部最优的缺陷,提出一种基于K-means聚类的多种群麻雀搜索算法(KSSA)。将多种群机制引入SSA,减弱单种群的收敛能力,并减小陷入局部最优的概率;采用K-means聚类划分子种群,增加子种群间的差异性,同时使子种群内个体在小范围内专注搜索,提升前期搜索效率;借助加权重心交流策略改善种群间交流的质量,减少自身种群的干扰,同时消减因某一子种群陷入局部最优而导致所有子种群陷入局部最优的风险;引入动态反向学习到警戒者中,增强其反捕食行为,改善因子种群数量增加而带来的收敛速度变慢和收敛精度不足的缺陷。经测试函数仿真实验表明:较SSA等算法,KSSA具有更优的寻优性能。 展开更多
关键词 麻雀搜索算法 优化算法 多种群 k-means 种群交流
下载PDF
基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估
17
作者 管筝 印涌强 +1 位作者 张晓祥 陈跃红 《应用科学学报》 CAS CSCD 北大核心 2024年第3期388-404,共17页
为了更好地分析空间异质性对山洪灾害易发性评估的影响,建立了基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估模型。首先,选取中国江西省12338个小流域为研究区,对各时段不同频率降雨量指标进行K-means聚类。其次,以误差平... 为了更好地分析空间异质性对山洪灾害易发性评估的影响,建立了基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估模型。首先,选取中国江西省12338个小流域为研究区,对各时段不同频率降雨量指标进行K-means聚类。其次,以误差平方和与平均轮廓系数为聚类效果评价指标,将小流域分为2个类内聚集、类外分散的子集。最后,针对不同子集,从几何特征、环境特征以及降水特征3个方面选取平均坡度、形心高程、形状系数、最长汇流路径比降、地形湿度指数、归一化植被指数、距离河流最近距离、降雨量、洪峰模数以及汇流时间10个山洪影响因素,应用自适应增强算法与极致梯度提升算法进行山洪灾害易发性评估。研究发现,降水是导致山洪灾害的重要因素,江西省高降水区域山洪灾害易发程度普遍高于低降水区,同时省内高风险区分布较为分散,主要分布在东北区域与西北边缘区域。对聚类后两类相似小流域分别进行山洪易发性评估,接受者操作特征曲线下面积值均在0.90以上,精度较聚类前有所提高。聚类策略作为易发性评估模型的前驱过程,可以有效解决小流域异质性问题。 展开更多
关键词 空间异质性 k-means 集成学习 自适应增强 极致梯度提升 山洪灾害
下载PDF
融合异常检测与区域分割的高效K-means聚类算法
18
作者 尹宏伟 杭雨晴 胡文军 《郑州大学学报(工学版)》 CAS 北大核心 2024年第3期80-88,共9页
传统K-means及其众多改进算法缺乏显式处理异常样本的能力,导致其聚类性能容易受到异常样本的影响。针对此问题,提出一种融合异常检测与区域分割的高效K-means聚类算法。首先,通过构建统一聚类模型,形成异常检测与聚类之间的交互协同,... 传统K-means及其众多改进算法缺乏显式处理异常样本的能力,导致其聚类性能容易受到异常样本的影响。针对此问题,提出一种融合异常检测与区域分割的高效K-means聚类算法。首先,通过构建统一聚类模型,形成异常检测与聚类之间的交互协同,以提高聚类性能。其次,利用近邻簇搜索技术对各类簇进行自适应的区域分割,以减少冗余计算,提高算法执行效率。最后,为验证所提方法的有效性,在多个合成数据集和真实数据集上分别进行测试。实验结果表明:所提算法聚类性能和执行效率优于其他算法;在添加10%异常样本的Wine数据集上准确度可达0.911。 展开更多
关键词 k-means 异常检测 区域分割 近邻簇搜索 自适应
下载PDF
基于改进K-means聚类的轨道交通基础设施分布式光伏发电典型场景生成及出力特性分析
19
作者 陈凯 雷琪 李豆萌 《电气工程学报》 CSCD 北大核心 2024年第2期364-372,共9页
受限于自然条件,光伏出力具有很强的随机性。为准确评估轨道交通基础设施分布式光伏发电的光伏出力特性,提出一种基于改进K-means聚类算法的轨道交通基础设施分布式光伏发电典型场景生成方法,并基于此进行光伏出力特性分析。首先,基于... 受限于自然条件,光伏出力具有很强的随机性。为准确评估轨道交通基础设施分布式光伏发电的光伏出力特性,提出一种基于改进K-means聚类算法的轨道交通基础设施分布式光伏发电典型场景生成方法,并基于此进行光伏出力特性分析。首先,基于分布式光伏发电设施以及气象数据,利用PVsyst软件模拟光伏发电出力数据。然后,针对基本K-means聚类算法聚类参数和初始聚类中心盲目性高的问题,结合聚类有效性指标(Density based index,DBI)和层次聚类对其进行改进并利用改进K-means聚类算法生成光伏典型日出力场景。最后,基于华中地区某地轨道交通基础设施分布式光伏系统对所提方法的有效性和优越性进行验证,并通过定性和定量分析各典型场景的出力特性揭示轨道交通基础设施分布式光伏出力的规律和特点。 展开更多
关键词 分布式光伏出力 改进k-means算法 典型出力场景 出力特性分析
下载PDF
基于优化K-means算法的高校成绩聚类分析研究
20
作者 张梁 杨立波 +1 位作者 张小勇 史俊冰 《太原学院学报(自然科学版)》 2024年第2期79-84,共6页
针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-mean... 针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-means算法避免了区间分类不合理现象,更加准确地反映了成绩样本的分布特点。 展开更多
关键词 均值算法 分布密度 k-means
下载PDF
上一页 1 2 218 下一页 到第
使用帮助 返回顶部