期刊文献+
共找到43,415篇文章
< 1 2 250 >
每页显示 20 50 100
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
1
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 k-means 特征空间增强 mixup算法
下载PDF
基于K-means聚类和BP神经网络的电梯能耗实时监测方法
2
作者 彭诚 《通化师范学院学报》 2024年第4期50-56,共7页
针对现有方法在对电梯能耗进行监测时,存在监测精度低、用时长、监测结果不理想的问题,该文提出一种基于K-means聚类算法和BP神经网络相结合的电梯能耗实时监测方法 .在经过清洗的能耗数据中提取影响建筑能耗实时监测的主要因素特征值,... 针对现有方法在对电梯能耗进行监测时,存在监测精度低、用时长、监测结果不理想的问题,该文提出一种基于K-means聚类算法和BP神经网络相结合的电梯能耗实时监测方法 .在经过清洗的能耗数据中提取影响建筑能耗实时监测的主要因素特征值,利用相似系数法进行相似度计算,获取相似系数.对相似电梯能耗数据进行小波分解获取高低频序列,分别采用LSSVM-GSA检测方法和均方加权处理方法对低频和高频部分进行处理,将两个结果进行重构,得到最终的实时监测结果 .仿真实验结果表明:所提方法能够获取高精度、低耗时、高稳定性的监测结果 . 展开更多
关键词 电梯能耗 k-means算法 BP神经网络 数据清洗
下载PDF
启发式k-means聚类算法的改进研究
3
作者 殷丽凤 栗庆杰 《大连交通大学学报》 CAS 2024年第2期115-119,共5页
启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结... 启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。 展开更多
关键词 算法 k-means 启发式算法 仔细播种 局部异常因子 离群点
下载PDF
一种融合乌鸦搜索算法的K-means聚类算法
4
作者 高海宾 《新乡学院学报》 2024年第3期19-25,共7页
传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全... 传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全局搜索能力,自动确定最佳的聚类数目K,从而提高聚类的质量和效率。通过在Seeds数据集进行实验计算卡林斯基-哈拉巴斯(Calinski-Harabasz)指数等评价指标,发现该算法聚类效果明显优于传统的K-means算法。 展开更多
关键词 k-means算法 乌鸦搜索算法 Calinski-Harabasz指数
下载PDF
基于改进K-means聚类和皮尔逊相关系数户变关系异常诊断 被引量:1
5
作者 周纲 黄瑞 +3 位作者 刘度度 张芝敏 胡军华 高云鹏 《电测与仪表》 北大核心 2024年第3期76-82,152,共8页
用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降... 用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降维,建立改进K-means聚类提取电压数据特征,提出改进皮尔逊相关系数算法分析待检测用户,据此建立基于改进K-means聚类和改进皮尔逊相关系数的户变关系异常诊断方法,实现多异常用户所属正确台区诊断。实际算例分析结果表明,文中提出算法在识别同一台区一个及多个异常用户、不同台区多个异常用户情况下均能有效实现异常用户的准确检测与分析,相比传统检测方法,实现简单且准确性更高。 展开更多
关键词 户变关系 GIS系统 主成分分析 改进k-means
下载PDF
基于K-means聚类和图像分割的紫色土发生层边界识别
6
作者 杨凯 慈恩 +2 位作者 刘彬 陈洋洋 谢宇 《土壤学报》 CAS CSCD 北大核心 2024年第4期939-951,共13页
土壤学始于对土壤剖面及其形态特征的观察,剖面发生层的划分与发生层边界特征的描述是土壤调查的基础。实地划分发生层需要丰富的土壤学实践经验,存在主观和缺乏统一划分标准的问题。以紫色土剖面图像为研究对象,采用K-means聚类和图像... 土壤学始于对土壤剖面及其形态特征的观察,剖面发生层的划分与发生层边界特征的描述是土壤调查的基础。实地划分发生层需要丰富的土壤学实践经验,存在主观和缺乏统一划分标准的问题。以紫色土剖面图像为研究对象,采用K-means聚类和图像分割技术,结合图像的颜色特征(CIELab色彩空间)和纹理特征(Entropy)识别紫色土剖面发生层边界,并与实地划分的结果进行比较。结果表明:(1)CIELab色彩空间的a、b通道和Entropy纹理特征,可以划分出供试剖面的主要发生层(A、B、C)和基岩(R);(2)聚类识别的发生层数量和发生层深度与实地识别的结果基本一致;除Z2剖面的C层和Z6剖面的Ap层聚类识别与实地识别的发生层下边界深度相差较大(分别为13cm和8cm)外,其余发生层下边界深度相差均在3 cm以内;(3)聚类识别的发生层边界形状更为不规则,明显度更为模糊。K-means聚类和图像分割技术实现了紫色土剖面发生层边界的客观识别,可为土壤剖面智能辨识系统的开发提供科学参考。 展开更多
关键词 剖面图像 发生层 k-means 图像分割 颜色 纹理
下载PDF
基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估
7
作者 管筝 印涌强 +1 位作者 张晓祥 陈跃红 《应用科学学报》 CAS CSCD 北大核心 2024年第3期388-404,共17页
为了更好地分析空间异质性对山洪灾害易发性评估的影响,建立了基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估模型。首先,选取中国江西省12338个小流域为研究区,对各时段不同频率降雨量指标进行K-means聚类。其次,以误差平... 为了更好地分析空间异质性对山洪灾害易发性评估的影响,建立了基于K-means聚类与集成学习算法的小流域山洪灾害易发性评估模型。首先,选取中国江西省12338个小流域为研究区,对各时段不同频率降雨量指标进行K-means聚类。其次,以误差平方和与平均轮廓系数为聚类效果评价指标,将小流域分为2个类内聚集、类外分散的子集。最后,针对不同子集,从几何特征、环境特征以及降水特征3个方面选取平均坡度、形心高程、形状系数、最长汇流路径比降、地形湿度指数、归一化植被指数、距离河流最近距离、降雨量、洪峰模数以及汇流时间10个山洪影响因素,应用自适应增强算法与极致梯度提升算法进行山洪灾害易发性评估。研究发现,降水是导致山洪灾害的重要因素,江西省高降水区域山洪灾害易发程度普遍高于低降水区,同时省内高风险区分布较为分散,主要分布在东北区域与西北边缘区域。对聚类后两类相似小流域分别进行山洪易发性评估,接受者操作特征曲线下面积值均在0.90以上,精度较聚类前有所提高。聚类策略作为易发性评估模型的前驱过程,可以有效解决小流域异质性问题。 展开更多
关键词 空间异质性 k-means 集成学习 自适应增强 极致梯度提升 山洪灾害
下载PDF
基于K-means聚类的多种群麻雀搜索算法 被引量:1
8
作者 闫少强 刘卫东 +2 位作者 杨萍 吴丰轩 阎哲 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期508-518,共11页
为改善麻雀搜索算法(SSA)在单种群搜索中收敛速度过快导致其收敛速度出现冗余,易忽略优质解而陷入局部最优的缺陷,提出一种基于K-means聚类的多种群麻雀搜索算法(KSSA)。将多种群机制引入SSA,减弱单种群的收敛能力,并减小陷入局部最优... 为改善麻雀搜索算法(SSA)在单种群搜索中收敛速度过快导致其收敛速度出现冗余,易忽略优质解而陷入局部最优的缺陷,提出一种基于K-means聚类的多种群麻雀搜索算法(KSSA)。将多种群机制引入SSA,减弱单种群的收敛能力,并减小陷入局部最优的概率;采用K-means聚类划分子种群,增加子种群间的差异性,同时使子种群内个体在小范围内专注搜索,提升前期搜索效率;借助加权重心交流策略改善种群间交流的质量,减少自身种群的干扰,同时消减因某一子种群陷入局部最优而导致所有子种群陷入局部最优的风险;引入动态反向学习到警戒者中,增强其反捕食行为,改善因子种群数量增加而带来的收敛速度变慢和收敛精度不足的缺陷。经测试函数仿真实验表明:较SSA等算法,KSSA具有更优的寻优性能。 展开更多
关键词 麻雀搜索算法 优化算法 多种群 k-means 种群交流
下载PDF
基于改进的K-means聚类分区均匀化空间学习索引
9
作者 傅晨华 张丰 +1 位作者 胡林舒 王立君 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2024年第2期153-161,195,共10页
传统空间索引的体量随数据量的增加而膨胀,查询效率较低。学习索引的体量不随数据量的增加而膨胀,同时避免了层级比较查询,性能优异。将学习索引应用于空间索引存在2个难点:一是选取合适的降维方法实现空间数据的排序;二是对降维后数据... 传统空间索引的体量随数据量的增加而膨胀,查询效率较低。学习索引的体量不随数据量的增加而膨胀,同时避免了层级比较查询,性能优异。将学习索引应用于空间索引存在2个难点:一是选取合适的降维方法实现空间数据的排序;二是对降维后数据序列进行有效的简化分布计算,使其易于拟合。基于此,提出了一种网格混合聚类分区学习索引(grid-ml),用z曲线进行降维,用双层网格结构优化查询策略,用改进的K-means聚类算法进行数据分区,实现数据分布均匀化。对比实验发现,grid-ml构建速度快、存储空间小、查询效率高,较传统空间索引优势显著。 展开更多
关键词 学习索引 k-means 空间填充曲线 空间索引
下载PDF
结合人工蜂群与K-means聚类的特征选择
10
作者 孙林 刘梦含 薛占熬 《计算机科学与探索》 CSCD 北大核心 2024年第1期93-110,共18页
K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚... K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚类的特征选择方法。首先,为了使同一簇中样本的相似度高而不同簇中样本的相似度低,基于簇内聚集度和簇间离散度构建了新的适应度函数,更好地反映各样本的特性,进而构建了蜜源被选择新的概率表达式;其次,设计了随着迭代次数的增加而数值逐渐减小的权重,提出了使蜂群搜索范围动态缩进的蜜源位置更新表达式;然后,为了弥补传统的欧氏距离在计算距离时仅考虑向量之间的累积差异而表现出的局限性,构造了同时考虑样本影响程度不同以及样本的相似性的加权欧氏距离表达式;最后,引入标准差和距离相关系数,定义了特征区分度与特征代表性,以二者之积度量特征重要性。实验结果表明,所提算法加快了人工蜂群算法的收敛速度并提高了K-means算法的聚类效果,同时也有效地提升了特征选择的分类效果。 展开更多
关键词 特征选择 人工蜂群 k-means 特征重要度
下载PDF
一种基于K-means聚类算法的沙尘天气客观识别方法
11
作者 段赛男 焦瑞莉 吴成来 《气候与环境研究》 CSCD 北大核心 2024年第2期178-192,共15页
鉴于以往基于污染物浓度时间序列进行分析的沙尘天气识别方法在判断标准上存在一定的主观性,本文提出一种基于K-means聚类算法的沙尘天气客观识别方法。本方法利用环境监测总站的PM2.5和PM10小时浓度资料进行聚类,首先选取最优的分类数... 鉴于以往基于污染物浓度时间序列进行分析的沙尘天气识别方法在判断标准上存在一定的主观性,本文提出一种基于K-means聚类算法的沙尘天气客观识别方法。本方法利用环境监测总站的PM2.5和PM10小时浓度资料进行聚类,首先选取最优的分类数目K进行聚类,其次对聚类结果中离散程度较高的类别进行再次聚类,直到无需分类。将本方法应用于西安市2018年2~4月沙尘天气的识别中,结果表明,本方法可有效识别主要沙尘天气。此外,利用本方法可得到沙尘天气典型特征:PM2.5占PM10浓度的比例小于43.5%、PM10浓度高于228μg/m^(3,)符合沙尘天气期间PM10浓度较高且以粗颗粒物为主的物理特征。总体上看,本方法物理基础清晰,可操行性强,适用于大规模数据处理,具有较好的实用价值和应用前景。 展开更多
关键词 沙尘天气识别 k-means 客观识别 PM2.5 PM10
下载PDF
基于BERT-LDA和K-means聚类的绘画作品价值评估指标体系构建
12
作者 李天义 刘勤明 《软件工程》 2024年第1期68-73,共6页
针对目前绘画领域缺乏标准的价值评估指标体系,提出了基于BERT-LDA和K-means聚类的绘画作品价值要素挖掘方法。运用超平面法对绘画文献进行了停用词筛选,基于BERT-LDA模型构建了包含文本语义信息的融合特征向量,运用K-means算法对融合... 针对目前绘画领域缺乏标准的价值评估指标体系,提出了基于BERT-LDA和K-means聚类的绘画作品价值要素挖掘方法。运用超平面法对绘画文献进行了停用词筛选,基于BERT-LDA模型构建了包含文本语义信息的融合特征向量,运用K-means算法对融合特征向量进行降维可视化,随之构建了绘画作品价值评估指标体系。结果表明,基于BERT-LDA模型和K-means算法识别的主题及主题词相比传统LDA模型的查准率、查全率和F值分别提升了28.5%、10%和21.5%。通过随机森林等算法对指标体系进行验证,验证了构建的绘画作品价值评估指标体系的科学性。 展开更多
关键词 BERT-LDA 融合特征向量 k-means 绘画 指标体系
下载PDF
基于改进K-means数据聚类算法的网络入侵检测
13
作者 黄俊萍 《成都工业学院学报》 2024年第2期58-62,97,共6页
随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算... 随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算法求取最优初始聚类中心,实现K-means数据聚类算法的改进;最后以计算得出的特征值为输入项,实现对网络入侵行为的精准检测。结果表明:K-means算法改进后较改进前的戴维森堡丁指数更小,均低于0.6,达到了改进目的。改进K-means算法各样本的准确率均高于90%,相对更高,检测时间均低于10 s,相对更少,说明该方法能够以高效率完成更准确的网络入侵检测。 展开更多
关键词 改进k-means数据算法 防火墙日志 入侵检测特征 粒子群算法 网络入侵检测
下载PDF
融合异常检测与区域分割的高效K-means聚类算法
14
作者 尹宏伟 杭雨晴 胡文军 《郑州大学学报(工学版)》 CAS 北大核心 2024年第3期80-88,共9页
传统K-means及其众多改进算法缺乏显式处理异常样本的能力,导致其聚类性能容易受到异常样本的影响。针对此问题,提出一种融合异常检测与区域分割的高效K-means聚类算法。首先,通过构建统一聚类模型,形成异常检测与聚类之间的交互协同,... 传统K-means及其众多改进算法缺乏显式处理异常样本的能力,导致其聚类性能容易受到异常样本的影响。针对此问题,提出一种融合异常检测与区域分割的高效K-means聚类算法。首先,通过构建统一聚类模型,形成异常检测与聚类之间的交互协同,以提高聚类性能。其次,利用近邻簇搜索技术对各类簇进行自适应的区域分割,以减少冗余计算,提高算法执行效率。最后,为验证所提方法的有效性,在多个合成数据集和真实数据集上分别进行测试。实验结果表明:所提算法聚类性能和执行效率优于其他算法;在添加10%异常样本的Wine数据集上准确度可达0.911。 展开更多
关键词 k-means 异常检测 区域分割 近邻簇搜索 自适应
下载PDF
基于优化K-means算法的高校成绩聚类分析研究
15
作者 张梁 杨立波 +1 位作者 张小勇 史俊冰 《太原学院学报(自然科学版)》 2024年第2期79-84,共6页
针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-mean... 针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-means算法避免了区间分类不合理现象,更加准确地反映了成绩样本的分布特点。 展开更多
关键词 均值算法 分布密度 k-means
下载PDF
基于自适应布谷鸟优化特征选择的K-means聚类
16
作者 孙林 刘梦含 《计算机应用》 CSCD 北大核心 2024年第3期831-841,共11页
K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首... K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首先,为提升CS算法的搜索速度和精度,在莱维飞行阶段,设计了自适应步长因子;为调节CS算法全局搜索和局部搜索之间的平衡、加快CS算法的收敛,动态调整发现概率,进而提出改进的动态CS算法(IDCS),在IDCS的基础上构建了结合动态CS的特征选择算法(DCFS)。其次,为提升传统欧氏距离的计算精确度,设计同时考虑样本和特征对距离计算贡献程度的加权欧氏距离;为了确定最佳聚类数目的选取方法,依据改进的加权欧氏距离构造了加权簇内距离和簇间距离。最后,为克服传统K-means聚类目标函数仅考虑簇内的距离而未考虑簇间距离的缺陷,提出基于中位数的轮廓系数的目标函数,进而设计了DCFSK。实验结果表明,在10个基准测试函数上,IDCS的各项指标取得了较优的结果;相较于K-means、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等算法,在6个合成数据集与6个UCI数据集上,DCFSK的聚类效果最佳。 展开更多
关键词 布谷鸟搜索算法 k-means 欧氏距离 特征选择 轮廓系数
下载PDF
基于K-means聚类和极限学习机组合算法的短期光伏功率预测
17
作者 黄牧涛 邢芳菲 +1 位作者 陈兴邦 卢明 《水电能源科学》 北大核心 2024年第2期217-220,216,共5页
考虑光伏功率的预测精度强依赖于天气模态和气候条件等因素影响,提出了基于极限学习机组合算法的短期光伏功率预测方法。首先,基于K-means聚类算法进行天气分型,分为4个季节下晴天、多云天气、阴雨天气共12组不同天气类别。其次,针对天... 考虑光伏功率的预测精度强依赖于天气模态和气候条件等因素影响,提出了基于极限学习机组合算法的短期光伏功率预测方法。首先,基于K-means聚类算法进行天气分型,分为4个季节下晴天、多云天气、阴雨天气共12组不同天气类别。其次,针对天气分型结果,基于极限学习机ELM、遗传算法改进的极限学习机GA-ELM、鸟群算法改进的极限学习机BSA-ELM3种算法构建光伏功率预测模型。最后,以某光伏电站数据进行所提模型验证。预测结果表明,BSA-ELM预测精度最高,12种天气预测精度达到90%左右,各季节中预测精度最高的天气类型均为晴天,多云天气精度高于阴雨天气精度,可为含高比例光伏并网的新型电力系统安全稳定运行提供有效数据支撑。 展开更多
关键词 光伏发电功率预测 k-means 天气分型 极限学习机算法 遗传算法 鸟群算法
下载PDF
基于融合改进K-means聚类算法的数据检测技术
18
作者 郭克难 《电子设计工程》 2024年第5期41-45,共5页
针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密... 针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密度和高密度距离进行计算,进而优化簇中心的选择。同时融合PCA降维算法减少了数据的冗余信息,进一步提高了运行效率。通过引入LOF离群检测算法对分簇后的数据进行检测,从而得到异常数据结果。实验测试中,所提算法在人工数据集上的平均ARI指标为0.844,真实数据集的准确率则达到了79.2%,在所有对比算法中均为最优,表明该算法具有良好的性能,可以对财务异常数据进行准确地检测。 展开更多
关键词 k-means 密度峰值检测 主成分分析法 离群检测算法 异常数据检测
下载PDF
基于改进K-means聚类的电网抢修资源优化技术
19
作者 姚宗溥 张韶华 +2 位作者 余伟 杨宁 汪毅 《电子设计工程》 2024年第11期131-135,共5页
针对传统电网抢修资源配置中存在主观性强、处理突发状况能力较弱的问题,文中基于改进K-means聚类算法提出了一种电网抢修资源的分配策略。该策略采用改进算法分析平台的工单数据,以获得聚合数据包,并利用主成分分析法完成对数据的降维... 针对传统电网抢修资源配置中存在主观性强、处理突发状况能力较弱的问题,文中基于改进K-means聚类算法提出了一种电网抢修资源的分配策略。该策略采用改进算法分析平台的工单数据,以获得聚合数据包,并利用主成分分析法完成对数据的降维。降维后的数据经过深度稀疏自编码器的训练,得到的数据特征被K-means++算法聚类,进而输出工单任务的优先级。所提改进算法考虑了多种复杂因素的影响,相比传统算法其综合性能更为理想。多项实验结果表明,所提算法的聚类性能和数据训练性能在多个对比算法中均为最优,可以准确地识别出测试用例中的任务等级,为电网抢修资源的分配与决策提供技术支撑。 展开更多
关键词 k-means 主成分分析法 深度稀疏自编码器 资源配置 电网抢修
下载PDF
基于K-means聚类的超启发式跨单元调度方法
20
作者 赵彦霖 田云娜 《系统仿真学报》 CAS CSCD 北大核心 2024年第4期941-956,共16页
结合我国制造业实际生产状况,针对柔性作业车间跨单元调度问题,提出一种基于K-means聚类的超启发式算法。应用K-means聚类算法将相近属性的实体划入相应“工件簇”决策块中,采用蚁群算法为每个决策块选择启发式规则;对每个决策块内的实... 结合我国制造业实际生产状况,针对柔性作业车间跨单元调度问题,提出一种基于K-means聚类的超启发式算法。应用K-means聚类算法将相近属性的实体划入相应“工件簇”决策块中,采用蚁群算法为每个决策块选择启发式规则;对每个决策块内的实体运用相应的启发式规则产生调度解。仿真结果表明:该算法以决策块的形式适度增大了计算粒度,有效降低了算法时间复杂度,以聚类的方式将具有相近属性的被加工实体进行聚集,有利于为不同属性的实体选择合适的规则。该算法提高了计算效率,具有较好的优化性能,是解决柔性跨单元调度的一种有效算法。 展开更多
关键词 跨单元调度 超启发式算法 决策块 蚁群算法
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部