期刊文献+
共找到70,371篇文章
< 1 2 250 >
每页显示 20 50 100
加入跳跃连接的深度嵌入K-means聚类 被引量:1
1
作者 李顺勇 胥瑞 李师毅 《计算机系统应用》 2024年第1期11-21,共11页
现有的深度聚类算法大多采用对称的自编码器来提取高维数据的低维特征,但随着自编码器训练次数的不断增加,数据的低维特征空间在一定程度上发生了扭曲,这样得到的数据低维特征空间无法反映原始数据空间中潜在的聚类结构信息.为了解决上... 现有的深度聚类算法大多采用对称的自编码器来提取高维数据的低维特征,但随着自编码器训练次数的不断增加,数据的低维特征空间在一定程度上发生了扭曲,这样得到的数据低维特征空间无法反映原始数据空间中潜在的聚类结构信息.为了解决上述问题,本文提出了一种新的深度嵌入K-means算法(SDEKC).首先,在低维特征提取阶段,在对称的卷积自编码器中相对应的编码器与解码器之间以一定的权重加入两个跳跃连接,以减弱解码器对编码器的编码要求同时突出卷积自编码器的编码能力,这样可以更好地保留原始数据空间中蕴含的聚类结构信息;其次,在聚类阶段,通过一个标准正交变换矩阵将低维数据空间转换为一个新的揭示聚类结构信息的空间;最后,本文以端到端的方式采用贪婪算法迭代优化数据的低维表示及其聚类,在6个真实数据集上验证了本文提出新算法的有效性. 展开更多
关键词 跳跃连接 深度学习 卷积自编码器 嵌入K-means
下载PDF
基于蚁群算法的三支k-means聚类算法
2
作者 朱金 徐天杰 王平心 《江苏科技大学学报(自然科学版)》 CAS 2024年第3期63-69,共7页
在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法... 在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法中随机概率选择策略和信息素的正负反馈机制,动态调整权重的方法,对三支k-means聚类算法进行优化.在UCI数据集上实验证明,该方法对聚类结果的性能指标有所提高. 展开更多
关键词 三支k-means K-means聚类算法 聚类中心 蚁群算法
下载PDF
基于K-Means聚类与熵权TOPSIS法的岩石可爆性评价研究
3
作者 叶海旺 雷丙响 +5 位作者 周汉红 余梦豪 雷涛 王其洲 李宁 Doumbouya Sekou 《爆破》 CSCD 北大核心 2024年第2期112-119,共8页
露天矿山的爆破块度分布,直接影响到后续的采装、运输和破碎工作。为了控制石墨矿山不同区域爆破块度分布,基于K-means无监督聚类学习法与熵权TOPSIS评价法建立了一种新的岩石可爆性评价模型,选取岩石密度、动力能量耗散率、动态抗压强... 露天矿山的爆破块度分布,直接影响到后续的采装、运输和破碎工作。为了控制石墨矿山不同区域爆破块度分布,基于K-means无监督聚类学习法与熵权TOPSIS评价法建立了一种新的岩石可爆性评价模型,选取岩石密度、动力能量耗散率、动态抗压强度、平均应变率、脆性指数作为评价指标,通过熵权计算,发现岩石破碎程度受脆性指数影响最大,受平均应变率影响最小。将此模型应用于实际石墨矿山,可爆性分为10个等级,统计不同分级下的岩石平均破碎粒径,发现可爆性分级等级越高平均粒径越大,有明显的分级特征,验证了模型的有效性。从爆破石墨矿石岩体类型看,岩石可爆性从易到难排序为:片岩、片麻岩、变粒岩、混合岩。结合石墨矿石微观观测结果分析可知:岩性从片岩向混合岩转变,岩石内部石墨晶质呈下降趋势,石墨矿石可爆性等级也随之越来越高。岩石密度、能量耗散率、动态抗压强度之间呈线性正相关,岩石可爆性与平均应变率、脆性指数存在负相关性。研究成果为矿山矿岩可爆性评价提供了一条新思路,对露天矿山爆破块度优化具有一定的理论和实践指导意义。 展开更多
关键词 岩体爆破 可爆性评价 岩石力学 K-means算法 熵权TOPSIS评价
下载PDF
基于K-means算法的建筑群震害分析模型缩减方法
4
作者 陈夏楠 张令心 +1 位作者 林旭川 王祺 《世界地震工程》 北大核心 2024年第1期72-79,共8页
基于建筑群模型和弹塑性时程分析的精细化城市震害模拟技术能够为防震减灾及应急救援决策提供必要的依据和参考。为了减小城市建筑群震害模拟的计算量和计算时间,本文提出一种基于聚类算法的建筑群模型缩减方法。该方法采用K-means聚类... 基于建筑群模型和弹塑性时程分析的精细化城市震害模拟技术能够为防震减灾及应急救援决策提供必要的依据和参考。为了减小城市建筑群震害模拟的计算量和计算时间,本文提出一种基于聚类算法的建筑群模型缩减方法。该方法采用K-means聚类算法,首先基于建筑结构属性向量对建筑群进行聚类,将相似的建筑结构聚为一组;然后从每组选取一个代表建筑组成建筑群缩减模型,通过减少需要分析的建筑结构数量来减少建筑群震害模拟的计算量。本文对传统的K-means算法进行改进,通过设定组内建筑结构的差异上限自动调整聚类分组数量;提出将具体地震动作用下结构地震损伤指数作为结构属性向量进行聚类,并通过算例对比分别采用两种缩减模型,即基于损伤指数聚类的缩减模型与基于结构力学模型参数聚类的缩减模型,计算结构损伤状态准确程度。对比结果表明:在聚类分组数量相同的情况下,基于损伤指数的分组明显优于基于模型参数的分组,采用模型缩减方法能够在保证足够计算精度前提下显著减少建筑群震害模拟计算量和计算时间。 展开更多
关键词 城市建筑群 K-means算法 模型缩减 结构模型参数 地震损伤指数
下载PDF
光伏波动平抑下改进K-means的电池储能动态分组控制策略 被引量:1
5
作者 余洋 陆文韬 +3 位作者 陈东阳 刘霡 夏雨星 郑晓明 《电力系统保护与控制》 EI CSCD 北大核心 2024年第7期1-11,共11页
针对电池储能系统(battery energy storage system,BESS)进行光伏波动平抑时寿命损耗高及荷电状态(state of charge,SOC)一致性差的问题,提出了光伏波动平抑下改进K-means的BESS动态分组控制策略。首先,采用最小最大调度方法获取光伏并... 针对电池储能系统(battery energy storage system,BESS)进行光伏波动平抑时寿命损耗高及荷电状态(state of charge,SOC)一致性差的问题,提出了光伏波动平抑下改进K-means的BESS动态分组控制策略。首先,采用最小最大调度方法获取光伏并网指令。其次,设计了改进侏儒猫鼬优化算法(improved dwarf mongoose optimizer,IDMO),并利用它对传统K-means聚类算法进行改进,加快了聚类速度。接着,制定了电池单元动态分组原则,并根据电池单元SOC利用改进K-means将其分为3个电池组。然后,设计了基于充放电函数的电池单元SOC一致性功率分配方法,并据此提出BESS双层功率分配策略,上层确定电池组充放电顺序及指令,下层计算电池单元充放电指令。对所提策略进行仿真验证,结果表明,所设计的IDMO具有更高的寻优精度及更快的寻优速度。所提BESS平抑光伏波动策略在有效平抑波动的同时,降低了BESS运行寿命损耗并提高了电池单元SOC的均衡性。 展开更多
关键词 电池储能系统 波动平抑 功率分配 改进侏儒猫鼬优化算法 改进K-means聚类算法
下载PDF
基于主题词向量中心点的K-means文本聚类算法
6
作者 季铎 刘云钊 +1 位作者 彭如香 孔华锋 《计算机应用与软件》 北大核心 2024年第10期282-286,318,共6页
K-means由于其时间复杂度低运行速度快一直是最为流行的聚类算法之一,但是该算法在进行聚类时需要预先给出聚类个数和初始类中心点,其选取得合适与否会直接影响最终聚类效果。该文对初始类中心和迭代类中心的选取进行大量研究,根据决策... K-means由于其时间复杂度低运行速度快一直是最为流行的聚类算法之一,但是该算法在进行聚类时需要预先给出聚类个数和初始类中心点,其选取得合适与否会直接影响最终聚类效果。该文对初始类中心和迭代类中心的选取进行大量研究,根据决策图进行初始类中心的选择,利用每个类簇的主题词向量替代均值作为迭代类中心。实验表明,该文的初始点选取方法能够准确地选取初始点,且利用主题词向量作为迭代类中心能够很好地避免噪声点和噪声特征的影响,很大程度上地提高了K-means算法的性能。 展开更多
关键词 K-means 初始点 决策图 迭代类中心 主题词向量
下载PDF
基于特征分箱和K-Means算法的用户行为分析方法
7
作者 殷丽凤 路建政 《云南民族大学学报(自然科学版)》 CAS 2024年第2期251-257,共7页
针对网购用户所产生的购物行为进行分析,首先通过数据处理构建客户关系管理模型(RFM模型),在此模型的基础上采用特征分箱法和K-Means聚类两种方法对用户进行细分,并对2种模型结果进行比较分析,讨论二者的差异性和具体的应用范围和意义.... 针对网购用户所产生的购物行为进行分析,首先通过数据处理构建客户关系管理模型(RFM模型),在此模型的基础上采用特征分箱法和K-Means聚类两种方法对用户进行细分,并对2种模型结果进行比较分析,讨论二者的差异性和具体的应用范围和意义.其中,基于特征分箱法的RFM模型将变量转化到相似的尺度上并将变量离散化,使得用户分类标签更加清晰,也可依据各类标签分类出不同类型的用户.K-Means算法通过轮廓系数评估聚类算法质量以至于选取最优K值.本文实验分析结果可为运营商提供更加可靠直观的数据,使得运营商可以根据不同用户的不同行为进行市场细分,进而进行精准营销和服务设置. 展开更多
关键词 特征分箱 K-means算法 用户行为 RFM模型 网购
下载PDF
基于k-means聚类算法的兴义维蚋幼虫龄数的估算
8
作者 赵娜 王毅 +4 位作者 杨曜铭 吴慧 修江帆 寻慧 杨明 《贵州医科大学学报》 CAS 2024年第8期1120-1127,共8页
目的探讨基于k-means聚类算法估算兴义维蚋幼虫的龄数,以明确虫龄与日龄及鳃斑发育阶段的关系。方法采集贵州青岩河流中兴义维蚋虫卵,于实验室的蚋类饲养系统中培育至幼虫,每日收集幼虫至大量化蛹,持续20 d;收集到幼虫1112头,于体视显... 目的探讨基于k-means聚类算法估算兴义维蚋幼虫的龄数,以明确虫龄与日龄及鳃斑发育阶段的关系。方法采集贵州青岩河流中兴义维蚋虫卵,于实验室的蚋类饲养系统中培育至幼虫,每日收集幼虫至大量化蛹,持续20 d;收集到幼虫1112头,于体视显微镜下测量头壳长(HCW)、后颊长(PGL)、上颚基横骨长(MPL)及体长(BL),观察不同虫龄幼虫的破卵器、鳃斑及性腺的形态学特征,并判断其龄期、分析虫龄与日龄和鳃斑发育关系;选取具有明显腮斑发育的兴义维蚋幼虫10头、制作石蜡切片,采用HE染色鉴定精巢和卵巢、辅助确认性别鉴定结果;采用k-means聚类方法划分形态计量学数据、利用Brooks-Dyar定律检测k-means聚类结果,R语言下行聚类与Brooks-Dyar定律检验、t检验等,根据拟合度分析判断兴义维蚋幼虫龄数。结果1112头兴义维蚋幼虫中有破卵器89头,出现鳃斑发育334头,6~7龄幼虫320头,有预蛹特征34头;Brooks-Dyar定律与破卵器、鳃斑形态特征显示7龄幼虫假设符合昆虫幼虫生长规律;组织学观察见幼虫精巢为椭圆形、体积大、外有几丁质层包裹,卵巢为长条形、体积小、后端有色素细胞包裹;鉴定6、7龄幼虫性别结果,仅7龄幼虫雌雄性PGL有差异(P<0.05);幼虫虫龄与日龄、鳃斑发育关系结果显示,约2~3 d对应1个幼虫生长龄期,第17天首见幼虫蛹化,6龄幼虫出现明显的鳃斑。结论兴义维蚋幼虫具7龄,实验室下幼虫发育约需3周,最短17 d;腮斑发育起始于6龄,7龄出现明显形态学特征。 展开更多
关键词 蚋科 组织学 性腺 龄数 形态计量学 K-means聚类
下载PDF
管制扇区运行稳度K-means聚类与分析
9
作者 岳仁田 杨果果 《中国安全科学学报》 CAS CSCD 北大核心 2024年第7期98-104,共7页
为更好地分析管制扇区运行存在的稳定亚安全状态和不稳定亚安全状态,使用K-means算法划分超容比(ECR)、滞留度和飞行姿态混合比3个管制扇区运行稳度评价指标聚类,确定管制扇区运行稳度最佳等级划分;聚类分析单一指标,获得各等级对应的... 为更好地分析管制扇区运行存在的稳定亚安全状态和不稳定亚安全状态,使用K-means算法划分超容比(ECR)、滞留度和飞行姿态混合比3个管制扇区运行稳度评价指标聚类,确定管制扇区运行稳度最佳等级划分;聚类分析单一指标,获得各等级对应的指标阈值,结合熵权法计算的指标权重,遵循隶属度最大原则,获取各时间段的管制扇区运行稳度等级,构建管制扇区运行稳度综合评价模型;选取厦门01号扇区的实际飞行数据,从稳度和趋度2个角度更加全面地分析管制扇区运行态势。结果表明:管制扇区运行稳度等级划分为3类时效果最好;稳度受空中交通流和管制状况的影响会随时间而变化,尤其7:30—9:15和20:00—21:00这2个时间段管制扇区运行稳度的变化最为明显,需引起管制员高度重视,提高空域运行安全。 展开更多
关键词 管制扇区 运行稳度 趋度 K-means聚类 综合评价
下载PDF
基于改进K-means与机器视觉的档案数据分析技术
10
作者 崔雨晴 《电子设计工程》 2024年第2期191-195,共5页
为了提升医疗信息系统对健康档案数据的分析效率,文中采用图像采集、降噪、配准与差分等技术提取医疗图像信息,进而有效提升信息系统的数据采集效率。同时还对传统的K-means算法加以改进,并提出了一种基于类间、类内距离的聚类初始化评... 为了提升医疗信息系统对健康档案数据的分析效率,文中采用图像采集、降噪、配准与差分等技术提取医疗图像信息,进而有效提升信息系统的数据采集效率。同时还对传统的K-means算法加以改进,并提出了一种基于类间、类内距离的聚类初始化评价指标体系(BWP),将其应用于采集到的档案数据中,以实现快速的聚类分析。将所提算法在CUDA计算平台上进行了实现,测试结果表明,该方法的聚类精度和运行效率较现有算法均有显著提升。此外,改进后K-means算法的正确聚类样本数量占比提升了4.88%,高于现有的主流指标体系,且当聚类数k的取值为16或32时,运行时间大幅降低。 展开更多
关键词 档案数据 K-means CUDA 机器视觉 图像处理
下载PDF
基于改进K-means的局部离群点检测方法
11
作者 周玉 夏浩 +1 位作者 岳学震 王培崇 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第4期66-77,共12页
离群点检测任务是指检测与正常数据在特征属性上存在显著差异的异常数据。大多数基于聚类的离群点检测方法主要从全局角度对数据集中的离群点进行检测,而对局部离群点的检测性能较弱。基于此,本文通过引入快速搜索和发现密度峰值方法改... 离群点检测任务是指检测与正常数据在特征属性上存在显著差异的异常数据。大多数基于聚类的离群点检测方法主要从全局角度对数据集中的离群点进行检测,而对局部离群点的检测性能较弱。基于此,本文通过引入快速搜索和发现密度峰值方法改进K-means聚类算法,提出了一种名为KLOD(local outlier detection based on improved K-means and least-squares methods)的局部离群点检测方法,以实现对局部离群点的精确检测。首先,利用快速搜索和发现密度峰值方法计算数据点的局部密度和相对距离,并将二者相乘得到γ值。其次,将γ值降序排序,利用肘部法则选择γ值最大的k个数据点作为K-means聚类算法的初始聚类中心。然后,通过K-means聚类算法将数据集聚类成k个簇,计算数据点在每个维度上的目标函数值并进行升序排列。接着,确定数据点的每个维度的离散程度并选择适当的拟合函数和拟合点,通过最小二乘法对升序排列的每个簇的每1维目标函数值进行函数拟合并求导,以获取变化率。最后,结合信息熵,将每个数据点的每个维度目标函数值乘以相应的变化率进行加权,得到最终的异常得分,并将异常值得分较高的top-n个数据点视为离群点。通过人工数据集和UCI数据集,对KLOD、LOF和KNN方法在准确度上进行仿真实验对比。结果表明KLOD方法相较于KNN和LOF方法具有更高的准确度。本文提出的KLOD方法能够有效改善K-means聚类算法的聚类效果,并且在局部离群点检测方面具有较好的精度和性能。 展开更多
关键词 离群点检测 K均值聚类 最小二乘法 密度峰值 目标函数值
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
12
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 K-means聚类 特征空间增强 mixup算法
下载PDF
基于改进K-means算法的物流配送中心选址研究 被引量:1
13
作者 姚佼 吴秀荣 +3 位作者 李皓 谢贝贝 王诗璇 梁益铭 《物流科技》 2024年第5期10-13,19,共5页
针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类... 针对传统K-means算法需要主观设定K值及无法处理类别型数据问题,文章运用肘部法及轮廓系数法确定合理K值,对类别型数据采取独热编码(One-Hot Encoding)转换为可以处理的连续型数据,并将其运用到在物流配送中心选址中;并综合考虑多种类别的影响因素,构建了相应的影响因素指标体系,提出的模型能够识别输入数据的数值型及类别型数据,实现样本的有效聚类。相关的案例分析结果表明,相比传统K-means聚类,文章的改进K-means算法选址结果可使物流总成本降低8.76%,运营成本降低14.85%,固定成本降低8.09%,效果显著。 展开更多
关键词 物流配送中心选址 K-means聚类算法 肘部法 轮廓系数法 独热编码
下载PDF
基于马氏距离和Canopy改进K-means的交通聚类算法
14
作者 徐文进 马越 杜咏慧 《计算机与数字工程》 2024年第6期1630-1635,1649,共7页
在对交通数据的研究中经常会使用到聚类算法,且不同的聚类算法有不同的特性。K-means作为其中的一种聚类算法,具有较高的准确性和实用性,但其准确性易受主观选取K值和确定初始聚类中心的影响。为了优化聚类中心和K值的选取问题,提出MC-K... 在对交通数据的研究中经常会使用到聚类算法,且不同的聚类算法有不同的特性。K-means作为其中的一种聚类算法,具有较高的准确性和实用性,但其准确性易受主观选取K值和确定初始聚类中心的影响。为了优化聚类中心和K值的选取问题,提出MC-Kmeans算法。在所提方法中,首先通过Canopy算法选取K值,然后依据马氏距离的计算准则来确定初始聚类中心,最后将K值和聚类中心的值作为K-means的参数进行聚类。将MC-Kmeans算法应用到某时间段的纽约出租车交通数据中进行实际的验证。结果表明,与K-means算法比较,所提方法准确度更高,与实际交通情况更加相匹配,更能反映区域内的交通热点情况。 展开更多
关键词 K-means Canopy算法 马氏距离 交通
下载PDF
结合Lee滤波的NL-Means声呐图像滤波方法
15
作者 田原嫄 雷玉峰 郭海涛 《河南科技学院学报(自然科学版)》 2024年第5期46-52,共7页
声呐图像中存在的散斑噪声不仅极大地影响了图像质量,还对图像的后续分割、增强、边缘检测等增加了很多负面影响.针对这一问题,提出了结合Lee滤波的NL-Means算法:先用Lee滤波算法对声呐图像进行一次滤波,再用滤波后的图像计算NL-Means... 声呐图像中存在的散斑噪声不仅极大地影响了图像质量,还对图像的后续分割、增强、边缘检测等增加了很多负面影响.针对这一问题,提出了结合Lee滤波的NL-Means算法:先用Lee滤波算法对声呐图像进行一次滤波,再用滤波后的图像计算NL-Means算法中的权重部分的权值,最后用NL-Means算法结合该权重进行滤波.改进的滤波方法避免了权重计算过程中由于噪声的影响而使导致权重偏小的问题,精确了NL-Means算法中的权重分配.实验证明,改进方法对声呐图像的散斑噪声不仅有更好的抑制效果,还提升了图像的质量. 展开更多
关键词 声呐图像滤波 Lee滤波 NL-means算法 评价指标
下载PDF
基于改进K-means聚类和遗传算法的混合算法求解异构车辆路径问题
16
作者 吴麟麟 吕一鸣 +1 位作者 何美玲 韩珣 《物流技术》 2024年第7期48-62,共15页
由于目前单一车型配送存在资源浪费和效率低下等问题,选取确定数量的不同车型对各客户点进行配送服务往往可以得到更优的配送路径方案。针对这一点,描述了一种异构车辆路径问题,并建立了具有固定车辆数且考虑固定成本、可变成本以及时... 由于目前单一车型配送存在资源浪费和效率低下等问题,选取确定数量的不同车型对各客户点进行配送服务往往可以得到更优的配送路径方案。针对这一点,描述了一种异构车辆路径问题,并建立了具有固定车辆数且考虑固定成本、可变成本以及时间窗惩罚成本的混合整数规划模型。同时,提出了一种基于改进K-means聚类和遗传算法的混合算法对模型进行求解。实验仿真先求解不考虑时间窗的问题初步证明混合算法的有效性,再在带时间窗的问题中求解不同规模算例的单一及异构车型结果,以证明异构车型配送更优。最后,对该混合算法的求解结果与其他混合算法的求解结果进行对比分析,证明了混合算法的优越性。研究结果表明:该混合算法求解的异构车型结果优于单一车型,并且比其他混合算法求解的异构车型结果更优,异构车辆配送使用的配送车辆数更少,总成本也更低,该混合算法具有更好的效率和性能。 展开更多
关键词 异构车辆路径问题 改进K-means聚类算法 遗传算法 混合算法
下载PDF
启发式k-means聚类算法的改进研究
17
作者 殷丽凤 栗庆杰 《大连交通大学学报》 CAS 2024年第2期115-119,共5页
启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结... 启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。 展开更多
关键词 聚类算法 K-means 启发式算法 仔细播种 局部异常因子 离群点
下载PDF
基于改进K-means数据聚类算法的网络入侵检测 被引量:1
18
作者 黄俊萍 《成都工业学院学报》 2024年第2期58-62,97,共6页
随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算... 随着入侵手段的不断更新和升级,传统入侵检测方法准确率下降、检测时间延长,无法满足网络防御要求。为此,提出一种经过改进K均值(K-means)数据聚类算法,以应对不断升级的网络入侵行为。先以防火墙日志为基础转换数值,然后基于粒子群算法求取最优初始聚类中心,实现K-means数据聚类算法的改进;最后以计算得出的特征值为输入项,实现对网络入侵行为的精准检测。结果表明:K-means算法改进后较改进前的戴维森堡丁指数更小,均低于0.6,达到了改进目的。改进K-means算法各样本的准确率均高于90%,相对更高,检测时间均低于10 s,相对更少,说明该方法能够以高效率完成更准确的网络入侵检测。 展开更多
关键词 改进K-means数据聚类算法 防火墙日志 入侵检测特征 粒子群算法 网络入侵检测
下载PDF
改进k-means的多域光纤通信非线性失真补偿方法
19
作者 赵淑君 刘伟 《激光杂志》 CAS 北大核心 2024年第5期182-186,共5页
为了解决光纤通信信号在传输过程中受到非线性影响而产生的失真问题,提高光纤通信系统的稳定性,提出了改进k-means的多域光纤通信非线性失真补偿方法。构建多域光纤通信传输模型,在传输端利用波长转换器将输入信号传输到光纤,结合干扰... 为了解决光纤通信信号在传输过程中受到非线性影响而产生的失真问题,提高光纤通信系统的稳定性,提出了改进k-means的多域光纤通信非线性失真补偿方法。构建多域光纤通信传输模型,在传输端利用波长转换器将输入信号传输到光纤,结合干扰原理线性化脉冲恢复光信号。以信噪比描述光纤通信的色散特性,明确信号交互出现非线性失真变化。通过Dijkstra方法改进k-means方法,解调失真星座,避免聚类陷入局部最优,使全部簇信号尽可能接近原始调制中心,实现失真补偿。实验结果表明:利用所提方法对光纤通信非线性失真进行补偿后,聚类效果较佳,信息误码率可降至10^(-7),有效减少了网络传输消耗,提高光纤通信信号质量。 展开更多
关键词 改进k-means方法 多域光纤通信 非线性失真补偿 Dijkstra方法 马可科夫方程
下载PDF
基于信息熵和Canopy-K-Means算法的货车驾驶风格识别
20
作者 李浩 王肇飞 李微 《交通工程》 2024年第7期123-128,共6页
为识别货车的激进驾驶行为,保障货车行车安全,提出1种基于信息熵和Canopy-K-Means算法的货车驾驶风格识别方法。首先,从货车自然驾驶数据中提取出604个驾驶片段,根据信息熵理论计算各个驾驶片段的速度熵值、横向加速度熵值和纵向加速度... 为识别货车的激进驾驶行为,保障货车行车安全,提出1种基于信息熵和Canopy-K-Means算法的货车驾驶风格识别方法。首先,从货车自然驾驶数据中提取出604个驾驶片段,根据信息熵理论计算各个驾驶片段的速度熵值、横向加速度熵值和纵向加速度熵值,构成货车驾驶风格表征指标集;其次,针对K-Means算法的聚类数量主观选取、初始聚类中心随机选取的问题,使用Canopy算法改进K-Means算法(Canopy-K-Means算法);最后,分别使用K-Means算法和Canopy-K-Means算法对货车驾驶风格进行识别。研究结果显示,Canopy-K-Means算法的轮廓系数和Calinski-Harabasz指数均大于K-Means算法,表现出更优的聚类性能。根据Canopy-K-Means算法,可将货车驾驶风格分为沉稳型、常规型和激进型3类,其中激进型货车驾驶风格的指标熵值和极差均较大,存在较高的安全隐患,需要引起相关部门的高度重视。 展开更多
关键词 交通工程 驾驶风格 Canopy-K-means算法 信息熵 货车
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部