期刊文献+
共找到269篇文章
< 1 2 14 >
每页显示 20 50 100
一种改进的K—means算法在入侵检测中的应用 被引量:3
1
作者 王彦涛 张凤斌 《电脑知识与技术》 2009年第12期9824-9827,共4页
传统的聚类算法存在很多缺点,因此需要做进一步的研究。通过对传统的K-means算法和加权熵措施的K—means算法的研究,提出了一种改进的加权熵措施的K—means算法,且该算法采用了一种新的计算对象间距离的方法,不仅能使在同一个簇中... 传统的聚类算法存在很多缺点,因此需要做进一步的研究。通过对传统的K-means算法和加权熵措施的K—means算法的研究,提出了一种改进的加权熵措施的K—means算法,且该算法采用了一种新的计算对象间距离的方法,不仅能使在同一个簇中任意对象之间的距离尽可能的小,更能使得不同簇中的任意对象之间的距离尽可能的大。通过在KDD Cup99数据集上实验仿真,表明该算法具有较强的实用性和自适应功能。 展开更多
关键词 网络安全 数据挖掘 入侵检测 加权熵 k—means算法
下载PDF
基于Tukey规则与初始中心点优化的K⁃means聚类改进算法 被引量:2
2
作者 柳菁 邱紫滢 +1 位作者 郭茂祖 余冬华 《数据采集与处理》 CSCD 北大核心 2023年第3期643-651,共9页
针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,... 针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K⁃means++聚类算法,有效地提升了聚类性能。 展开更多
关键词 数据挖掘 kmeans聚类算法 Tukey规则 中心点优化
下载PDF
改进的k-means聚类算法在客户细分中的应用研究 被引量:8
3
作者 杜巍 赵春荣 黄伟建 《河北经贸大学学报》 CSSCI 北大核心 2014年第1期118-121,共4页
聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业... 聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业能够更合理地细分、规划客户群组,针对不同需求的客户群体进行区别对待,得到了较好的效果,验证了改进算法的可行性和高效性。 展开更多
关键词 聚类分析 客户细分 数据挖掘 改进的k—means算法 客户群
下载PDF
一种K-means改进算法的并行化实现与应用 被引量:49
4
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行k—means 文本聚类
下载PDF
基于微博舆情监测的K-Means算法改进研究 被引量:17
5
作者 朱晓峰 陈楚楚 尹婵娟 《情报理论与实践》 CSSCI 北大核心 2014年第1期136-140,共5页
在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚... 在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚类稳定性均明显改善,微博舆情监测的质量大幅度提高。 展开更多
关键词 微博 网络舆情 k—means算法
下载PDF
基于学术文献同被引分析的K-means算法改进研究 被引量:4
6
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《情报学报》 CSSCI 北大核心 2012年第1期82-94,共13页
K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被... K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类。算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K—means算法的初始聚类中心。第二步聚类则依据文献内容实现K-means算法。实验通过与经典K—means算法和基于凝聚层次聚类算法的改进K—means算法的对比,证明了本文提出的改进的K—means算法具备更优的聚类效果。 展开更多
关键词 k—means算法 k 初始聚类中心 同被引 文献聚类
下载PDF
K-Means算法的研究与改进 被引量:19
7
作者 周爱武 陈宝楼 王琰 《计算机技术与发展》 2012年第10期101-104,共4页
K-Means算法是一种基于划分方法的经典聚类算法,已经在很多领域得到广泛的应用。虽然该算法有很多优点,但其也存在自身的局限性,比如需要用户输入聚类簇个数,初始聚类中心是随机性选择的,算法容易陷入局部最优解,对孤立点比较敏感等。... K-Means算法是一种基于划分方法的经典聚类算法,已经在很多领域得到广泛的应用。虽然该算法有很多优点,但其也存在自身的局限性,比如需要用户输入聚类簇个数,初始聚类中心是随机性选择的,算法容易陷入局部最优解,对孤立点比较敏感等。文中首先应用统计学中的标准分数对样本进行孤立点分析,然后提出一种新的初始聚类中心确定策略。对改进的算法和原算法分别做实验进行比较,实验结果表明,改进的算法在准确率、收敛速度和稳定性方面都有很大的提高。 展开更多
关键词 k—means算法 孤立点 初始聚类中心
下载PDF
一种K-means聚类算法的改进与应用 被引量:20
8
作者 张杰 卓灵 朱韵攸 《电子技术应用》 北大核心 2015年第1期125-128,131,共5页
K-means算法是基于距离作为相似性度量的聚类算法,传统的K-means算法存在难以确定中心值个数、受噪声及孤立点影响较大的缺点。对此,利用类间相异度与类内相异度改进初始值K,以尽量减少人工干预;同时计算数据库中每一点与剩余点的距离... K-means算法是基于距离作为相似性度量的聚类算法,传统的K-means算法存在难以确定中心值个数、受噪声及孤立点影响较大的缺点。对此,利用类间相异度与类内相异度改进初始值K,以尽量减少人工干预;同时计算数据库中每一点与剩余点的距离和距离均和,将两者的大小比较作为识别孤立点和噪声点的依据,从而删除孤立点,减少对数据聚类划分的影响。最后将改进后的Kmeans算法应用于入侵检测系统并进行仿真实验,结果表明,基于改进的K-means算法的入侵检测系统一定程度上降低了误报率及误检率,提高了检测的准确率。 展开更多
关键词 数据挖掘 聚类算法 k—means 入侵检测
下载PDF
基于初始聚类中心优化和维间加权的改进K-means算法 被引量:7
9
作者 王越 王泉 +1 位作者 吕奇峰 曾晶 《重庆理工大学学报(自然科学)》 CAS 2013年第4期77-80,共4页
针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-m... 针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析。实验证明:改进后的算法稳定,且聚类的准确率达到了92%。 展开更多
关键词 聚类 k—means算法 初始聚类中心 维间加权 Iris数据集
下载PDF
一种基于改进PSO的K-means优化聚类算法 被引量:26
10
作者 谢秀华 李陶深 《计算机技术与发展》 2014年第2期34-38,共5页
针对传统的K-means算法对初始聚类中心的选取敏感、容易收敛到局部最优的缺点,提出一种基于改进粒子群优化算法(PSO)的K-means优化聚类算法。该算法利用PSO算法强大的全局搜索能力对初始聚类中心的选取进行优化:通过动态调整惯性权重等... 针对传统的K-means算法对初始聚类中心的选取敏感、容易收敛到局部最优的缺点,提出一种基于改进粒子群优化算法(PSO)的K-means优化聚类算法。该算法利用PSO算法强大的全局搜索能力对初始聚类中心的选取进行优化:通过动态调整惯性权重等参数增强PSO算法的性能;利用群体适应度方差决定算法中前部分PSO算法和后部分Kmeans算法的转换时机;设置变量实时监控各个粒子和粒子群的最优值变化情况,及时地对出现早熟收敛的粒子进行变异操作,从而为K-means算法搜索到全局最优的初始聚类中心,使聚类结果不受初始聚类中心影响,易于获得全局最优解。实验结果表明文中提出的改进算法与传统聚类算法相比具有更高的聚类正确率、更好的聚类质量及全局搜索能力。 展开更多
关键词 聚类 k—means算法 粒子群优化算法 全局最优
下载PDF
基于2d-距离改进的K-means聚类算法研究 被引量:8
11
作者 陈福集 蒋芳 《太原理工大学学报》 CAS 北大核心 2012年第2期114-118,共5页
为了解决原始K-means算法随机选取聚类中心对聚类结果产生较大影响的不足和孤立点的存在对聚类精度的破坏,以及两者之间的相互牵制性,采用基于2d-距离的DKC值来对原始样本数据集进行预处理以分辨孤立点,同时确定初始的聚类中心,达到消... 为了解决原始K-means算法随机选取聚类中心对聚类结果产生较大影响的不足和孤立点的存在对聚类精度的破坏,以及两者之间的相互牵制性,采用基于2d-距离的DKC值来对原始样本数据集进行预处理以分辨孤立点,同时确定初始的聚类中心,达到消除两者相互影响的效果,使得聚类中心相对稳定,改进后的算法较原始的算法在准确度上得到了改进。 展开更多
关键词 2d距离 k—means算法 初始点选取 孤立点
下载PDF
一种改进的K-means蚁群聚类算法 被引量:11
12
作者 李振 贾瑞玉 《计算机技术与发展》 2015年第12期28-31,共4页
现有的K-means蚁群聚类算法,首先进行K-means聚类算法操作,快速、粗略地确定初始聚类中心,接着根据上一步获得的聚类中心再进行蚁群算法聚类操作,有效地解决蚁群聚类算法收敛速度过慢的问题。研究发现,现有的Kmeans蚁群聚类算法并没有... 现有的K-means蚁群聚类算法,首先进行K-means聚类算法操作,快速、粗略地确定初始聚类中心,接着根据上一步获得的聚类中心再进行蚁群算法聚类操作,有效地解决蚁群聚类算法收敛速度过慢的问题。研究发现,现有的Kmeans蚁群聚类算法并没有改善算法在迭代后期易出现收敛于非全局最优的缺陷。针对这一问题,提出一种改进的Kmeans蚁群聚类算法。每次迭代结束时,随机选择一个或多个簇,再从选中的簇里选择含有信息素最小的节点进行变异操作,把选中的节点变异到其他簇,计算评价值判断变异是否进行。仿真实验结果表明,用F值表示的平均值和最差结果都比原有的算法较好,有效解决了原有算法易收敛于非全局最优及早熟问题,但由于变异操作使算法运行时间相对较长。 展开更多
关键词 聚类 k—means算法 蚁群聚类算法 聚类组合 变异
下载PDF
基于k-Means改进算法的分布式拒绝服务攻击检测 被引量:4
13
作者 刘运 殷建平 +1 位作者 程杰仁 蔡志平 《计算机工程与科学》 CSCD 2008年第12期23-26,共4页
分布式拒绝服务(DDoS)攻击是当前主要的网络安全威胁之一。本文分析了DDoS攻击的本质特征,提出了结合流量及流特征分布熵的检测策略,并根据问题需要改进了k-means聚类算法,并用之建立攻击检测模型。最后,使用LLDOS1.0数据集对该模型进... 分布式拒绝服务(DDoS)攻击是当前主要的网络安全威胁之一。本文分析了DDoS攻击的本质特征,提出了结合流量及流特征分布熵的检测策略,并根据问题需要改进了k-means聚类算法,并用之建立攻击检测模型。最后,使用LLDOS1.0数据集对该模型进行测试。实验结果表明,该模型具有良好的检测精度,验证了检测策略的有效性。 展开更多
关键词 分布式拒绝服务攻击 流特征分布熵 k—means聚类算法
下载PDF
一种改进的K-means算法 被引量:6
14
作者 尹宝勇 吴斌 刘建生 《江西理工大学学报》 CAS 2018年第5期97-102,共6页
通过分析传统K-means算法难以确定聚类中心数目的问题,提出了一种改进的K-means聚类算法(CS-kmeans).该算法分析当聚类效果较好时最大类内距离与最小类间距离之间的关系,使用类内距离小于最小类间距离以及类间距离大于最大类内距离实现... 通过分析传统K-means算法难以确定聚类中心数目的问题,提出了一种改进的K-means聚类算法(CS-kmeans).该算法分析当聚类效果较好时最大类内距离与最小类间距离之间的关系,使用类内距离小于最小类间距离以及类间距离大于最大类内距离实现对类别数的自动分割与合并,从而确定适当的聚类数目.实验结果表示,文中改进后的算法相比传统K-means算法和其他改进算法,对于确定聚类中心数目、提高聚类质量是更为有效的. 展开更多
关键词 k—means算法 类间距离 类内距离
下载PDF
基于MPE和改进K⁃means算法的分接开关机械故障诊断方法 被引量:11
15
作者 马宏忠 徐艳 魏海增 《高压电器》 CAS CSCD 北大核心 2020年第8期198-204,共7页
随着有载调压变压器在电网应用的增多以及有载分接开关(on⁃load tap⁃changer,OLTC)频繁地调节,分接开关的故障率在不断增加。为更有效进行OLTC机械故障诊断,提出一种基于MPE和改进K⁃means算法的OLTC机械故障诊断方法。首先,模拟OLTC的... 随着有载调压变压器在电网应用的增多以及有载分接开关(on⁃load tap⁃changer,OLTC)频繁地调节,分接开关的故障率在不断增加。为更有效进行OLTC机械故障诊断,提出一种基于MPE和改进K⁃means算法的OLTC机械故障诊断方法。首先,模拟OLTC的不同机械故障,采集振动信号;其次,为实现非线性振动信号下OLTC的故障诊断,采用多尺度排列熵(MPE)进行OLTC机械故障状态的特征提取;再次,采用粒子群(PSO)优化的K⁃means聚类算法诊断OLTC机械故障;最后,将该方法用于OLTC的机械故障诊断,并与传统K⁃means算法以及BP网络的诊断效果进行对比。结果表明,提出的基于MPE和改进K⁃means算法适用于OLTC机械故障诊断,诊断效果优于传统K⁃means算法以及BP网络,且其稳定性较高。 展开更多
关键词 OLTC kmeans算法 粒子群优化的kmeans算法 多尺度排列熵
下载PDF
改进的K-Means聚类算法在保险客户信用分析中的算法实现 被引量:2
16
作者 宋加升 陈琰 《哈尔滨理工大学学报》 CAS 北大核心 2009年第1期116-119,共4页
针对保险业对客户信息的分析中缺乏考虑客户信用分析的问题,根据聚类分析算法理论和保险公司客户数据库特点,进一步对K-means聚类算法在大样本环境下初始聚类中心的选取提出有效改进,同时选取一家财产保险公司的客户信用数据,来探讨聚... 针对保险业对客户信息的分析中缺乏考虑客户信用分析的问题,根据聚类分析算法理论和保险公司客户数据库特点,进一步对K-means聚类算法在大样本环境下初始聚类中心的选取提出有效改进,同时选取一家财产保险公司的客户信用数据,来探讨聚类算法在保险客户信用分析中的应用. 展开更多
关键词 聚类分析 k—means聚类算法 保险客户
下载PDF
改进的K-means算法在入侵检测中的应用 被引量:3
17
作者 黎银环 张剑 《计算机技术与发展》 2013年第1期165-168,共4页
传统K-means聚类算法存在初始聚类中心选取敏感且需要预先设定聚类数等不足,导致入侵检测效率较低。为了提高入侵检测的准确性,提出一种改进的K-means算法。采用分离预处理记录属性的方法,在随机抽取的数据子集中基于密度距离生成初始... 传统K-means聚类算法存在初始聚类中心选取敏感且需要预先设定聚类数等不足,导致入侵检测效率较低。为了提高入侵检测的准确性,提出一种改进的K-means算法。采用分离预处理记录属性的方法,在随机抽取的数据子集中基于密度距离生成初始聚类中心;利用类内最大相似度距离和类间最小相似度距离动态生成新类而无须事先确定K值。通过KDDCUP99数据集仿真实验表明,与传统的K-means聚类算法相比,改进的K-means算法有效提高了入侵检测的检测率,降低了误检率,缩短了检测时间。 展开更多
关键词 入侵检测 聚类算法 k—means算法
下载PDF
基于改进后的K-means算法研究根据酿酒葡萄和葡萄酒的理化指标对红葡萄酒的分级方法 被引量:1
18
作者 黄鸿基 钱圳冰 +1 位作者 冯帆 周行洲 《中国市场》 2017年第16期196-197,共2页
文章研究的是葡萄酒的根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级和分析酿酒葡萄及葡萄酒的理化指标对葡萄酒质量的影响。首先研究筛选了一组合理的葡萄酒样本进行了标准化处理。分别建立了Kmeans分析模型去进行样... 文章研究的是葡萄酒的根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级和分析酿酒葡萄及葡萄酒的理化指标对葡萄酒质量的影响。首先研究筛选了一组合理的葡萄酒样本进行了标准化处理。分别建立了Kmeans分析模型去进行样本分析。为了得到明确的评估指标,研究改进了K-means算法,结合主成分分析的原理,得到了PCA-K-means模型。研究把酿酒葡萄分成了四类,而葡萄酒分成了五类。 展开更多
关键词 聚类分析 主成分分析 k—means算法
下载PDF
一种基于复合形粒子群算法的改进k-means聚类算法 被引量:2
19
作者 易云飞 吴启明 唐凤仙 《软件导刊》 2008年第10期46-48,共3页
针对k-means算法事先必须知道聚类的数目,难以确定初始中心以及受异常点影响很大等缺点,提出了一种改进的k-means聚类算法。改进后的算法首先使用复合形粒子群算法来选取聚类的初始中心点,然后使用k-means算法快速收敛获取聚类结果。Iri... 针对k-means算法事先必须知道聚类的数目,难以确定初始中心以及受异常点影响很大等缺点,提出了一种改进的k-means聚类算法。改进后的算法首先使用复合形粒子群算法来选取聚类的初始中心点,然后使用k-means算法快速收敛获取聚类结果。Iris测试数据集的实验结果表明了改进后的算法能够合理区分不同类型的簇集,可以有效地识别异常点,具有较好的性能。 展开更多
关键词 复合形法 粒子群优化算法 k—means算法 聚类
下载PDF
改进K-means聚类算法在高校团组织建设中的应用研究 被引量:2
20
作者 易云飞 黄泽 李林 《软件导刊》 2009年第10期70-72,共3页
由于价值观念的多元化,各种思想对青年大学生产生冲击等多种原因,团组织在高校共青团员中影响力不断弱化,地位逐渐降低。试图将改进的K-means聚类算法用于高校团组织的建设中,为建立更加适合高校学生的基层团组织提供科学的依据。
关键词 团组织建设 粒子群 k—means算法
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部