期刊文献+
共找到16,194篇文章
< 1 2 250 >
每页显示 20 50 100
基于改进的K-means算法的关联规则数据挖掘研究 被引量:35
1
作者 李珺 刘鹤 朱良宽 《小型微型计算机系统》 CSCD 北大核心 2021年第1期15-19,共5页
关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产... 关联规则是数据挖掘中的概念,通过分析数据找到数据之间的关联.海量数据会产生大量冗余和相似的关联规则,影响用户对规则的理解和判断.本文采用鸢尾花数据集进行实验.建立三个检验指标,删除冗余关联规则;在进行K-means分析时利用规则产生的三角形迭代选择初始点,再将删除冗余后的规则进行聚类.实验证实本文方法将相似的关联规则归为一簇,能有效的帮助用户迅速找到有用的关联规则,有助于用户更好的对规则进行理解和分析,提高了聚类的效率. 展开更多
关键词 k-means算法 关联规则 聚类算法 鸢尾花数据集
下载PDF
一种改进的K-means算法 被引量:73
2
作者 张玉芳 毛嘉莉 熊忠阳 《计算机应用》 CSCD 北大核心 2003年第8期31-33,60,共4页
聚类分析在科研和商业应用中都有着非常重要的应用,K means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K means算法的局限性日益突出。基于取样的划分思想,提出了一种改进的K means算法,在一定程度上避免了聚类结果陷入局... 聚类分析在科研和商业应用中都有着非常重要的应用,K means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K means算法的局限性日益突出。基于取样的划分思想,提出了一种改进的K means算法,在一定程度上避免了聚类结果陷入局部解的现象,减少了原始K means算法因采用误差平方和准则函数而出现将大的聚类簇分割开的情况,仿真实验结果表明:改进后的K means算法优于原始算法,并且稳定性更好。 展开更多
关键词 聚类 k-means算法 误差平方和准则函数
下载PDF
基于一种改进的K-means算法的校园网用户行为分析研究 被引量:9
3
作者 皇甫大鹏 陈平 王兴建 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第A01期69-72,共4页
随着师生对网络流量需求的迅速增长,如何合理的增加用户的流量,既能满足用户的基本上网需求,又能合理利用出口带宽。本文基于一种改进的K-means聚类算法,以校园网用户的行为特征为对象进行聚类,为优化用户计费策略和合理的分配出口带宽... 随着师生对网络流量需求的迅速增长,如何合理的增加用户的流量,既能满足用户的基本上网需求,又能合理利用出口带宽。本文基于一种改进的K-means聚类算法,以校园网用户的行为特征为对象进行聚类,为优化用户计费策略和合理的分配出口带宽提供了数据依据,为校园网用户个性化需求方面提供理论依据。 展开更多
关键词 用户行为 聚类算法 k-means
下载PDF
一种改进的K-Means算法 被引量:14
4
作者 尹成祥 张宏军 +2 位作者 张睿 綦秀利 王彬 《计算机技术与发展》 2014年第10期30-33,共4页
针对典型K-Means算法随机选取初始中心点导致的算法迭代次数过多的问题,采取数据分段方法,将数据点根据距离分成k段,在每段内选取一个中心作为初始中心点,进行迭代运算;为寻找最优的聚类数目k,定义了新的聚类有效性函数—聚类指数,包含... 针对典型K-Means算法随机选取初始中心点导致的算法迭代次数过多的问题,采取数据分段方法,将数据点根据距离分成k段,在每段内选取一个中心作为初始中心点,进行迭代运算;为寻找最优的聚类数目k,定义了新的聚类有效性函数—聚类指数,包含聚类紧密度和聚类显著度两个指标,通过最优化聚类指数,在[1,n(1/2)]内寻找最优的k值。在IRIS数据集进行的仿真实验结果表明,算法的迭代次数明显减少,寻找的最优k值接近数据集的真实情况,算法有效性得到了验证。 展开更多
关键词 k-means算法 分段 聚类指数 紧密度 显著度
下载PDF
改进的K-means算法在电信客户细分中的应用 被引量:6
5
作者 耿筱媛 张燕平 闫屹 《计算机技术与发展》 2008年第5期163-167,共5页
在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的。针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度... 在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的。针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度。采用改进后K-means聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,通过与统计分析的对比,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持。 展开更多
关键词 数据挖掘 聚类算法 k-means算法 准则函数
下载PDF
基于量子蚁群改进的K-means算法 被引量:3
6
作者 郝春梅 吴波 《计算机测量与控制》 北大核心 2013年第4期1011-1013,共3页
传统的K-means算法局部搜索能力强,但是对初始化比较敏感,并且容易陷入局部最优值,这些缺陷严重限制了它的应用范围;针对目前普遍所存在的问题,本文提出一种改进的基于量子蚁群的聚类方法,将量子计算原理和蚂蚁算法结合来改进K-means算... 传统的K-means算法局部搜索能力强,但是对初始化比较敏感,并且容易陷入局部最优值,这些缺陷严重限制了它的应用范围;针对目前普遍所存在的问题,本文提出一种改进的基于量子蚁群的聚类方法,将量子计算原理和蚂蚁算法结合来改进K-means算法,该方法结合了两个方法的优点,力求优势互补,并且在该方法中引入微观适应性策略改进了算法中的交叉算子和变异算子,使得聚类算法的局部搜索能力得到很大的提高;实验证明该算法有很好的全局收敛性,克服了K-means的不足,能有效解决未成熟收敛的问题。 展开更多
关键词 量子计算 蚂蚁算法 k-means算法 聚类分析
下载PDF
基于改进的K-Means算法入侵检测框架 被引量:3
7
作者 李蓉 周维柏 《实验室研究与探索》 CAS 北大核心 2014年第3期110-114,共5页
针对现有网络入侵检测系统存在虚警和报警信息数量大等问题,提出一种改进的K-Means分群算法。该算法针对网络流量中的数据,首先利用改进的KMeans分群算法调整群中心的位置以寻找最佳群中心,让数据资料更加适合分群。接着运用差分算法,... 针对现有网络入侵检测系统存在虚警和报警信息数量大等问题,提出一种改进的K-Means分群算法。该算法针对网络流量中的数据,首先利用改进的KMeans分群算法调整群中心的位置以寻找最佳群中心,让数据资料更加适合分群。接着运用差分算法,寻找出最适合的分群组数与最佳的分群结果。在检测时利用样本与各群间距离来识别是否属于异常或正常群组。仿真实验表明,该算法分群准确率高,误判率低,有效地提高系统的性能。 展开更多
关键词 网络安全 入侵检测系统 k-means 差分算法
下载PDF
改进的K-Means算法在特征关联中的应用 被引量:5
8
作者 关欣 孙祥威 曹昕莹 《雷达科学与技术》 2014年第1期81-85,共5页
特征关联是无源多传感器辐射源融合识别的一个关键步骤。特征关联是根据来源于同一辐射源的量测数据所具有的相似性,采用一定的算法和分配策略将多传感器获取的对多辐射源的量测值进行分类划分和关联判定,利用辐射源的特征信息来消除关... 特征关联是无源多传感器辐射源融合识别的一个关键步骤。特征关联是根据来源于同一辐射源的量测数据所具有的相似性,采用一定的算法和分配策略将多传感器获取的对多辐射源的量测值进行分类划分和关联判定,利用辐射源的特征信息来消除关联模糊。特征关联过程中一个重要环节就是分类算法的选取。K-Means算法是基于划分的聚类算法,已经广泛应用于诸多领域。改进了K-Means算法,用灰关联度代替传统的距离度量定义了样本点间的距离,并对模拟产生的雷达辐射源特征参数样本集Radar-database进行了分类。仿真结果表明,改进的K-Means算法提高了关联正确率,但消耗了更多时间。 展开更多
关键词 k-means算法 无源多传感器 特征关联 灰关联度
下载PDF
一种改进的k-means算法 被引量:9
9
作者 李业丽 秦臻 《北京印刷学院学报》 2007年第2期63-65,共3页
k-means(k均值)算法是聚类方法中常用的一种划分方法。该算法适合对海量数据进行聚类,对球状、凸形分布的数据具有很好的聚类效果,但该算法有其突出的局限性,少量的孤立点就会对聚类结果产生很大的影响,因此,采用聚类均值点与聚类种子... k-means(k均值)算法是聚类方法中常用的一种划分方法。该算法适合对海量数据进行聚类,对球状、凸形分布的数据具有很好的聚类效果,但该算法有其突出的局限性,少量的孤立点就会对聚类结果产生很大的影响,因此,采用聚类均值点与聚类种子相分离的思想,给出了基于该思想的对k均值算法的改进算法。实验表明,该改进算法比原k均值算法具有更高的准确性。 展开更多
关键词 数据挖掘 聚类算法 k-means算法
下载PDF
改进的K-means算法 被引量:1
10
作者 王芳妮 贺兴时 +1 位作者 谌路 杨敏 《纺织高校基础科学学报》 CAS 2012年第3期370-373,共4页
针对传统K-means聚类算法对初始点敏感性问题,根据数据样本分布,采用启发式的方法选取初始聚类中心点,设计了一种均衡化评价函数,由此函数为准则自动生成聚类数目.通过实验验证了该算法的收敛性.
关键词 k-means算法 数据分布 初始中心点 均衡化函数
下载PDF
基于改进的K-means算法初始化方法研究 被引量:4
11
作者 马健 《云南民族大学学报(自然科学版)》 CAS 2020年第3期274-278,共5页
为了解决K-means算法在随机初始化过程中影响到K-means算法的效率性和正确性问题.提出了一种改进的方法(IKM),该方法是一种改进K均值的算法,利用密度、网格和统计等概念,将IKM的模拟数据与K-means进行比较.结果证明IKM的效率性和正确性... 为了解决K-means算法在随机初始化过程中影响到K-means算法的效率性和正确性问题.提出了一种改进的方法(IKM),该方法是一种改进K均值的算法,利用密度、网格和统计等概念,将IKM的模拟数据与K-means进行比较.结果证明IKM的效率性和正确性优于K-means算法,对于复杂的情况在数据分布方面,IKM的表现优于K-means算法. 展开更多
关键词 聚类分析 k-means算法 初始化方法
下载PDF
一种改进的K-means算法在异常检测中的应用 被引量:11
12
作者 陈庄 罗告成 《重庆理工大学学报(自然科学)》 CAS 2015年第5期66-70,共5页
为提高K-means聚类算法在异常检测中的效果,给出一种改进的K-means聚类算法。基于最大距离选取初始聚类中心,并引入信息熵计算各个属性的权重,用改进后的加权欧氏距离公式计算数据集中样本点间的距离。选取KDD CUP99数据集测试算法的性... 为提高K-means聚类算法在异常检测中的效果,给出一种改进的K-means聚类算法。基于最大距离选取初始聚类中心,并引入信息熵计算各个属性的权重,用改进后的加权欧氏距离公式计算数据集中样本点间的距离。选取KDD CUP99数据集测试算法的性能。实验结果表明,本算法有助于提高异常检测的检测率和降低误报率。 展开更多
关键词 异常检测 数据挖掘 k-mean聚类算法 初始聚类中心 加权欧式距离
下载PDF
改进的K-means算法在电厂煤质分析中的应用 被引量:1
13
作者 潘华 高杨杨 +1 位作者 郑芳 刘维明 《上海电力学院学报》 CAS 2015年第6期585-588,596,共5页
针对传统K-means算法聚类结果受初始值影响、迭代次数多和易出现局部最优解的弊端,研究改变初始值的选择,并采用三角形三边关系定律减少迭代次数对算法作进一步改善.通过数据对比了传统算法与改进算法,结果表明改进算法有较高的准确率.... 针对传统K-means算法聚类结果受初始值影响、迭代次数多和易出现局部最优解的弊端,研究改变初始值的选择,并采用三角形三边关系定律减少迭代次数对算法作进一步改善.通过数据对比了传统算法与改进算法,结果表明改进算法有较高的准确率.最后,通过实例为电厂的煤种选择提供了参考. 展开更多
关键词 聚类分析 数据挖掘 k-means算法 经济选择
下载PDF
改进的K-Means算法在信用卡客户细分中的应用 被引量:1
14
作者 朱艳丽 王全蕊 《河南科技学院学报》 2010年第1期82-85,共4页
典型的K-Means算法适用于进行客户细分,但是该算法要求用户必须事先给出精确的k值,这在一定程度上影响和限制了其应用.通过使用聚类有效性函数对其进行改进,克服了该算法要求用户必须事先给定k值的缺点,并采用改进的K-Means算法对信用... 典型的K-Means算法适用于进行客户细分,但是该算法要求用户必须事先给出精确的k值,这在一定程度上影响和限制了其应用.通过使用聚类有效性函数对其进行改进,克服了该算法要求用户必须事先给定k值的缺点,并采用改进的K-Means算法对信用卡客户进行细分,建立了基于消费行为的客户细分模型.实验结果表明,从该客户细分模型可获知信用卡客户的消费行为模式,为其提供个性化服务. 展开更多
关键词 聚类分析 k-means算法 有效性函数 客户细分
下载PDF
基于距离和权重改进的K-means算法 被引量:35
15
作者 王子龙 李进 宋亚飞 《计算机工程与应用》 CSCD 北大核心 2020年第23期87-94,共8页
K-means聚类算法简单高效,应用广泛。针对传统K-means算法初始聚类中心点的选择随机性导致算法易陷入局部最优以及K值需要人工确定的问题,为了得到最合适的初始聚类中心,提出一种基于距离和样本权重改进的K-means算法。该聚类算法采用... K-means聚类算法简单高效,应用广泛。针对传统K-means算法初始聚类中心点的选择随机性导致算法易陷入局部最优以及K值需要人工确定的问题,为了得到最合适的初始聚类中心,提出一种基于距离和样本权重改进的K-means算法。该聚类算法采用维度加权的欧氏距离来度量样本点之间的远近,计算出所有样本的密度和权重后,令密度最大的点作为第一个初始聚类中心,并剔除该簇内所有样本,然后依次根据上一个聚类中心和数据集中剩下样本点的权重并通过引入的参数τi找出下一个初始聚类中心,不断重复此过程直至数据集为空,最后自动得到k个初始聚类中心。在UCI数据集上进行测试,对比经典K-means算法、WK-means算法、ZK-means算法和DCKmeans算法,基于距离和权重改进的K-means算法的聚类效果更好。 展开更多
关键词 数据挖掘 k-means算法 初始聚类中心 加权欧式距离 权重
下载PDF
改进的K-means算法在网络舆情分析中的应用 被引量:7
16
作者 汤寒青 王汉军 《计算机系统应用》 2011年第3期165-168,196,共5页
结合网络舆情分析的应用需求背景,首先介绍了文本信息的处理,然后探讨了文本聚类中的K-means算法,针对其对初始聚类中心的依赖性的特点,对算法加以改进。基于文档标题能够代表文档内容的思想,改进算法采用稀疏特征向量表示文本标题,计... 结合网络舆情分析的应用需求背景,首先介绍了文本信息的处理,然后探讨了文本聚类中的K-means算法,针对其对初始聚类中心的依赖性的特点,对算法加以改进。基于文档标题能够代表文档内容的思想,改进算法采用稀疏特征向量表示文本标题,计算标题间的稀疏相似度,确定初始聚类中心。最后实验证明改进的K-means算法提高了聚类的准确度;与基于最大最小距离原则的初始中心选择算法比较,提高了执行效率,同时保证了聚类准确度。 展开更多
关键词 网络舆情 k-means算法 文本聚类 稀疏特征向量
下载PDF
基于百度地图的改进的K-means算法研究 被引量:5
17
作者 杨婷婷 王雪梅 《软件》 2016年第1期76-80,共5页
聚类分析在科研和商业应用中都有着非常重要的应用,K-means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-means算法的局限性日益突出。在百度地图的各种坐标体系下,提出一种改进的基于网格的K-means算法,用新的方法确定k值... 聚类分析在科研和商业应用中都有着非常重要的应用,K-means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-means算法的局限性日益突出。在百度地图的各种坐标体系下,提出一种改进的基于网格的K-means算法,用新的方法确定k值以及K个初始质心。相对于传统的K-means算法,该算法在一定程度上减少了因采用误差平方和准则函数而出现较大的聚类簇分割开的情况,仿真实验结果表明:改进后的K-means算法优于原始算法,并且稳定性更好。 展开更多
关键词 聚类 k-means算法 百度地图 稳定性
下载PDF
一种基于改进的K-Means算法的聚类分析方法 被引量:5
18
作者 汪嘉 姜明富 李友国 《农业网络信息》 2009年第10期120-122,共3页
本文将最大最小距离算法和传统的K-Means算法相结合,提出了一种改进的K-Means算法,此算法可以弥补传统K-Means算法中初始中心点难以确定的缺点,有效地解决了传统K-Means算法对初始中心的选择具有较大依赖性以及由于初始聚类中心选择不当... 本文将最大最小距离算法和传统的K-Means算法相结合,提出了一种改进的K-Means算法,此算法可以弥补传统K-Means算法中初始中心点难以确定的缺点,有效地解决了传统K-Means算法对初始中心的选择具有较大依赖性以及由于初始聚类中心选择不当,算法极易陷入局部极小点的问题[1,2]。 展开更多
关键词 聚类分析 k-means算法 最大最小距离算法
下载PDF
基于改进的K-means算法估测单木树高 被引量:4
19
作者 孙拱 辛颖 闫灿 《森林工程》 2019年第6期31-35,共5页
为快速提取森林单木树高,提高单木树高的提取精度,本研究提出一种改进的K-means聚类算法提取单木树高。即利用内蒙古依根地区的野外实测数据和机载LiDAR点云数据,以各单木实测坐标为该算法的聚类中心,对机载LiDAR点云数据进行圆柱拟合聚... 为快速提取森林单木树高,提高单木树高的提取精度,本研究提出一种改进的K-means聚类算法提取单木树高。即利用内蒙古依根地区的野外实测数据和机载LiDAR点云数据,以各单木实测坐标为该算法的聚类中心,对机载LiDAR点云数据进行圆柱拟合聚类,将圆柱体内垂直方向最高的点视为该单木树冠最高点,利用提取的树高与野外实测树高进行相关性分析。分析发现,基于改进的K-means算法提取的树高与实测树高相关系数R2为0.852。结果说明改进的K-means算法能够很好的用于机载LiDAR点云数据单木树高的提取,降低了传统测量方法的局限性,挖掘了机载LiDAR点云数据的应用潜力。 展开更多
关键词 机载LIDAR 改进k-means算法 树高
下载PDF
一种改进的K-means算法在城市通勤研究中的应用 被引量:3
20
作者 周天绮 杨志民 《计算机应用与软件》 北大核心 2019年第3期265-270,共6页
针对K-means算法初始聚类中心选择困难、易受噪声影响等缺点,通过选择所有样本的中心和离中心最远距离的点优化初始化聚类中心;采用类间相异度迭代计算确定k值;通过计算每一个样本与其他样本的距离和,如果大于所有样本的距离均和,则认... 针对K-means算法初始聚类中心选择困难、易受噪声影响等缺点,通过选择所有样本的中心和离中心最远距离的点优化初始化聚类中心;采用类间相异度迭代计算确定k值;通过计算每一个样本与其他样本的距离和,如果大于所有样本的距离均和,则认为是噪声点予以删除。随机选取100个手机定位样本进行职住地聚类实验,结果显示改进的K-means算法经过3次迭代快速实现收敛,避免了局部最优,同时聚类中心未受到噪声影响而产生偏移。采用该算法分析杭州市通勤特征,杭州市总体达到职住平衡,但在主要商圈和主干道上通勤压力较大。与杭州市第六次人口普查数据和杭州交通运行分析报告进行分析比对,结果基本一致。 展开更多
关键词 算法改进 城市通勤 手机定位 空间聚类
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部