期刊文献+
共找到213篇文章
< 1 2 11 >
每页显示 20 50 100
K-means算法初始聚类中心选择的优化 被引量:50
1
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 k—means算法 聚类 初始聚类中心 TDkM算法
下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
2
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 k—means算法 初始聚类中心 直方图 最优划分方法
下载PDF
一种K-means改进算法的并行化实现与应用 被引量:50
3
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行k—means 文本聚类
下载PDF
初始中心优化的K-Means聚类算法 被引量:47
4
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 k—means聚类算法 初始聚类中心 优化
下载PDF
基于微博舆情监测的K-Means算法改进研究 被引量:17
5
作者 朱晓峰 陈楚楚 尹婵娟 《情报理论与实践》 CSSCI 北大核心 2014年第1期136-140,共5页
在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚... 在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚类稳定性均明显改善,微博舆情监测的质量大幅度提高。 展开更多
关键词 微博 网络舆情 k—means算法
下载PDF
一种分层自适应快速K-means算法 被引量:7
6
作者 张晓琳 崔宁宁 +1 位作者 杨涛 李洁 《计算机应用研究》 CSCD 北大核心 2016年第2期421-423,427,共4页
提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子... 提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子树的分支数目,而在聚类树的每一层聚类中使用一种提出的判别函数(cost-function)在颜色直方图上根据颜色等级直接聚类,从而可以在整棵树上快速聚类。实验表明,HAFKM算法通过在非平衡树上逐层聚类,并且通过CEC准确判断聚类数目,可以快速、高效地实现数据库的分类聚簇。 展开更多
关键词 HAFkM k—means算法 分层聚类 自适应 大数据库 聚类树
下载PDF
基于学术文献同被引分析的K-means算法改进研究 被引量:4
7
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《情报学报》 CSSCI 北大核心 2012年第1期82-94,共13页
K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被... K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类。算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K—means算法的初始聚类中心。第二步聚类则依据文献内容实现K-means算法。实验通过与经典K—means算法和基于凝聚层次聚类算法的改进K—means算法的对比,证明了本文提出的改进的K—means算法具备更优的聚类效果。 展开更多
关键词 k—means算法 k 初始聚类中心 同被引 文献聚类
下载PDF
基于密度的K-Means算法及在客户细分中的应用研究 被引量:11
8
作者 向坚持 刘相滨 资武成 《计算机工程与应用》 CSCD 北大核心 2008年第35期246-248,共3页
针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明... 针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明了改进算法的有效性和稳定性,并将改进的算法应用于客户细分研究中。 展开更多
关键词 k—means算法 kMAD算法 密度 客户细分
下载PDF
基于初始中心优化的遗传K-means聚类新算法 被引量:17
9
作者 孙秀娟 刘希玉 《计算机工程与应用》 CSCD 北大核心 2008年第23期166-168,182,共4页
一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出... 一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。 展开更多
关键词 聚类 k—means算法 遗传算法
下载PDF
一种基于蚁群算法的K-means算法——在公路运输枢纽宏观布局规划中的应用 被引量:8
10
作者 孟岩 刘希玉 刘艳丽 《计算机工程与应用》 CSCD 北大核心 2008年第1期179-182,共4页
公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始... 公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始中心点和聚类个数不确定等方面的缺点。针对其缺点,提出将基于蚁群算法的K-means算法应用于在公路运输枢纽布局规划中。实验结果表明,与单独使用两种算法相比,该算法更能有效地解决公路主枢纽城市的聚类问题。 展开更多
关键词 k—means算法 蚁群聚类算法 公路运输 主枢纽城市
下载PDF
K-means聚类算法的研究 被引量:46
11
作者 韩晓红 胡彧 《太原理工大学学报》 CAS 北大核心 2009年第3期236-239,共4页
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初... 为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。 展开更多
关键词 数据挖掘 k—means算法 初始聚类中心 聚类分析
下载PDF
改进的k-means聚类算法在客户细分中的应用研究 被引量:8
12
作者 杜巍 赵春荣 黄伟建 《河北经贸大学学报》 CSSCI 北大核心 2014年第1期118-121,共4页
聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业... 聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业能够更合理地细分、规划客户群组,针对不同需求的客户群体进行区别对待,得到了较好的效果,验证了改进算法的可行性和高效性。 展开更多
关键词 聚类分析 客户细分 数据挖掘 改进的k—means算法 客户群
下载PDF
K-Means算法的研究与改进 被引量:19
13
作者 周爱武 陈宝楼 王琰 《计算机技术与发展》 2012年第10期101-104,共4页
K-Means算法是一种基于划分方法的经典聚类算法,已经在很多领域得到广泛的应用。虽然该算法有很多优点,但其也存在自身的局限性,比如需要用户输入聚类簇个数,初始聚类中心是随机性选择的,算法容易陷入局部最优解,对孤立点比较敏感等。... K-Means算法是一种基于划分方法的经典聚类算法,已经在很多领域得到广泛的应用。虽然该算法有很多优点,但其也存在自身的局限性,比如需要用户输入聚类簇个数,初始聚类中心是随机性选择的,算法容易陷入局部最优解,对孤立点比较敏感等。文中首先应用统计学中的标准分数对样本进行孤立点分析,然后提出一种新的初始聚类中心确定策略。对改进的算法和原算法分别做实验进行比较,实验结果表明,改进的算法在准确率、收敛速度和稳定性方面都有很大的提高。 展开更多
关键词 k—means算法 孤立点 初始聚类中心
下载PDF
一种K-means聚类算法的改进与应用 被引量:20
14
作者 张杰 卓灵 朱韵攸 《电子技术应用》 北大核心 2015年第1期125-128,131,共5页
K-means算法是基于距离作为相似性度量的聚类算法,传统的K-means算法存在难以确定中心值个数、受噪声及孤立点影响较大的缺点。对此,利用类间相异度与类内相异度改进初始值K,以尽量减少人工干预;同时计算数据库中每一点与剩余点的距离... K-means算法是基于距离作为相似性度量的聚类算法,传统的K-means算法存在难以确定中心值个数、受噪声及孤立点影响较大的缺点。对此,利用类间相异度与类内相异度改进初始值K,以尽量减少人工干预;同时计算数据库中每一点与剩余点的距离和距离均和,将两者的大小比较作为识别孤立点和噪声点的依据,从而删除孤立点,减少对数据聚类划分的影响。最后将改进后的Kmeans算法应用于入侵检测系统并进行仿真实验,结果表明,基于改进的K-means算法的入侵检测系统一定程度上降低了误报率及误检率,提高了检测的准确率。 展开更多
关键词 数据挖掘 聚类算法 k—means 入侵检测
下载PDF
基于形状相似距离的K-means聚类算法 被引量:8
15
作者 苑津莎 李中 《华北电力大学学报(自然科学版)》 CAS 北大核心 2009年第6期98-103,共6页
把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基... 把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基于形状相似距离的K-means算法比采用传统距离的K-means算法,聚类准确度显著提高。 展开更多
关键词 聚类 k—means算法 相似度 距离 形状
下载PDF
基于初始聚类中心优化和维间加权的改进K-means算法 被引量:7
16
作者 王越 王泉 +1 位作者 吕奇峰 曾晶 《重庆理工大学学报(自然科学)》 CAS 2013年第4期77-80,共4页
针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-m... 针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析。实验证明:改进后的算法稳定,且聚类的准确率达到了92%。 展开更多
关键词 聚类 k—means算法 初始聚类中心 维间加权 Iris数据集
下载PDF
基于Hadoop的K-means聚类算法的实现 被引量:24
17
作者 周婷 张君瑛 罗成 《计算机技术与发展》 2013年第7期18-21,共4页
文中针对传统并行K-means聚类算法时间复杂度比较高的问题,结合Hadoop平台以及MapReduce编程模型的优势,提出了利用Hadoop及MapReduce编程模型实现大数据量下的K-means聚类算法。其中,Map函数完成每条记录到各个质心距离的计算并标记其... 文中针对传统并行K-means聚类算法时间复杂度比较高的问题,结合Hadoop平台以及MapReduce编程模型的优势,提出了利用Hadoop及MapReduce编程模型实现大数据量下的K-means聚类算法。其中,Map函数完成每条记录到各个质心距离的计算并标记其所属类别,Reduce函数完成质心的更新,同时计算每条数据到其所属中心点的距离,并累计求和。通过实验,验证了K-means算法部署在Hadoop集群上并行化运行,在处理大数据时,同传统的串行算法相比,确实能够降低时间复杂度,而且表现出很好的稳定性和扩展性。 展开更多
关键词 数据挖掘 k—means算法 HADOOP MAPREDUCE
下载PDF
基于离群点检测的K-means算法 被引量:3
18
作者 冷泳林 张清辰 +1 位作者 赵亮 鲁富宇 《渤海大学学报(自然科学版)》 CAS 2014年第1期34-38,48,共6页
K-means算法以其简单、快速的特点在现实生活中得到广泛应用.然而传统Kmeans算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高.针对这个问题,提出一种基于离群点检测的K-means算法,首先检测出数据集中的离群点,在选择初始种子... K-means算法以其简单、快速的特点在现实生活中得到广泛应用.然而传统Kmeans算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高.针对这个问题,提出一种基于离群点检测的K-means算法,首先检测出数据集中的离群点,在选择初始种子的时候,避免选择离群点作为初始种子.然后在对非离群点进行聚类完成后,根据离群点到各个聚类的距离,将离群点划分到相应的聚类中.算法有效降低离群点对K-means算法的影响,提高聚类结果的准确率.实验表明,在聚类类别数给定的前提下,在标准数据集UCI上该算法有效降低离群点对K-means算法的影响,提高了聚类的精确率和稳定性. 展开更多
关键词 聚类 k—means算法 离群点 UCI数据集
下载PDF
遥感图像K-Means并行算法研究 被引量:16
19
作者 蒋利顺 刘定生 《遥感信息》 CSCD 2008年第1期27-30,115,共5页
K-Means算法是对遥感图像在没有先验知识情况下进行无监督分类的重要算法之一,在遥感影像的分析中得到了广泛的应用。针对K-Means算法复杂,处理过程中计算时间长的缺点,人们试图寻求快速的并行处理方式。在这种并行化的探索过程中,由于K... K-Means算法是对遥感图像在没有先验知识情况下进行无监督分类的重要算法之一,在遥感影像的分析中得到了广泛的应用。针对K-Means算法复杂,处理过程中计算时间长的缺点,人们试图寻求快速的并行处理方式。在这种并行化的探索过程中,由于K-Means算法独特的流程结构,使其并行化处理方式难以顺利进行。本文在分析K-Means算法特点的基础上,对其并行化方式进行了深入的研究。针对K-Means算法并行化在处理速度和分类精度方面存在的问题,提出了一种基于分块逼近的算法并行模型,可兼顾并行效率和分类精度之间的综合要求,实现某种精度可控的并行处理。最后,根据实验结果讨论并提出了迭代算法并行化的有效途径。 展开更多
关键词 遥感 无监督分类 k—means算法 并行算法 数据并行
下载PDF
结合mean-shift与MST的K-means聚类算法 被引量:5
20
作者 徐沁 罗斌 《计算机工程》 CAS CSCD 2013年第12期204-210,共7页
针对初始点选择不当导致K-means陷入局部最小值问题,提出一种结合自适应mean-shift与最小生成树(MST)的K-means聚类算法。将数据对象投影到主成分分析(PCA)子空间,给出自适应mean-shift算法,并在PCA子空间内将数据向密度大的区域聚集,... 针对初始点选择不当导致K-means陷入局部最小值问题,提出一种结合自适应mean-shift与最小生成树(MST)的K-means聚类算法。将数据对象投影到主成分分析(PCA)子空间,给出自适应mean-shift算法,并在PCA子空间内将数据向密度大的区域聚集,再利用MST与图连通分量算法,找出数据的类别数和类标签,据此计算原始空间的密度峰值,并将其作为K-means聚类的初始中心点。对K-means的目标函数、聚类精度和运行时间进行比较,结果表明,该算法在较短的运行时间内能给出较优的全局解。 展开更多
关键词 聚类分析 k—means算法 初始中心点 mean—Shift算法 主成分分析 最小生成树
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部