基于点概率的K-means算法的改进

Improved K-means Algorithm Based on Dot-probability

下载PDF

导出

摘要 K-means算法是一种基于划分的方法,该算法对初始聚类中心的选取依赖性极大,初始中心值的不同导致聚类效果不稳定.为此,本文利用几何概率的思想,认为每个数据点都是等概率的存在于数据集,通过计算每个数据点的点概率值,结合距离因素,选择K个点作为初始聚类中心.实验证明,改进后的K-means算法聚类效果更好. K-means algorithm is a division-based method,which is greatly dependent on the choosing of initial cluster centers. Dif-ferent initial clustering center value can lead to unstable destabilizing effect. Thus,this article holds the idea that each data point in the da-ta set has the same probability through calculating dot-probability value for each data point and combining with the distance factor tochoose K points as the initial cluster centers by using the principle of geometric probability. Experiment shows that the improved K-meansalgorithm clustering effect is better.

作者邵晶晶蒋林利

机构地区云南大学滇池学院理工学院武汉大学继续教育学院广西科技师范学院数学与计算机科学系

出处《柳州师专学报》 2015年第6期108-110,共3页 Journal of Liuzhou Teachers College

基金云南省教育厅科学研究基金项目(2014Y634)

关键词 K-MEANS算法初始中心几何概率 K-means algorithm initial center geometric probability

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1Han J,Kamber M .数据挖掘概念与技术[M].第一版.范明,孟小峰,等,译.北京:机械工业出版社,2006.
2牟颖,全太锋,.K-means算法的初始点优化研究[J].电脑知识与技术,2008,0(11Z):1176-1177. 被引量：1
3Kaufman L,RousseeuwP J.Finding groups in data:anintro-duction to cluster analysis[M].New York:Wileys,1990.
4Dhillon I S,Guan Y,Kogan J.Refining clusters in highdimensional text data[C].Procof the 2nd SIAM Workshop onClustering High Dimensional Data.2002:59-66.
5Khan S S,Ahmad A.Cluster center initialization for K-meansclustering[J]. Pattern Recognition Letters,2004,25(11):1293-1302.
6谢娟英,郭文娟,谢维信,高新波.基于样本空间分布密度的初始聚类中心优化K-均值算法[J].计算机应用研究,2012,29(3):888-892. 被引量：53

二级参考文献19

1张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
2李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
3钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
4袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
5HAN J W H,KAMBER M.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2000.
6KAUFMAN L, ROUSSEEUW P J. Finding groups in data: an intro- duction to cluster analysis[ M]. New York:Wileys, 1990.
7DHILLON I S, GUAN Yu-qiang, KOGAN J. Refining clusters in high dimensional text data [ C ]//Proc of the 2nd SIAM Workshop on Clus- tering High Dimensional Data. 2002: 59-66.
8KHAN S S, AHMAD A. Cluster center initialization for K-means clustering [ J]. Pattern Recognition Letters,2004, 25 (11):1293- 1302.
9DEELERS S, AUWATANAMONGKOL S. Enhancing K-means algo- rithm with initial cluster centers derived from data partitioning along the data axis with the highest variance [ J]. Proceeding of World Academy of Science, Engineering and Technology, 2007,26 : 323- 328.
10FRANK A, ASUNC!ON A. UCI machine learning repository [ R]. California : University of California, School of Information and Comput- er Science, 2010.

共引文献52

1谢娟英,郭文娟,谢维信,高新波.基于密度RPCL的K-means算法[J].西北大学学报（自然科学版）,2012,42(4):570-576. 被引量：5
2张靖,段富.优化初始聚类中心的改进k-means算法[J].计算机工程与设计,2013,34(5):1691-1694. 被引量：56
3王永贵,林琳,刘宪国.结合双粒子群和K-means的混合文本聚类算法[J].计算机应用研究,2014,31(2):364-368. 被引量：16
4郝晓丽,张靖.基于改进自适应聚类算法的RBF神经网络分类器设计与实现[J].计算机科学,2014,41(6):260-263. 被引量：21
5谢娟英,王艳娥.最小方差优化初始聚类中心的K-means算法[J].计算机工程,2014,40(8):205-211. 被引量：84
6邢长征,谷浩.基于平均密度优化初始聚类中心的k-means算法[J].计算机工程与应用,2014,50(20):135-138. 被引量：32
7付卫红,马丽芬,李爱丽.基于改进K-均值聚类的欠定混合矩阵盲估计[J].系统工程与电子技术,2014,36(11):2143-2148. 被引量：10
8何佳知,谢颖华.基于密度的优化初始聚类中心K-means算法研究[J].微型机与应用,2015,34(19):17-19. 被引量：5
9张淑清,黄震坤,冯铭.一种优化的改进k_means算法[J].微电子学与计算机,2015,32(12):36-39. 被引量：2
10刘雨康,张正阳,陈琳琳,陈静.基于KNN算法的改进的一对多SVM多分类器[J].计算机工程与应用,2015,51(24):126-131. 被引量：10

1黄利文,毛政元,李二振,汪小钦,吴升.基于几何概率的聚类分析方法及其在遥感影像分类中的应用[J].中国图象图形学报,2007,12(4):633-640. 被引量：4
2李晓雯,毛政元,李建微.一种基于几何概率的聚类有效性函数[J].中国图象图形学报,2008,13(12):2351-2356. 被引量：1
3张文明,吴江,袁小蛟.基于密度和最近邻的K-means文本聚类算法[J].计算机应用,2010,30(7):1933-1935. 被引量：29
4徐维林,朱宗,高丽,刘金岭.基于主题模型的网络微博舆情分析[J].软件导刊,2016,15(5):153-154. 被引量：2
5陈诚.几何概率的常见题型例析[J].数学大世界（教学导向）,2005(5):5-6.
6张忠平,王爱杰,陈丽萍.一种基于广度优先搜索的K-means初始化算法[J].计算机工程与应用,2008,44(27):159-161. 被引量：7
7肖艳.三角形网格的有效性分析[J].科技信息,2011(13):422-422.
8HU Dongping,CUIYongquan,YINAihua,CHEN Liang,CUI Chunying,ZOU Deqing,HANLansheng.Building a Secure Block Ciper on Small and Non- Binary Domain[J].China Communications,2014,11(9):160-172.
9魏志华,毛政元.基于特征空间聚类结构信息的遥感影像边缘增强方法[J].山东大学学报（工学版）,2011,41(5):76-81.
10史小平,曹开臣.煤矿矿井数学模型的研究[J].现代电子技术,2010,33(16):123-126.

柳州师专学报

2015年第6期

浏览历史

内容加载中请稍等...

基于点概率的K-means算法的改进

参考文献6

二级参考文献19

共引文献52

相关作者

相关机构

相关主题

浏览历史