一种改进的全局K-均值聚类算法被引量：46

An improved global K-means clustering algorithm

下载PDF

导出

摘要将快速K中心点聚类算法确定初始中心点的思想应用于全局K-均值聚类算法,对其选取下一个簇的最佳初始中心的方法进行改进,提出选取下一个簇的最佳初始中心的一种新方法.该新方法选择一个周围样本分布相对密集,且距离现有簇的中心比较远的样本为下一个簇的最佳初始中心,得到一种改进的全局K-均值聚类算法.改进后的算法不仅可以避免将噪音点作为下一个簇的最佳初始中心点,而且在不影响聚类效果的基础上缩短了聚类时间.通过UCI机器学习数据库数据以及随机生成的人工模拟数据实验测试,证明改进的全局K-均值聚类算法与全局K-均值聚类算法及快速全局K-均值聚类算法相比在聚类时间上更优越. An improved global K-means clustering algorithm is proposed by presenting a novel method of generating the next optimal initial center with the enlightening of the idea of K-medoids clustering algorithm suggested by Park et al.Our new method choose a point which has a high density and is far away from the centers of the available clusters,so that it can not only avoid choosing a noisy datum as the optimal candidate centre,but also reduce the computational time without affecting the performance of the global K-means clustering algorithm.Our improved global K-means clustering algorithm is tested on some well-known data sets from UCI and on some synthetic data with noisy data,and the results of these experiments demonstrate that our method significantly outperforms the global K-means clustering algorithm and the fast global K-means clustering algorithm.

作者谢娟英蒋帅王春霞张琰谢维信

机构地区陕西师范大学计算机科学学院西安电子科技大学电子工程学院

出处《陕西师范大学学报（自然科学版）》 CAS CSCD 北大核心 2010年第2期18-22,共5页 Journal of Shaanxi Normal University：Natural Science Edition

基金国家自然科学基金资助项目(30670250)

关键词 K-均值全局K-均值快速全局K-均值 K中心点法 K-means global K-means fast global K-means K-medoids clustering

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1Jain A K, Dubes R C. Algorithms for clustering data [ M]. Englewood Cliffs: Prentice-Hall, 1988 : 1-334.
2Huang Z. Extensions to the K-means algorithm for clustering large data sets with categorical values [J]. Data Ming and Knowledge Discovery, 1998, 2 (3): 283-304.
3Maulik U, Bandyopadhyay S. Genetic algorithm based clustering technique[J]. Pattern Recognition, 2000, 33 (9): 1 455-1 465.
4Selim S Z, Al-Sultan K S. A simulated annealing algorithm for the clustering[J]. Pattern Recognition, 1991, 24 (10):1 003-1 008.
5Likas A, Vlassis M, Verbeek J. The global K-means clustering algorithm[J]. Pattern Recognition, 2003, 36 (2) : 451-461.
6Park H S, Jun C H. A simple and fast algorithm for K- medoids clustering [ J ]. Expert Systems with Applications, 2009, 36 (2): 3 336-3 341.

同被引文献458

1杨帆,米红.一种基于网格的空间聚类方法在区域划分中的应用[J].测绘科学,2007,32(z1):66-69. 被引量：11
2赵志升,罗德林,李海英.数据挖掘技术与应用[J].河北北方学院学报（自然科学版）,2006,22(6):63-66. 被引量：10
3乔珠峰,田凤占,黄厚宽,陈景年.缺失数据处理方法的比较研究[J].计算机研究与发展,2006,43(z1):171-175. 被引量：13
4郭景峰,赵玉艳,边伟峰,李晶.基于改进的凝聚性和分离性的层次聚类算法[J].计算机研究与发展,2008,45(z1):202-206. 被引量：15
5宋晓建,杨玲.基于图像退化模型的天气现象识别[J].成都信息工程学院学报,2011,26(2):132-136. 被引量：4
6林印华,张春海,刘洁.基于清洗规则和主数据的数据修复算法实现[J].计算机科学,2012,39(S3):174-176. 被引量：5
7曹建军,刁兴春,陈爽,邵衍振.数据清洗及其一般性系统框架[J].计算机科学,2012,39(S3):207-211. 被引量：31
8王小华,沈杰,王荣波.一种新的基于蚁群和凝聚的混合聚类算法[J].杭州电子科技大学学报（自然科学版）,2010,30(1):26-29. 被引量：3
9陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013,25(S1):142-146. 被引量：340
10孔锐,张国宣,施泽生,郭立.基于核的K-均值聚类[J].计算机工程,2004,30(11):12-13. 被引量：46

引证文献46

1李春英,汤志康,曹元大.神经网络集成的城市道路状态判别模型研究[J].计算机工程与应用,2011,47(15):225-228. 被引量：1
2李春英,汤志康,郑芳平,曹元大.基于两级分类器串行的人脸识别[J].计算机工程与设计,2011,32(7):2485-2489.
3丁启伟,戴晨光,赵博.基于颜色特征利用色矩与BTC法进行影像聚类[J].测绘与空间地理信息,2011,34(3):162-164.
4边鹏,赵妍,苏玉召.一种改进的K-means算法最佳聚类数确定方法[J].现代图书情报技术,2011(9):34-40. 被引量：12
5黄敏,何中市,邢欣来,陈英.一种新的k-means聚类中心选取算法[J].计算机工程与应用,2011,47(35):132-134. 被引量：20
6张艳肖.基于遗传聚类算法的Web日志挖掘研究[J].信息技术,2011,35(12):10-12. 被引量：1
7谢娟英,马箐,谢维信.一种确定最佳聚类数的新算法[J].陕西师范大学学报（自然科学版）,2012,40(1):13-18. 被引量：11
8边鹏,苏玉召.基于检索日志的检索词推荐研究[J].图书情报工作,2012,56(9):31-36. 被引量：4
9刘洋.聚类算法的研究[J].长春师范大学学报（人文社会科学版）,2012,31(6):9-11. 被引量：1
10谢娟英,郭文娟,谢维信.基于邻域的K中心点聚类算法[J].陕西师范大学学报（自然科学版）,2012,40(4):16-22. 被引量：32

二级引证文献221

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2金志坤,景云鹏,刘刚.基于无人机LiDAR的农田平整地势测量方法[J].农业机械学报,2021,52(S01):51-57. 被引量：2
3吴兴惠,周玉萍,邢海花.利用随机森林算法对学生成绩评价与预测研究[J].电脑知识与技术,2020,0(4):254-255. 被引量：5
4边鹏,苏玉召.基于检索日志的检索词推荐研究[J].图书情报工作,2012,56(9):31-36. 被引量：4
5谢娟英,郭文娟,谢维信.基于邻域的K中心点聚类算法[J].陕西师范大学学报（自然科学版）,2012,40(4):16-22. 被引量：32
6郑丹,王潜平.K-means初始聚类中心的选择算法[J].计算机应用,2012,32(8):2186-2188. 被引量：35
7董俊,任家东,卢海涛.一种基于复杂网络属性值的K-means聚类算法[J].燕山大学学报,2012,36(4):343-347. 被引量：4
8谢娟英,郭文娟,谢维信,高新波.基于密度RPCL的K-means算法[J].西北大学学报（自然科学版）,2012,42(4):570-576. 被引量：5
9胡兆芹.传统信息检索模型发展研究及优化策略[J].高校图书情报论坛,2012,11(3):14-18.
10胡兆芹.传统信息检索模型及其优化策略研究[J].情报探索,2013(2):95-98. 被引量：2

1白天,周春光,刘桂霞,王晗,王喆,张宏婷.一种共调控基因聚类的新方法[J].吉林大学学报（理学版）,2009,47(2):292-298. 被引量：2
2田军辉,程涛.一种改进的全局优化进化算法[J].安阳师范学院学报,2007(2):12-15. 被引量：1
3周园园,胡贤德,李敬明,沈桂芳.一种改进的全局和声搜索算法求解函数优化问题[J].赤峰学院学报（自然科学版）,2016,32(21):15-17.
4谢娟英,马箐,谢维信.一种确定最佳聚类数的新算法[J].陕西师范大学学报（自然科学版）,2012,40(1):13-18. 被引量：11
5郭朋,杨平先,刘雨.一种改进的全局Retinex监控视频图像增强方法[J].四川理工学院学报（自然科学版）,2010,23(6):716-718. 被引量：3
6张忠厚,赵龙.改进的全局K均值算法及其在啤酒系统中的应用[J].计算机系统应用,2012,21(8):194-196. 被引量：1
7梁鲜,曲福恒,杨勇,才华.一种高效的全局K-均值算法[J].长春理工大学学报（自然科学版）,2015,38(3):112-115. 被引量：1
8王联国,施秋红.人工鱼群算法的参数分析[J].计算机工程,2010,36(24):169-171. 被引量：32
9王皓,欧阳海滨,高立群.一种改进的全局粒子群优化算法[J].控制与决策,2016,31(7):1161-1168. 被引量：48
10邢熔华,黄海燕.基于改进全局人工蜂群算法的WSN节点定位研究[J].计算机科学,2016,43(12):273-276. 被引量：3

陕西师范大学学报（自然科学版）

2010年第2期

浏览历史

内容加载中请稍等...

一种改进的全局K-均值聚类算法被引量：46

参考文献6

同被引文献458

引证文献46

二级引证文献221

相关作者

相关机构

相关主题

浏览历史

一种改进的全局K-均值聚类算法 被引量：46

参考文献6

同被引文献458

引证文献46

二级引证文献221

相关作者

相关机构

相关主题

浏览历史

一种改进的全局K-均值聚类算法被引量：46