遗传优化的K均值聚类算法被引量：6

Optimized K-Means Clustering Analysis Based on Genetic Algorithm

下载PDF

导出

摘要在K均值聚类算法中,K值需事先确定且在整个聚类过程中不能改变其大小,而按照经验K值划分所得的最终聚类结果一般并非最佳结果。通过求解所构造适应度函数的值,在变异操作中实现最佳聚类数K值的自动寻优,同时借助遗传操作完成聚类中心点的优化选取并利用遗传算法的全局寻优能力克服了K均值聚类算法的局部性。通过对Iris等数据集的实验分析,证明该算法具有良好的全局收敛性,且通过K值的自动调整,有效提高了聚类结果的划分。 For K-Means clustering algorithm, the k value must be determined in advance and can＇t be changed. However, the value is usually not the best if it is determined by experience. In this paper, fitness is taken into account to look for optimal number automatically in the mutation operations. Also, genetic operation is used to select the centers accordingly. In addition, the global optimization capability of genetic algorithm can overcome the locality of K-Means clustering algorithm. The experimental results show that this algorithm has better global searching capability and can efficiently improve the clustering result by adjusting the k value automatically.

作者胡彧毕晋芝

机构地区太原理工大学测控技术研究所太原理工大学计算机与软件学院

出处《计算机系统应用》 2010年第6期52-55,共4页 Computer Systems & Applications

基金山西省自然科学基金(2009011019-2)

关键词 K均值算法 K均值遗传算法遗传算法聚类算法数据挖掘 k-Means algorithm the genetic k-Means algorithm genetic algorithm clustering algorithm data mining

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1Murthy CA,Chowdhury N.In search of optimal clusters using genetic algorithms.Pattern Recognition Letter,1996,17(8):825-832.
2Sanghamitra Bandyopadhyay,Ujjwal Maulik.An evolutionary technique based on K-Means algorithm for optimal clustering.Information Sciences,2002,146(4):221-237.
3傅景广,许刚,王裕国.基于遗传算法的聚类分析[J].计算机工程,2004,30(4):122-124. 被引量：49
4刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：23
5潘伟,刁华宗,井元伟.一种改进的实数自适应遗传算法[J].控制与决策,2006,21(7):792-795. 被引量：53
6赖玉霞,刘建平,杨国兴.基于遗传算法的K均值聚类分析[J].计算机工程,2008,34(20):200-202. 被引量：72

二级参考文献24

1吕强,俞金寿.基于混合遗传算法的K-Means最优聚类算法[J].华东理工大学学报（自然科学版）,2005,31(2):219-222. 被引量：8
2刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005,25(6):54-58. 被引量：122
3杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：191
4潘伟,刁华宗,井元伟.一种改进的实数自适应遗传算法[J].控制与决策,2006,21(7):792-795. 被引量：53
5张晓缋,方浩,戴冠中.遗传算法的编码机制研究[J].信息与控制,1997,26(2):134-139. 被引量：93
6AnsariN HouE 李军边肇祺译.用于最优化的计算智能[M].北京：清华大学出版社,1999..
7[2]Tou J T,Gonzalez R C.Pattern Recognition Principle[M].Addison Wesley,Reading,MA,1974.
8[4]Murthy C A,Chowdhury N.In search of optimal clusters using genetic algorithms[J].PatternRecog Lett,1996,17:825-832.
9[8]Sanghamitra Bandyopadhyay,Ujjwal Maulik.An evolutionary technique based on K-Means algorithm for optimal clustering in RN[J].Information Sciences,2002,146:221-237.
10[10]Malay K Pakhiraa,Sanghamitra Bandyopadhyayb,Ujjwal Maulikc.Validity index for crisp and fuzzy clusters[J].Pattern Recognition,2004,37:487-501.

共引文献189

1刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：26
2毕晓冬.一种改进的自适应遗传算法[J].潍坊学院学报,2007,7(4):114-117. 被引量：3
3刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：23
4姜静,谭博学,姜琳.基于改进自适应遗传算法的仿真研究[J].山东理工大学学报（自然科学版）,2008,22(6):10-12. 被引量：9
5鲜于建川,隽志才.基于遗传聚类算法的出行行为分析[J].计算机应用研究,2009,26(3):836-839.
6刘旭东,范青武,段建民,周大森.基于混合自适应遗传算法HEV系统参数的优化[J].北京工业大学学报,2009,35(7):904-909.
7徐辉,李石君.一种整合粒子群优化和K-均值的数据聚类算法[J].山西大学学报（自然科学版）,2011,34(4):518-523. 被引量：9
8刘伯颖,张素琪,张丽丽.一种引力搜索和K-means的混合聚类算法[J].河北工业大学学报,2013,42(3):23-27. 被引量：3
9姜月秋,牛硕,高宏伟.一种新的基于K均值聚类的色彩量化算法研究[J].计算机科学,2012,39(S3):375-377. 被引量：6
10叶志伟,尹宇洁,王明威,赵伟.一种基于杜鹃搜索算法的聚类分析方法[J].微电子学与计算机,2015,32(5):104-110. 被引量：6

同被引文献46

1张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
2江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
3陈浩,何婷婷,姬东鸿.基于k-means聚类的无导词义消歧[J].中文信息学报,2005,19(4):10-16. 被引量：16
4杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：191
5李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
6袁礼海,李钊,宋建社.利用高斯混合模型实现概率密度函数逼近[J].无线电通信技术,2007,33(2):20-22. 被引量：16
7何婷婷,戴文华,焦翠珍.基于混合并行遗传算法的文本聚类研究[J].中文信息学报,2007,21(4):55-60. 被引量：11
8普运伟,朱明,金炜东,胡来招.核聚类算法最佳聚类数的自适应确定方法[J].计算机工程,2007,33(4):11-13. 被引量：9
9毛国君,段立娟,王实,等.数据挖掘原理和算法[M].北京:清华大学出版社,2006:156-166.
10吴艳文,胡学钢.一种K-means算法的k值优化方案[J].巢湖学院学报,2007,9(6):21-24. 被引量：6

引证文献6

1王颖,刘建平.基于改进遗传算法的K-means聚类分析[J].工业控制计算机,2011,24(8):78-79. 被引量：4
2徐晓旻,肖仰华.KBAC:一种基于K-means的自适应聚类[J].小型微型计算机系统,2012,33(10):2268-2272. 被引量：6
3施侃晟,刘海涛,白英彩,宋文涛,洪亮亮.余弦度量和适应度函数改进的聚类方法[J].电子科技大学学报,2013,42(4):621-624. 被引量：4
4左倪娜.基于改进遗传算法的K-means聚类方法[J].软件导刊,2016,15(4):32-34. 被引量：5
5杨金花,刘显为.K-means算法中k值优化问题研究[J].河南科学,2017,35(9):1388-1395. 被引量：2
6李伟,张凤梅.基于K-Means的无线传感网络节能算法研究[J].传感器与微系统,2021,40(4):41-44. 被引量：4

二级引证文献25

1宋奔,于俊乐.面向和谐校园评价体系的AHP-GA算法研究[J].中国电子商情（通信市场）,2013(4):46-51.
2李家成,苏一丹,覃华,吴丹.基于遗传算法的K调和均值聚类算法[J].计算机技术与发展,2013,23(9):55-58. 被引量：9
3刘英伟,秦永彬.基于余弦相似性的m-类分类器设计与算法实现[J].计算机与数字工程,2014,42(3):351-354. 被引量：4
4王勇,唐靖,饶勤菲,袁巢燕.高效率的K-means最佳聚类数确定算法[J].计算机应用,2014,34(5):1331-1335. 被引量：65
5俞刚,郑焜,叶盛.基于模糊C均值聚类的儿科机械通气撤机时机研究[J].中国生物医学工程学报,2014,31(5):625-629.
6张广蓉,陈庆奎,章刚,赵海燕,高丽萍,霍欢.基于MapReduce的并行化模糊划分算法[J].计算机应用,2014,34(11):3073-3077.
7袁周米琪,周坚华.自适应确定K-means算法的聚类数：以遥感图像聚类为例[J].华东师范大学学报（自然科学版）,2014(6):73-80. 被引量：3
8刘向东,刘奎,胡飞翔,王翠荣.基于MapReduce的并行聚类算法设计与实现[J].计算机应用与软件,2014,31(11):251-256. 被引量：10
9蒙杰,杨生举,施韶亭.基于文本挖掘的科研项目管理辅助决策系统研究与实现[J].计算机应用与软件,2016,33(9):24-26. 被引量：9
10韩海.K进制遗传算法在聚类问题求解中的应用[J].无线互联科技,2016,13(17):135-136.

1孙玲芳,李金海.适用于新媒体事件聚类模型的混合算法研究[J].计算机工程与设计,2013,34(4):1404-1408.
2高怀金,李国慧.基于遗传算法的Web使用挖掘研究[J].电脑知识与技术（过刊）,2007(18):1628-1630.
3但汉辉,张玉芳,张世勇.一种改进的K-均值聚类算法[J].重庆工商大学学报（自然科学版）,2009,26(2):144-147. 被引量：8
4安吉尧,欧志芳.结合SVM和Gabor参数优化的车辆检测[J].计算机工程与应用,2011,47(36):203-207. 被引量：4
5李峰,王海英.基于遗传算法的分组算法[J].长春工业大学学报,2013,34(2):214-217.
6赵晖.基于聚类集成的网络入侵检测算法[J].科学技术与工程,2012,20(23):5797-5800. 被引量：4
7孟祥萍,鞠传香,王贤勇,任纪川.粗糙集理论中基于属性重要性的离散化方法[J].东北电力学院学报,2005,25(1):40-43. 被引量：6
8李红彪,张洪业.QPSO算法在朴素贝叶斯分类上的应用研究[J].哈尔滨理工大学学报,2010,15(4):86-88. 被引量：1
9程春英,张玉春.利用遗传算法求解0/1背包问题[J].内蒙古民族大学学报（自然科学版）,2010,25(6):637-639. 被引量：3
10刘菁,温显斌.基于遗传算法的小波域上的三维数字水印技术[J].计算机科学,2014,41(1):300-302. 被引量：1

计算机系统应用

2010年第6期

浏览历史

内容加载中请稍等...

遗传优化的K均值聚类算法被引量：6

参考文献6

二级参考文献24

共引文献189

同被引文献46

引证文献6

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

遗传优化的K均值聚类算法 被引量：6

参考文献6

二级参考文献24

共引文献189

同被引文献46

引证文献6

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

遗传优化的K均值聚类算法被引量：6