基于佳点集与Leader方法的改进K-means聚类算法被引量：3

Modified K-means clustering algorithm based on good point set and Leader method

下载PDF

导出

摘要针对传统K-means算法对初始点敏感的问题,采用数论中的佳点集理论结合Leader方法对K-means聚类算法加以改进,启发式地生成样本初始中心。根据两者不同的结合方式,所提算法分别称为KLG和KGL。佳点集理论能够产生比随机选取点更好的点,Leader方法则能反映数据对象本身的分布特性。结合佳点集理论和Leader方法各自的优点,能获得优化的初始中心。在UCI数据集上的实验表明,KLG算法和KGL算法所得到的结果均好于传统的和其他一些初始化的K-means算法。 Traditional K-means algorithm is sensitive to the initial start center.To solve this problem,a method was proposed to optimize the initial center points through adopting the theory of good point set and Leader method.According to the different combination ways,the new algorithms were called KLG and KGL respectively.Better points could be obtained by the theory of good point set rather than random selection.The Leader method could reflect the distribution characteristics of the data object.The experimental results conducted on the UCI database show that the KLG and KGL algorithms significantly outperform the traditional and other initialization K-means algorithms.

作者张燕平张娟何成刚褚维翠张利娜

机构地区安徽大学计算机科学与技术学院

出处《计算机应用》 CSCD 北大核心 2011年第5期1359-1362,1373,共5页 journal of Computer Applications

基金国家自然科学基金资助项目(60675031) 国家973计划项目(2007BC311003)

关键词 K-MEANS算法佳点集 Leader方法 K-means algorithm good point set Leader method

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：139
2赖玉霞,刘建平,杨国兴.基于遗传算法的K均值聚类分析[J].计算机工程,2008,34(20):200-202. 被引量：70
3孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1065
4钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
5袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
6张铃,张钹.佳点集遗传算法[J].计算机学报,2001,24(9):917-922. 被引量：165
7DHILLON I S,GUAN YUQIANG,KOGAN J.Refining clusters inhigh dimensional text data. Proceedings of the 2nd SIAMWorkshop on Clustering High Dimensional Data . 2002
8LIUH,CAI Z-X,WANG Y.A newconstrained optimization evo-lutionary algorithm by using good point set. CSC 2007:Pro-ceedings of the 2007 IEEE Congress on Evolutionary Computation . 2007
9XIAO C-X,CAI Z-X,WANG Y,et al.Tuning of the structureand parameters of a neural network using a good points set evolu-tionary strategy. ICYCS 2008:Proceedings of the 9th Inter-national Conference for Young Computer Scientists . 2008
10LI Y-F,KWOK J T,ZHOU Z-H.Semi-supervised learning usinglabel mean. ICML 2009:Proceedings of the 26th Interna-tional Conference on Machine Learning . 2009

二级参考文献44

1李未,黄文奇.一种求解合取范式可满足性问题的数学物理方法[J].中国科学（A辑）,1994,24(11):1208-1217. 被引量：21
2李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：113
3李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
4潘伟,刁华宗,井元伟.一种改进的实数自适应遗传算法[J].控制与决策,2006,21(7):792-795. 被引量：53
5钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
6Han J, Kamber M. Data Mining Concepts and Techniques. Orlando, USA: Morgan Kaufmann Publishers, 2001
7Huang J Z, Ng M K, Rang Hongqiang, et al. Automated Variable Weighting in K-means Type Clustering. IEEE Trans on Pattern Analysis and Machine Intelligence, 2005, 27 (5) : 657 - 668
8Dhillon I S, Guan Yuqiang, Kogan J. Refining Clusters in High Dimensional Text Data//Proc of the 2nd SIAM Workshop on Clustering High Dimensional Data. Arlington, USA, 2002 : 59 - 66
9Zhang B. Generalized K-Harmonic Means: Dynamic Weighting of Data in Unsupervised Learning//Proc of the 1 st SIAM International Conference on Data Mining. Chicago, USA, 2001 : 1 - 13
10Sarafis I, Zalzala A M S, Trinder P W. A Genetic Rule-Based Data Clustering Toolkit//Proc of the Congress on Evolutionary Computation. Honolulu, USA, 2002 : 1238 - 1243

共引文献1535

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：4
3王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
4林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
5高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
6毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
7张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
8李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
9尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
10段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1

同被引文献30

1张琼,张莹,白清源,谢丽聪,谢伙生.一种新的基于粗糙集的leader聚类算法[J].计算机科学,2008,35(3):177-179. 被引量：4
2杨兴,周围.智能天线中基于粒子群算法的二维DOA估计[J].广东通信技术,2010,30(5):37-40. 被引量：5
3王会金.中观信息系统审计风险控制体系研究——以COBIT框架与数据挖掘技术相结合为视角[J].审计与经济研究,2012,27(1):16-23. 被引量：24
4王之元,杨学军,周云.大规模MPI并行计算的可扩展三模冗余容错机制[J].软件学报,2012,23(4):1022-1035. 被引量：13
5董惠林.数据式审计面临的挑战及应对策略[J].审计月刊,2013(11):38-39. 被引量：4
6卢志茂,冯进玫,范冬梅,杨朋,田野.面向大数据处理的划分聚类新方法[J].系统工程与电子技术,2014,36(5):1010-1015. 被引量：22
7隋玉敏,孙秀芳,武优西,任志考.负投影梯度的特征权重Leader聚类算法[J].小型微型计算机系统,2014,35(9):2147-2150. 被引量：2
8秦荣生.大数据、云计算技术对审计的影响研究[J].审计研究,2014(6):23-28. 被引量：571
9王霖郁,康新.基于种群优化的遗传算法的MUSIC谱峰搜索技术[J].计算机应用研究,2014,31(12):3543-3545. 被引量：9
10李志坚,吴晓军,任哲坡,欧小波.基于分布式粗粒度并行计算的遗传规划算法研究[J].计算机应用研究,2015,32(1):48-50. 被引量：7

引证文献3

1邵锦炜,林俊,刘雅婷,肖嘉丽.基于改进Leaders算子的审计潜在疑点发现[J].计算机与现代化,2018(4):79-83.
2余从容,卢利娟,梁东贵.基于改进聚类的电力大数据审计证据发现[J].计算机与数字工程,2018,46(8):1491-1495. 被引量：2
3崔琳,张熠鑫.改进鸡群优化算法的二维MUSIC谱峰搜索研究[J].电子测量与仪器学报,2020,32(3):142-148. 被引量：6

二级引证文献8

1文昌俊,陈凡,陈洋洋,何永豪.引入改进迭代局部搜索的灰狼算法及应用[J].电子测量技术,2023,46(23):30-42.
2周开河,方云辉,戚浩金,郭少华,姚继锋.以宁波为例的城市电力大数据应用研究及思考[J].中国科技纵横,2019,0(1):155-157. 被引量：1
3王峰.基于模糊神经网络的电力变压器绝缘状态预测方法[J].机械与电子,2022,40(3):50-53. 被引量：2
4杨阳,李滨.基于量子粒子群算法的火电厂热控系统自动控制研究[J].自动化技术与应用,2022,41(9):106-109. 被引量：4
5冯笑,董腾飞,李温静,方金国,吕东东.多策略混合改进蝴蝶算法的多层感知器训练优化[J].计算机工程与设计,2023,44(5):1555-1564. 被引量：1
6骆正山,杨赛星,王小完.海洋大气环境下架空管道腐蚀失重预测[J].安全与环境学报,2023,23(4):1031-1037. 被引量：3
7陈旺,潘峰.基于改进麻雀算法的分布式电源优化配置[J].太原科技大学学报,2023,44(4):316-320. 被引量：1
8吴平平,万鸣华,徐超.计算机审计课程改革与探索[J].中国多媒体与网络教学学报（电子版）,2019(4S):194-195.

1郭守团,徐志根.基于BP神经网络的垃圾邮件过滤器研究[J].计算机安全,2009(12):19-20. 被引量：3
2裴胜玉.求解约束优化问题的佳点集多目标进化算法[J].计算机工程,2011,37(24):152-154. 被引量：2
3徐松金,龙文.嵌入遗传算子的改进灰狼优化算法[J].兰州理工大学学报,2016,42(4):102-108. 被引量：21
4陈彦龙,张培林,李胜,李一宁.面向多峰函数的自适应小生境量子进化算法[J].系统工程与电子技术,2014,36(2):403-408. 被引量：9
5张燕平,杜玲,赵姝.构造性覆盖方法的增量学习算法[J].南京大学学报（自然科学版）,2009,45(5):699-704. 被引量：3
6朱旭辉,倪志伟,程美英,李敬明,金飞飞,倪丽萍.融合协同进化离散型人工鱼群算法和多重分形的雾霾预测方法[J].系统工程理论与实践,2017,37(4):999-1010. 被引量：11
7刘慧,蔡自兴,王勇.基于佳点集的约束优化进化算法[J].系统仿真学报,2009,21(6):1620-1623. 被引量：1
8肖赤心,蔡自兴,王勇,周经野.一种基于佳点集原理的约束优化进化算法[J].控制与决策,2009,24(2):249-253. 被引量：23
9宋昌泽.基于改进型BP神经网络的慢性肾脏病预测[J].电脑迷,2016(10).
10李志俊,程家兴.免疫佳点集遗传算法[J].计算机工程与应用,2007,43(28):37-40. 被引量：5

计算机应用

2011年第5期

浏览历史

内容加载中请稍等...

基于佳点集与Leader方法的改进K-means聚类算法被引量：3

参考文献12

二级参考文献44

共引文献1535

同被引文献30

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于佳点集与Leader方法的改进K-means聚类算法 被引量：3

参考文献12

二级参考文献44

共引文献1535

同被引文献30

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于佳点集与Leader方法的改进K-means聚类算法被引量：3