优化初值的C均值算法被引量：1

Optimal initialization-based C-means method

下载PDF

导出

摘要针对C均值算法(C-means method,CM)对初值敏感、易陷入局部最优的问题,提出一种优化初值的C均值算法(Optimal initialization-based CM,OICM)。该算法首先计算数据集中每个点的邻域以及邻域密度,选择具有最大邻域密度的点作为第一个聚类中心;然后,从剩余的数据集中选择具有最大邻域密度、且其邻域与已有聚类中心的邻域的连接度满足一定条件的点作为下一个聚类中心,以此类推,直到确定了C个聚类中心;最后,利用C均值算法完成数据集的聚类分析。在仿真数据集和UCI数据集上进行聚类实验,结果表明OICM算法有效地克服了传统C均值算法对初值敏感的缺点,且性能优于其他3种典型的全局C均值算法。 C-means Clustering Method （CM） is a widely for data clustering, which is sensitive to the initial cluster centers and easily leads to local optimum. To solve this problem, an Optimal Initialization-based C-means Method （OI-CM） is proposed. First for each point in the dataset, the neighborhood and neighborhood density are calculated, and the point with the maximum neighborhood density is selected as the first cluster center. Then, the point with the maximum neighborhood density from the rest datasets is selected as the next cluster center, whose neighborhood must have little coupling degree with the neighborhoods of existing cluster centers. This procedure is continued until all the cluster centers are selected. Finally, the CM is utilized to cluster the datasets with the selected cluster centers. Experimental results on simulated and UCI datasets show that the proposed OI-CM can effectively solve the sensitivity defect of the traditional CM to initial duster centers, and has superior performance than other three global CMs.

作者刘云康冰侯涛王柯刘富

机构地区吉林大学通信工程学院

出处《吉林大学学报（工学版）》 EI CAS CSCD 北大核心 2018年第1期306-311,共6页 Journal of Jilin University:Engineering and Technology Edition

基金国家自然科学基金项目(61503151) 吉林省自然科学基金项目(10100505) 吉林省重点科技攻关项目(20140204046GX)

关键词计算机应用 C均值算法初值敏感邻域密度 computer application C-means method initial value sensitivity neighborhood density

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：75
2刘华春,候向宁,杨忠.基于改进K均值算法的入侵检测系统设计[J].计算机技术与发展,2016,26(1):101-105. 被引量：13
3邢涛,黄友红,胡庆荣,李军,王冠勇.基于动态K均值聚类算法的SAR图像分割[J].中国科学院大学学报（中英文）,2016,33(5):674-678. 被引量：7
4李昌兴,黄艳虎,支晓斌,谢笑娟.基于加速k均值的谱聚类图像分割算法改进[J].传感器与微系统,2016,35(9):137-140. 被引量：10
5詹森,秦大同,曾育平.基于遗传优化K均值聚类算法工况识别的混合动力汽车能量管理策略[J].中国公路学报,2016,29(4):130-137. 被引量：37
6谢娟英,郭文娟,谢维信,高新波.基于样本空间分布密度的初始聚类中心优化K-均值算法[J].计算机应用研究,2012,29(3):888-892. 被引量：53
7徐森,卢志茂,顾国昌.结合K均值和非负矩阵分解集成文本聚类算法[J].吉林大学学报（工学版）,2011,41(4):1077-1082. 被引量：12

二级参考文献88

1荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
2袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
3张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：61
4吴庆涛,邵志清.入侵检测研究综述[J].计算机应用研究,2005,22(12):11-14. 被引量：19
5高琰,谷士文,唐琎,蔡自兴.机器学习中谱聚类方法的研究[J].计算机科学,2007,34(2):201-203. 被引量：31
6钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
7张建萍,刘希玉.基于聚类分析的K-means算法研究及应用[J].计算机应用研究,2007,24(5):166-168. 被引量：124
8袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：154
9李洋.K-means聚类算法在入侵检测中的应用[J].计算机工程,2007,33(14):154-156. 被引量：23
10Guha S,Rastogi R,Shim K.Cure:an efficient clustering algorithm for large database[C]//Proc of ACM-SIGMOND lnt Conf Managemerit on Data, Seattle, Washington, 1998 . 73-84.

共引文献197

1程云江,梁颖华,徐向阳,董鹏,王书翰,刘艳芳,刘献栋.基于增益功率燃油系数的HEV能量管理策略[J].中国公路学报,2022,35(4):343-352. 被引量：3
2楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
3顾洪博,赵万平.数据挖掘算法性能优化的研究与应用[J].长春理工大学学报（自然科学版）,2010,33(1):164-166. 被引量：9
4韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：94
5南敬昌,赵景梅,袁杰.基于RBF神经网络的射频功放行为模型研究[J].计算机工程与应用,2011,47(8):125-127. 被引量：3
6史习云,薛安荣,刘艳红.改进k-means聚类算法在图像检索中的应用研究[J].计算机工程与应用,2011,47(10):193-196. 被引量：11
7安建成,史德增.一种改进的K-means算法[J].电脑开发与应用,2011,24(4):39-40. 被引量：6
8黄敏.聚类算法在教学评价中的应用研究[J].中国电力教育,2011(6):63-64. 被引量：1
9仝雪姣,孟凡荣,王志晓.对k-means初始聚类中心的优化[J].计算机工程与设计,2011,32(8):2721-2723. 被引量：29
10张会,赵腾飞,王云专,吴卫琴.基于密度的K-means算法在识别含气、含水岩心中的应用[J].科学技术与工程,2011,11(24):5759-5763. 被引量：2

同被引文献7

1武兆慧,张桂娟,刘希玉.基于模拟退火遗传算法的聚类分析[J].计算机应用研究,2005,22(12):24-26. 被引量：15
2王雪梅,王义和.模拟退火算法与遗传算法的结合[J].计算机学报,1997,20(4):381-384. 被引量：123
3杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
4周远晖,陆玉昌,石纯一.基于克服过早收敛的自适应并行遗传算法[J].清华大学学报（自然科学版）,1998,38(3):93-95. 被引量：73
5吴浩扬,常炳国,朱长纯,刘君华.基于模拟退火机制的多种群并行遗传算法[J].软件学报,2000,11(3):416-420. 被引量：60
6王纵虎,刘志镜,陈东辉.基于粒子群优化的模糊C-均值聚类算法研究[J].计算机科学,2012,39(9):166-169. 被引量：23
7殷旅江,杨立君,胡明茂,邓义成.基于混合遗传模拟退火的模糊C-均值聚类算法[J].湖北汽车工业学院学报,2015,29(3):62-65. 被引量：5

引证文献1

1冯劲,姚远.融合相似度计算与改进遗传算法的聚类分析[J].计算机仿真,2020,37(9):226-230. 被引量：3

二级引证文献3

1彭瑶瑶,谭代伦.基于扩张-收缩机制的遗传算法求解一维下料问题[J].数学的实践与认识,2021,51(10):183-191. 被引量：2
2尹徐珊,吴鹏,赵亚.基于PSO算法的电力一线员工绩效评价方法[J].计算机系统应用,2022,31(7):253-258.
3唐顺田.基于半监督聚类算法的水利枢纽工程设备自适应PID控制系统[J].工业仪表与自动化装置,2022(4):112-117. 被引量：2

1王栋,于威威,庄斐弘.基于标记分水岭和FLICM模糊聚类的图像分割方法研究[J].微型机与应用,2017,36(17):49-51. 被引量：3
2王日宏,崔兴梅.融合集群度与距离均衡优化的K-均值聚类算法[J].计算机应用,2018,38(1):104-109. 被引量：3
3南男,杨健,赵晶晶,侍洪波.基于谱聚类特征向量分析的模态划分方法[J].华东理工大学学报（自然科学版）,2017,43(5):669-676. 被引量：2
4叶枫,丁锋.不平衡数据分类研究及其应用[J].计算机应用与软件,2018,35(1):132-136. 被引量：15
5Kun Zhang,Weiren Kong,Peipei Liu,Jiao Shi,Yu Lei,Jie Zou,Min Liu.Partition region-based suppressed fuzzy C-means algorithm[J].Journal of Systems Engineering and Electronics,2017,28(5):996-1008. 被引量：1
6郭爱民,张涛,刘维玮,肖凯,姚世东.一种伺服机构模拟负载台多弹簧钢板统一设计方法[J].导弹与航天运载技术,2017(5):62-66. 被引量：1
7张小威,杨扬,张励.红外多谱段场景图像合成方法[J].系统仿真技术,2017,13(4):281-285.
8王兆峰.区域旅游与交通系统空间结构优化——以武陵山区为例[J].企业经济,2017,36(12):5-10. 被引量：6
9周元满,谢嘉莉,黄剑坚,刘志美.特呈岛红海榄林分结构特征分析[J].防护林科技,2017,30(12):5-9. 被引量：2
10万月,陈秀宏,何佳佳.利用稀疏自编码的局部谱聚类映射算法[J].传感器与微系统,2018,37(1):145-148. 被引量：2

吉林大学学报（工学版）

2018年第1期

浏览历史

内容加载中请稍等...

优化初值的C均值算法被引量：1

参考文献7

二级参考文献88

共引文献197

同被引文献7

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

优化初值的C均值算法 被引量：1

参考文献7

二级参考文献88

共引文献197

同被引文献7

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

优化初值的C均值算法被引量：1