一种新的选取初始聚类中心的K-means算法被引量：25

A New K-means Algorithm for Selecting Initial Clustering Center

下载PDF

导出

摘要文章在2014年提出的K-means初始聚类中心选取算法的基础上进行改进。通过计算样本间的相异度函数,求出每个样本的相异度参数,选取最大相异度参数值所对应的样本作为初始聚类中心。当最大相异度参数不唯一时,提出了一种合理选取最大相异度参数值的解决方案,依次求出K个初始聚类中心,由此提出了一种选取初始聚类中心的改进算法。实验证明,所提出的改进算法与原算法相比具有更高的准确率,并且明显减少了迭代次数。 This paper improves the algorithm based on the K-means initial clustering center selection algorithm proposed in 2014. By calculating the dissimilarity function between samples, the parameter of dissimilarity of each sample is obtained, and the sample corresponding to the maximum dissimilarity parameter is selected as the initial clustering center. The paper also puts forward a solution of choosing the parameter value of maximum dissimilarity reasonably when the maximum dissimilarity parameter is not unique, and then determines the K initial clustering centers successively, on the basis of which an improved algorithm is presented for selecting the initial clustering center.

作者董秋仙朱赞生 Dong Qiuxian;Zhu Zansheng(College of Science,Nanchang University,Nanchang 330031,China)

机构地区南昌大学理学院

出处《统计与决策》 CSSCI 北大核心 2020年第16期32-35,共4页 Statistics & Decision

基金地面复杂系统仿真国防科技重点实验室预研项目(61420080502)。

关键词 K-MEANS算法初始聚类中心相异度参数 k-means algorithm initial clustering center dissimilarity parameter

分类号 TP31 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1仝雪姣,孟凡荣,王志晓.对k-means初始聚类中心的优化[J].计算机工程与设计,2011,32(8):2721-2723. 被引量：29
2孟子健,马江洪.一种可选初始聚类中心的改进k均值算法[J].统计与决策,2014,30(12):12-14. 被引量：18
3韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：93
4贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量：225
5吕泽华,张豪,李华.基于捕获流动中心试点的自适应K-means算法[J].统计与决策,2017,33(19):78-81. 被引量：1
6杜洪波,白阿珍,朱立军.基于改进的密度峰值算法的K-means算法[J].统计与决策,2018,0(18):20-24. 被引量：12
7谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104
8薛印玺,许鸿文,李羚.基于样本密度的全局优化K均值聚类算法[J].计算机工程与应用,2018,54(14):143-147. 被引量：14

二级参考文献107

1赵明清,蒋昌俊,陶树平.基于等价相异度矩阵的聚类[J].计算机科学,2004,31(7):183-184. 被引量：11
2万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16
3胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007,35(2):17-20. 被引量：36
4钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
5袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
6毛韶阳,李肯立.优化K-means初始聚类中心研究[J].计算机工程与应用,2007,43(22):179-181. 被引量：26
7Tan Pang-ning,Steinbaeh M,Kumar V.Introduction to data mining[M]. [S.l.] : Addison Wesley, 2005.
8Han Jia-wei,Kamber M.Data mining:Concepts and techniques[M]. [S.l.]:Morgan Kaufmann Publishers,2001.
9王玲,薄列峰,焦李成.密度敏感的谱聚类[J].电子学报,2007,35(8):1577-1581. 被引量：61
10Guha S,Rastogi R,Shim K.CURE:An Efficient Clustering Algorithm for Large Databases[C].Seattle:Proceedings of the ACM SIGMOD Conference,1998.73-84.

共引文献471

1刘壮,张悦.统计学方法在生物信息学分析中的应用[J].医学信息学杂志,2020,41(6):20-23. 被引量：1
2孙伟鹏,吴锡生,孟斌.基于Spark并行的密度峰值聚类算法[J].计算机应用研究,2020,37(1):163-166. 被引量：2
3尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
4夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：16
5汤周文,叶东毅.基于层次聚类的差异化属性约简算法[J].计算机应用,2009,29(2):419-420. 被引量：1
6杜秀亭,杨晨光.基于最短主干道距离的零售户聚类研究[J].内蒙古大学学报（自然科学版）,2012,43(3):306-312.
7甘克勤,丛超,张宝林,孙旭凯.基于划分的文本聚类算法在标准文献中的试验与对比研究[J].标准科学,2013(10):47-50. 被引量：5
8吴东飞,金玉龙,蒋建国.基于TMS320DM6467和TMS320C6472的高清视频处理系统[J].数据采集与处理,2012,27(S2):227-234.
9司建波,姚燕,郭蔚莹,杨芳.基于模糊聚类的Web用户聚类方法与实现[J].吉林大学学报（工学版）,2013,43(S1):485-488.
10王凌峰.基于构成要素的聚类算法[J].统计与决策,2007,23(19):26-28. 被引量：1

同被引文献344

1高宇,刘跃娟.基于数据多样性的判别多流形降维方法的研究[J].自动化与仪器仪表,2020(4):30-34. 被引量：2
2张辉.浅析产品形态设计中的语意表达[J].美术大观,2008(5):112-113. 被引量：7
3宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
4赵明清,蒋昌俊,陶树平.基于等价相异度矩阵的聚类[J].计算机科学,2004,31(7):183-184. 被引量：11
5周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
6陈根军,唐国庆.基于禁忌搜索与蚁群最优结合算法的配电网规划[J].电网技术,2005,29(2):23-27. 被引量：48
7吕巍,蒋波,陈洁.基于K-means算法的中国移动市场顾客行为细分策略研究[J].管理学报,2005,2(1):80-84. 被引量：15
8张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172. 被引量：98
9何振峰,熊范纶.结合限制的分隔模型及K-Means算法[J].软件学报,2005,16(5):799-809. 被引量：23
10王恒,宁汝新.面向精度分析的全语义产品模型研究[J].计算机集成制造系统,2005,11(7):921-926. 被引量：7

引证文献25

1李雪瑞,侯幸刚,杨梅,王璐瑶,王怡妍,李欣颖.数字孪生驱动的工业产品CMF设计服务模型构建与应用[J].计算机集成制造系统,2021,27(2):307-327. 被引量：15
2崔立卿,王胜男,田晶.基于K-均值聚类算法的大客户用电行为分析[J].电力大数据,2021,24(2):69-77. 被引量：4
3孙伟,张淑娟,汪玉,秦丹丹,李金中,卞真旭.配电台区全业务智能检索与推荐方法研究[J].信息技术,2021,45(5):96-101. 被引量：1
4彭源,徐晓辉,宋涛,郝淼淼,赵法川.基于改进K-means的农田湿度评估研究[J].节水灌溉,2021(7):76-79. 被引量：1
5张嘉龙.一种新的选取K-means初始聚类中心算法[J].现代计算机,2021,27(18):56-59. 被引量：3
6程江洲,何艳,鲍刚,潘飞.基于CK-means算法的用户用电负荷聚类分析[J].计算机仿真,2021,38(7):63-67. 被引量：4
7张嘉龙.基于相异度与邻域的K-means初始聚类中心选择算法[J].计算机时代,2021(8):57-59. 被引量：4
8李汉波,魏福义,张嘉龙,刘志伟.基于相异性邻域的改进K-means算法[J].现代信息科技,2021,5(7):67-70. 被引量：1
9唐宇坤,邓松,许梦雅,郭馨.基于几何特征的学生评教数据离群点检测算法[J].江西师范大学学报（自然科学版）,2021,45(3):292-298. 被引量：4
10张志丹,张帝,黄纯,邓威,唐海国,朱吉然.基于筛选电压数据的配电低压用户相别辨识方法[J].供用电,2022,39(1):58-64. 被引量：3

二级引证文献106

1王永康,艾山·吾买尔,顾亚东,何江涛.TransREF:一种改进的基于邻域信息的知识表示模型[J].电子测量技术,2023,46(21):7-15.
2李恒博,唐波,陈国庆,李晓斌,张龙斌,尚智宇.装配式架线施工导线精确测长设备的研制[J].国外电子测量技术,2023,42(1):100-106. 被引量：2
3窦金花,覃京燕,李瑞琦.基于数字孪生的单兵作战系统设计研究[J].包装工程,2021,42(20):59-65. 被引量：2
4陈丝雨,夏勇.居民用电行为特性分析软件的实现[J].电子技术与软件工程,2021(19):222-223.
5朱剑刚,王旭.木质家具智能制造赋能技术及发展路径分析[J].林业工程学报,2021,6(6):177-183. 被引量：24
6曾怡苗.基于环形数据集的改进K-means聚类算法[J].软件,2021,42(11):74-76. 被引量：1
7党亚南,田照星,郭利强.车载激光雷达点云数据处理关键技术[J].计算机测量与控制,2022,30(1):234-238. 被引量：10
8韩明冲,钟建伟,陈静,黄明,张继学,鄢蓓.面向电力大数据的用电负荷分类及用户用电行为分析[J].物联网技术,2022,12(3):113-115. 被引量：6
9白东壮,田世明,邹毅豪,周颖,徐玉婷,韩凝晖,李永军.基于FDA的居民用户空调用电行为分类分析方法[J].智慧电力,2022,50(3):44-49. 被引量：10
10陈钢.数字孪生技术在石化行业的应用[J].炼油技术与工程,2022,52(4):44-49. 被引量：6

1李亚玲,李涛.改进K-means算法在风电异常数据的识别研究[J].计算机时代,2020,0(2):6-8. 被引量：4
2高帅,徐雅斌,武装.一种抗相似性攻击的匿名保护方法[J].北京信息科技大学学报（自然科学版）,2020,35(4):63-68.
3蔡国军,陈锡锐,尹保国,孙文鹏,程宇航,周扬,赵大安,贾俊.岩体力学参数对反倾边坡稳定性影响的数值模拟研究[J].人民珠江,2020,41(9):25-31. 被引量：6
4陈雯,李冰雪,丁雯,张雪芳.刮痧疗法治疗失眠量学特点的研究现状[J].中医药导报,2020,26(12):101-104. 被引量：4
5岳鹏,马森,李国芳,王红兵,丁旺才.考虑不同轮轨耦合作用的高速列车动力学响应分析[J].兰州交通大学学报,2020,39(4):97-105. 被引量：3

统计与决策

2020年第16期

浏览历史

内容加载中请稍等...

一种新的选取初始聚类中心的K-means算法被引量：25

参考文献8

二级参考文献107

共引文献471

同被引文献344

引证文献25

二级引证文献106

相关作者

相关机构

相关主题

浏览历史

一种新的选取初始聚类中心的K-means算法 被引量：25

参考文献8

二级参考文献107

共引文献471

同被引文献344

引证文献25

二级引证文献106

相关作者

相关机构

相关主题

浏览历史

一种新的选取初始聚类中心的K-means算法被引量：25