K-MEANS算法中的K值优化问题研究被引量：188

Optimization Study on k Value of K-means Algorithm

导出

摘要在空间聚类中,最佳聚类数K求解的关键是构造合适的聚类有效性函数.典型K-平均算法中的聚类数K必须是事先给定的确定值,然而,实际中K很难被精确地确定,使得该算法对一些实际问题无效.文章提出距离代价函数作为最佳聚类数的有效性检验函数,建立了相应的数学模型,并据此设计了一种新的K值优化算法.同时,给出了K值最优解KOPT及其上界KMAX的条件,在理论上证明了经验规则KMAX≤N的合理性,实例结果进一步验证了新方法的有效性. In spatial clustering, the key factor to solve the problem of optimal class number is to construct a proper cluster validity function. The value of k must be confirmed in advance to exert K-means algorithm. However, it can not be clearly and easily confirmed in fact for its uncertainty, This paper recommends a distance cost function based on Euclidean distance to confirm the optimal class number, sets np a corresponding math model and designs a flew optimization algorithm of k value. At the same time, the conditions of optimal solution kopt and its up limit k are presented in this paper. The experiential rule which is usually expressed as kmax≤√n is theoretically proved to be reasonable. Results come from the example also show the validity of this new algorithm.

作者杨善林李永森胡笑旋潘若愚

机构地区合肥工业大计算机网络系统研究所

出处《系统工程理论与实践》 EI CSCD 北大核心 2006年第2期97-101,共5页 Systems Engineering-Theory & Practice

基金国家自然科学基金(70471046) 国家教育部博士学科点基金(20040359004)

关键词空间聚类 K-平均算法距离代价函数 k值优化 spatial clustering K-means algorithm distance cost function optimization of k

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1Treshansky A,McGraw R.An overview of clustering algorithms[A].Proceedings of SPIE,The International Society for Optical Engineering[C].2001(4367):41-51.
2Clausi D A.K-means Iterative Fisher (KIF) unsupervised clustering algorithm applied to image texture segmentation[J].Pattern Recognition,2002,35:1959-1972.
3Bezdek J C,Pal N R.Some new indexes of cluster validity[J].IEEE Transactions on Systems,Man,and Cybernetics _ Part B:Cybernetics,1998,28(3):301-315.
4Ramze R M,Lelieveldt B P F,Reiber J H C.A new cluster validity indexes for the fuzzy c-mean[J].Pattern Recognition Letters,1998,19:237-246.
5于剑,程乾生.模糊聚类方法中的最佳聚类数的搜索范围[J].中国科学（E辑）,2002,32(2):274-280. 被引量：130
6范九伦,裴继红,谢维信.聚类有效性函数:熵公式[J].模糊系统与数学,1998,12(3):68-74. 被引量：19

二级参考文献2

1范九伦,裴继红,谢维信.基于可能性分布的聚类有效性[J].电子学报,1998,26(4):113-115. 被引量：41
2于剑,程乾生.模糊划分的一个新定义及其应用[J].北京大学学报（自然科学版）,2000,36(5):619-623. 被引量：9

共引文献147

1徐艺萍,邓辉文,李阳旭.一种新的最近邻聚类算法[J].西南师范大学学报（自然科学版）,2006,31(6):114-116. 被引量：8
2徐艺萍,邓辉文,徐永刚.一种改进的模糊C—均值聚类算法[J].徐州工程学院学报,2008(4):34-36. 被引量：2
3安中华,安琼.优化模糊聚类的一种方法[J].数量经济技术经济研究,2004,21(10):77-82. 被引量：4
4张莉,孙钢,郭军.基于K-均值聚类的无监督的特征选择方法[J].计算机应用研究,2005,22(3):23-24. 被引量：29
5王海军,魏小鹏.面向规模化产品族的数值规划方法[J].计算机辅助设计与图形学学报,2005,17(3):473-478. 被引量：15
6张倩生.基于粗-模糊神经网络的决策控制[J].控制理论与应用,2005,22(2):330-334. 被引量：6
7陈建军,李波,梁震涛,马娟.基于信息熵的模糊随机桁架结构动力特性分析[J].机械强度,2005,27(3):296-300.
8张晓杰,王巍巍.基于C—均值模糊聚类的工程结构构件自动归并方法研究[J].四川建筑科学研究,2005,31(4):14-18. 被引量：2
9杨国权,蔡玉俊,庞俊忠.一种基于P-中位的产品单元化形成方法[J].华北工学院学报,2005,26(4):251-254.
10岳士弘,王正友.二分网格聚类方法及有效性[J].计算机研究与发展,2005,42(9):1505-1510. 被引量：15

同被引文献1695

1宁剑,江长明,张哲,张勇,郭磊,史沛然,顾云汉.可调节负荷资源参与电网调控的思考与技术实践[J].电力系统自动化,2020(17):1-9. 被引量：69
2刘文一,孙伟,朱良明,赵志博.舰载飞行器打击水面舰艇编队队形识别和目标选择方法[J].兵器装备工程学报,2020,41(2):85-89. 被引量：11
3谭国臣,王晓涛,娜嘉,刘树华,于建永.高校人力资源管理信息系统的开发[J].鲁东大学学报（自然科学版）,2007,23(3):233-236. 被引量：6
4刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：22
5徐小斌,李传昭,徐锦秀,徐小凤.基于面板数据的中国能源与经济增长关系研究[J].生产力研究,2007(21):84-85. 被引量：7
6高凤荣,邢春晓,杜小勇,王珊.基于矩阵聚类的协作过滤算法[J].华中科技大学学报（自然科学版）,2005,33(z1):257-260. 被引量：3
7曾文华,马健.支持向量机增量学习的算法与应用[J].计算机集成制造系统-CIMS,2003,9(z1):144-148. 被引量：27
8陈军,赵仁亮,乔朝飞.基于Voronoi图的GIS空间分析研究[J].武汉大学学报（信息科学版）,2003,28(S1):32-37. 被引量：83
9张月琴,刘静.一种改进的聚类算法在入侵检测中的应用[J].太原理工大学学报,2008,39(S1):74-76. 被引量：2
10尚艳柳,李丽霞.浅谈电力营销工作中承兑汇票的收取流程[J].长治学院学报,2008,25(S1):85-87. 被引量：1

引证文献188

1段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
2刘文一,孙伟,朱良明,赵志博.舰载飞行器打击水面舰艇编队队形识别和目标选择方法[J].兵器装备工程学报,2020,41(2):85-89. 被引量：11
3刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：22
4楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
5韩丽苹,孟海东,李海荣.聚类算法在矿产资源与经济发展关系研究中的应用[J].煤炭技术,2015,34(5):290-292.
6李桃迎,陈燕.一种改进FCM的快速优化算法及其应用[J].大连海事大学学报,2006,32(4):23-27. 被引量：4
7郭海湘,诸克军,李玥,王得运.软计算与硬计算融合的中国石油需求预测[J].中国地质大学学报（社会科学版）,2007,7(6):24-28. 被引量：2
8孙薇,张省.基于半监督支持向量机的供电企业安全性评价[J].电气应用,2008,27(1):57-60. 被引量：1
9刘茵,李弼程,郭映月.一种基于聚类算法的主旨句提取方法[J].情报学报,2008,27(1):49-55. 被引量：1
10施培蓓,钱雪忠,汪中.基于均衡化函数的快速K-means算法[J].计算机工程与应用,2008,44(3):189-191. 被引量：1

二级引证文献1356

1梁力伟,丁长松,黄辛迪,梁昊,蔡雄.基于重叠社区的“方-药”网络经方配伍规律分析[J].中草药,2020,51(2):496-506. 被引量：5
2张成,郑晓芳,郭青秀,冯立伟,戴絮年,李元.邻域保持嵌入—加权k近邻故障检测算法及其在半导体蚀刻过程中的应用[J].信息与控制,2019,48(6):738-744.
3牛一凡,邵景峰.基于非线性数据融合的设备多阶段寿命预测[J].信息与控制,2019,48(6):729-737. 被引量：8
4赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：4
5陈国飞,沈媛,宋琦,张百霞.基于基因表达谱相似性的四物汤重定位及抗乳腺癌有效成分群辨识[J].世界科学技术-中医药现代化,2021,23(9):3217-3225. 被引量：2
6陈世楼,洪松琛,孙鹏.基于历史数据分析的采购策略智能推荐模型研究[J].企业改革与管理,2021(9):7-8. 被引量：3
7孟志强,李蛟.基于高校本科生借阅兴趣标签的图书馆馆藏空间服务创新研究[J].情报科学,2022,40(12):143-151. 被引量：1
8郭继红,李艳钰.基于RFID的水果包装和自动配送系统研究[J].农机化研究,2020,42(10):251-254. 被引量：1
9黄贤英,阳安志,刘小洋,刘广峰.融合兴趣的微博用户相似度计算研究[J].计算机应用研究,2020,37(1):66-70. 被引量：1
10王丽君.造纸机PLC程序结构化优化设计探讨[J].造纸科学与技术,2019,38(6):35-38. 被引量：4

1李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
2王全,杨国梁.一种改进的K平均聚类算法[J].国外电子元器件,2008(9):73-74. 被引量：4
3何云斌,肖宇鹏,万静,李松.基于密度期望和有效性指标的K-均值算法[J].计算机工程与应用,2013,49(24):105-111. 被引量：10
4顾洪博.基于k-means算法的k值优化的研究与应用[J].海南大学学报（自然科学版）,2009,27(4):386-389. 被引量：6
5黄美璇.一种基于Kmax的K-means改进算法[J].佛山科学技术学院学报（自然科学版）,2010,28(2):49-52. 被引量：1
6韩凌波.一种新的K-means最佳聚类数确定方法[J].现代计算机,2013,19(20):12-15. 被引量：9
7刘一松,朱丹.基于聚类与二分图匹配的语义Web服务发现[J].计算机工程,2016,42(2):157-163. 被引量：6
8胡伟,徐福缘.一种改进的免疫算法研究及其应用[J].微电子学与计算机,2011,28(12):14-16. 被引量：2
9夏士雄,李文超,周勇,张磊,牛强.一种改进的k-means聚类算法(英文)[J].Journal of Southeast University(English Edition),2007,23(3):435-438. 被引量：16
10周世兵,徐振源,唐旭清.新的K-均值算法最佳聚类数确定方法[J].计算机工程与应用,2010,46(16):27-31. 被引量：90

系统工程理论与实践

2006年第2期

浏览历史

内容加载中请稍等...

K-MEANS算法中的K值优化问题研究被引量：188

参考文献6

二级参考文献2

共引文献147

同被引文献1695

引证文献188

二级引证文献1356

相关作者

相关机构

相关主题

浏览历史

K-MEANS算法中的K值优化问题研究 被引量：188

参考文献6

二级参考文献2

共引文献147

同被引文献1695

引证文献188

二级引证文献1356

相关作者

相关机构

相关主题

浏览历史

K-MEANS算法中的K值优化问题研究被引量：188