K-means聚类算法初始中心选择研究被引量：7

Initial Center Selecting Using K-means Clustering Algorithm

下载PDF

导出

摘要传统K-means聚类算法中聚类初始中心点是随机确定的,实际聚类数据集中可能有孤立点,造成了每次聚类的结果不同,聚类质量不同,有时陷入局部优化状态.针对这些问题,研究者曾试图用距离法解决孤立点的判断和确定初始聚类中心.这种思路存在不科学性.因为孤立点不仅指远离其他点,同时它的周围点稀疏;另外,当数据量过大、数据特征值过多时,算法的运算量大,需要占用大量的计算机资源,运算速度过慢.对传统的K-means聚类算法进行研究,提出了基于密度参数和距离理论的初始聚类中心的确定和孤立点的判断,对传统的K-means聚类算法进行改进. Traditional K-means clustering algorithm clustering initial centers are randomly determined. The actualclustering data set may have isolated points,resulting in a different outcome of each clustering,and the differentclustering quality,sometimes caused the local optimization status. To solve these problems,researchers have tried touse the distance method to solve an isolated points and determine the initial cluster centers. This idea exists unscientific,because not only the isolated points are far away from other points around,but also the points are sparse;in addition,when the data volume is too large,with too much data characteristic value,large amount of computation algorithm,itwould take a lot of computer resources,the computing speed would be too slow. In this paper,by reseaching thetraditional K-means clustering algorithm,the judgments of initial centers and outliers are proposed based on densityparameters and initial cluster theory of the distance from the centers,and the traditional K-means clustering algorithm isimproved.

作者杨金花刘显为

机构地区西安铁路职业技术学院西北工业大学

出处《河南科学》 2016年第3期348-351,共4页 Henan Science

关键词 K-MEANS聚类算法 K个聚类中心密度参数 K-means算法改进 K-means clustering algorithm K cluster centers density parameter K-means algorithm improvement

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献15

1孙可,刘杰,王学颖.K均值聚类算法初始质心选择的改进[J].沈阳师范大学学报（自然科学版）,2009,27(4):448-450. 被引量：15
2逄玉俊,柳明,李元.k均值聚类分析在过程改进中的应用[J].华中科技大学学报（自然科学版）,2009,37(S1):245-247. 被引量：9
3安建成,史德增.一种改进的K-means算法[J].电脑开发与应用,2011,24(4):39-40. 被引量：6
4孙庚,冯艳红,郭显久,张春平.K-means聚类算法研究[J].长春师范学院学报（自然科学版）,2011,30(1):1-4. 被引量：9
5张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：43
6张雪凤,张桂珍,刘鹏.基于聚类准则函数的改进K-means算法[J].计算机工程与应用,2011,47(11):123-127. 被引量：41
7谭庆.基于k-means聚类算法的试卷成绩分析研究[J].河南大学学报（自然科学版）,2009,39(4):412-415. 被引量：20
8苏瑞.基于层次的模糊K均值聚类算法研究[J].安阳师范学院学报,2010(2):47-50. 被引量：3
9张晓翊,孟德欣,余翠兰.基于K-means算法的学生试卷成绩分析[J].宁波大学学报（理工版）,2010,23(4):67-70. 被引量：6
10李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39

二级参考文献118

1朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
2司永胜,刘刚,高瑞.基于K-均值聚类的绿色苹果识别技术[J].农业机械学报,2009,40(S1):100-104. 被引量：50
3逄玉俊,柳明,李元.k均值聚类分析在过程改进中的应用[J].华中科技大学学报（自然科学版）,2009,37(S1):245-247. 被引量：9
4姜园,张朝阳,仇佩亮,周东方.用于数据挖掘的聚类算法[J].电子与信息学报,2005,27(4):655-662. 被引量：67
5陈涛,宋妍,谢阳群.基于IIG和LSI组合特征提取方法的文本聚类研究[J].情报学报,2005,24(2):203-209. 被引量：14
6刘罗曼,张颖南.因子分析和聚类分析的一个简单应用[J].沈阳师范大学学报（自然科学版）,2005,23(2):130-132. 被引量：8
7张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
8何昭水,谢胜利,傅予力.信号的稀疏性分析[J].自然科学进展,2006,16(9):1167-1173. 被引量：12
9钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
10袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152

共引文献375

1宋志飞,彭金莲.海南农垦耕地类型的聚类分析[J].计算机应用研究,2020,37(S01):88-91. 被引量：1
2王秀芳,王岩.优化K均值随机初始中点的改进算法[J].化工自动化及仪表,2012,39(10):1302-1304. 被引量：4
3郑攀,庹武.基于K-means聚类算法的女裤弹性面料分类研究[J].国际纺织导报,2014,42(5):71-72. 被引量：1
4吴东飞,金玉龙,蒋建国.基于TMS320DM6467和TMS320C6472的高清视频处理系统[J].数据采集与处理,2012,27(S2):227-234.
5高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报（社会科学版）,2013,28(4):109-112.
6周顺先,林亚平,王耀南,易叶青.基于聚簇隐马尔可夫模型的文本信息抽取[J].系统仿真学报,2007,19(21):4926-4931. 被引量：2
7吴艳文,胡学钢.一种K-means算法的k值优化方案[J].巢湖学院学报,2007,9(6):21-24. 被引量：6
8耿晴.基于SSPG的空间聚类初始种子选择方法[J].地理空间信息,2008,6(4):58-61. 被引量：1
9魏士俨.基于SOM神经网的方向纹理分割[J].中国科技信息,2009(4):53-54.
10张琪,胡昌华,乔玉坤.基于聚类粒子滤波器的故障预报方法研究[J].信息与控制,2009,38(1):115-120. 被引量：3

同被引文献43

1吴世农,黄世忠.企业破产的分析指标和预测模型[J].中国经济问题,1987(6):8-15. 被引量：123
2张文君,顾行发,陈良富,余涛,许华.基于均值-标准差的K均值初始聚类中心选取算法[J].遥感学报,2006,10(5):715-721. 被引量：57
3孙宇锋.基于MATLAB的模糊聚类分析及应用[J].韶关学院学报,2006,27(9):1-4. 被引量：31
4周首华,杨济华,王平.论财务危机的预警分析——F分数模式[J].会计研究,1996(8):8-11. 被引量：454
5孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1065
6陈寿文,李明东.基于面向对象思想KMeans算法实现[J].滁州学院学报,2008,10(3):42-44. 被引量：7
7赖玉霞,刘建平,杨国兴.基于遗传算法的K均值聚类分析[J].计算机工程,2008,34(20):200-202. 被引量：70
8张健沛,杨悦,杨静,张泽宝.基于最优划分的K-Means初始聚类中心选取算法[J].系统仿真学报,2009,21(9):2586-2590. 被引量：61
9汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：139
10韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：91

引证文献7

1尹晓丽.重心随机漂移KMeans聚类算法的设计[J].长春大学学报,2017,27(8):35-38. 被引量：2
2蒋丽,薛善良.优化初始聚类中心及确定K值的K-means算法[J].计算机与数字工程,2018,46(1):21-24. 被引量：24
3杨莉云,颜远海.基于孤立点自适应的K-means算法[J].河南科学,2019,37(4):507-513. 被引量：4
4杨文君.k＿m eans算法初始聚类中心点选取方法研究[J].科学技术创新,2019(33):84-85. 被引量：1
5任楚岚,乔天宇,张阳.基于改进K-means聚类算法聚类点选取办法的研究[J].网络安全技术与应用,2020(6):49-50. 被引量：3
6曾如明,李云飞.K-means聚类算法的一种改进方法研究[J].邵阳学院学报（自然科学版）,2021,18(2):8-14. 被引量：7
7赵衡,彭铃,李云飞.基于改进K-means聚类算法的上市公司信用风险评估研究[J].内江师范学院学报,2022,37(12):77-83. 被引量：2

二级引证文献41

1卢洪.基于深度学习聚类算法的城市数据分类分级方法[J].工业技术创新,2021,8(4):73-78. 被引量：3
2李艳娟,牛梦婷,李林辉.基于蜂群k-means算法的遥感图像聚类应用研究[J].计算机工程与应用,2019,55(6):151-159. 被引量：20
3王建仁,马鑫,段刚龙.改进的K-means聚类k值选择算法[J].计算机工程与应用,2019,55(8):27-33. 被引量：101
4黄强,叶青,聂斌,李欢.离群点识别方法研究[J].软件导刊,2019,18(6):35-41. 被引量：2
5徐建国,韩琮师.改进K-means算法在高校舆情中的应用[J].软件导刊,2019,18(7):142-144. 被引量：4
6杨红,李丹宁,王雅洁.基于离群点检测(LOF)的K-means算法[J].通信技术,2019,52(8):1884-1888. 被引量：7
7王海燕,崔文超,许佩迪,李闯.一种局部概率引导的优化K-means++算法[J].吉林大学学报（理学版）,2019,57(6):1431-1436. 被引量：7
8包志强,赵媛媛,胡啸天,赵研.一种对孤立点不敏感的新的K-Means聚类算法[J].现代电子技术,2020,43(5):109-112. 被引量：5
9王家伟,王志明,张合.基于视频处理的畜禽屠宰线工位监测研究[J].中国农机化学报,2020,41(2):86-91.
10黄松,邱建林.改进的遗传k-means算法及其应用[J].计算机工程与设计,2020,41(6):1617-1623. 被引量：21

1黄敏,何中市,邢欣来,陈英.一种新的k-means聚类中心选取算法[J].计算机工程与应用,2011,47(35):132-134. 被引量：20
2宋先强,高仲合,刘泷,国凯平.基于数据挖掘的网络异常检测方法的研究[J].电子技术（上海）,2016,43(11):30-32. 被引量：2
3王丽萍,刘建平.基于密度的K-Means算法在客户细分中应用的研究[J].工业控制计算机,2016,29(10):79-80. 被引量：5
4张宇华,余发山,乔峰,张玉伟,张昊.基于遗传算法的IC自适应系统设计[J].焦作工学院学报,2004,23(5):386-388. 被引量：1
5郑丹,王名扬,陈广胜.一种基于距离-期望密度参数的K—means算法[J].山东师范大学学报（自然科学版）,2015,30(4):55-58.
6郭红,黄佳鑫,郭昆.基于增广边簇序列的重叠层次社区发现[J].模式识别与人工智能,2015,28(9):828-838.
7韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：91
8潘建平,郝建明,赵继萍.基于SURF的图像配准改进算法[J].国土资源遥感,2017,29(1):110-115. 被引量：18
9黄伟,巫茜.基于参数自整定的模糊PID控制器及其应用(英文)[J].机床与液压,2013,41(6):81-86. 被引量：7
10韩凌波.基于密度的K-means初始聚类中心选取算法[J].电子科技,2015,28(7):105-107. 被引量：8

河南科学

2016年第3期

浏览历史

内容加载中请稍等...

K-means聚类算法初始中心选择研究被引量：7

参考文献15

二级参考文献118

共引文献375

同被引文献43

引证文献7

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

K-means聚类算法初始中心选择研究 被引量：7

参考文献15

二级参考文献118

共引文献375

同被引文献43

引证文献7

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

K-means聚类算法初始中心选择研究被引量：7