基于粒计算的K-medoids聚类算法被引量：39

New K-medoids clustering algorithm based on granular computing

下载PDF

导出

摘要传统K-medoids聚类算法的聚类结果随初始中心点不同而波动,且计算复杂度较高不适于处理大规模数据集;快速K-medoids聚类算法通过选择合适的初始聚类中心改进了传统K-medoids聚类算法,但是快速K-medoids聚类算法的初始聚类中心有可能位于同一类簇。为克服传统K-medoids聚类算法和快速K-medoids聚类算法的缺陷,提出一种基于粒计算的K-medoids聚类算法。算法引入粒度概念,定义新的样本相似度函数,基于等价关系产生粒子,根据粒子包含样本多少定义粒子密度,选择密度较大的前K个粒子的中心样本点作为K-medoids聚类算法的初始聚类中心,实现K-medoids聚类。UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明了基于粒计算的K-medoids聚类算法能得到更好的初始聚类中心,聚类准确率和聚类误差平方和优于传统K-medoids和快速K-medoids聚类算法,具有更稳定的聚类结果,且适用于大规模数据集。 Traditional K-medoids clustering algorithm has some drawbacks,such as its clustering results being sensitive to initial cluster centers and its deficiency in large datasets.Although the fast K-medoids algorithm overcame the shortcomings of traditional K-medoids,it has the potential disadvantages of selecting the exemplars in the same cluster as initial seeds for different clusters.To overcome the shortcomings of the traditional K-medoids and the fast K-medoids clustering algorithms,a granular computing based K-medoids clustering algorithm was proposed in this paper.The algorithm defined a new similarity function between samples via pooling granularity,where the granules were produced via the equivalence relationship.The density of a granule was defined according to the number of samples in it,after that the K samples closest to the centers of the first K granules were selected as the initial centers for K-medoids clustering algorithm to cluster datasets.The experimental results on the datasets from UCI machine learning repository and on the synthetic datasets all demonstrate that the new granular computing based K-medoids clustering algorithm can find much better initial centers.Its clustering accuracy and its clustering error are better than those of the traditional K-medoids and the fast K-medoids clustering algorithms.It can get much more stable results and can be applied to cluster large datasets.

作者马箐谢娟英

机构地区陕西师范大学计算机科学学院

出处《计算机应用》 CSCD 北大核心 2012年第7期1973-1977,共5页 journal of Computer Applications

基金陕西省自然科学基金资助项目(2010JM3004) 中央高校基本科研业务费专项(GK201102007) 陕西师范大学2011年研究生培养创新基金资助项目(2011CXS029)

关键词传统K-medoids聚类算法快速K-medoids聚类算法粒计算等价关系聚类 traditional K-medoids clustering algorithm fast K-medoids clustering algorithm granular computing equivalence relation clustering

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1KAUFMAN L, ROUSSEEUW P J. Finding groups in data: an introduc- tion to duster analysis [ M]. New York: Wiley, 1990:126 - 163.
2PARK H S, JUN C H. A simple and fast algorithm for K-medoids clustering [ J]. Expert Systems with Applications, 2009, 36(2) :3336 -3341.
3王国胤,张清华,胡军.粒计算研究综述[J].智能系统学报,2007,2(6):8-26. 被引量：111
4ZADEH L A. Fuzzy sets and information granularity [ M]// Fuzzy Sets, Fuzzy Logic and Fuzzy Systems. River Edge, NJ: Word Sei- entitle, 1996:433-448.
5王伦文.聚类的粒度分析[J].计算机工程与应用,2006,42(5):29-31. 被引量：19
6卜东波,白硕,李国杰.聚类/分类中的粒度原理[J].计算机学报,2002,25(8):810-816. 被引量：95
7DINGS F, XU L, ZHU H, et al. Research and progress of cluster algorithms based on granular computing [J]. International Journal of Digital Content Technology and its Applications, 2010, 4(5): 96 - 104.
8夏宁霞,苏一丹,覃希.一种高效的K-medoids聚类算法[J].计算机应用研究,2010,27(12):4517-4519. 被引量：47
9安秋生,沈钧毅,王国胤.基于信息粒度与Rough集的聚类方法研究[J].模式识别与人工智能,2003,16(4):412-417. 被引量：18
10XIE X L, BENI G. A validity measure for fuzzy clustering [ J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1991, 13(8): 841-847.

二级参考文献39

1LingZhang,BoZhang.A Quotient Space Approximation Model of Multiresolution Signal Analysis[J].Journal of Computer Science & Technology,2005,20(1):90-94. 被引量：19
2WANG Guo-yin,HU Feng,HUANG Hai,WU Yu.A Granular Computing Model Based on Tolerance relation[J].The Journal of China Universities of Posts and Telecommunications,2005,12(3):86-90. 被引量：9
3王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量：264
4Yiyu,（Y.Y.）,Yao.Three Perspectives of Granular Computing[J].南昌工程学院学报,2006,25(2):16-21. 被引量：19
5苗夺谦.Rough Set理论在机器学习中的应用研究：博士学位论文[M].北京:中国科学院自动化研究所,1997..
6Vapnik V N.统计学习理论的本质（中文版）[M].北京:清华大学出版社,2000..
7黄萱菁.大规模中文文本的检索、分类与摘要研究：博士学位论文[M].上海:复旦大学,1998..
8Jain A K,Dubes R C.Algorithms for clustering[M].Englewood Cliffs: N J Prentice Hall, 1988.
9Jain A K,Murry M N,Flynn P J.Data clustefing:A survey[J].ACM Comput Surve, 1999 ;31:264-323.
10JiaweiHan.Data Mining Concepts and Techniques[M].China Machine Press. 2001-08 : 223 -263.

共引文献256

1ZHAO Rong-zhen,LIAN Jin.基于邻域粗糙集概念的一种滚动轴承特征提取方法[J].兰州理工大学学报,2019,45(6):34-39. 被引量：2
2洪兴勇,徐银,胡煜.一种新的聚类算法在数据挖掘中的应用[J].舰船电子工程,2008,28(4):165-167. 被引量：4
3辛治运,顾明,马兆丰.基于粗糙集理论的金融信息推荐算法研究[J].计算机研究与发展,2007,44(z2):262-270.
4毛军军,张铃,许义生.基于商空间和信息粒度的Fuzzy聚类分析[J].运筹与管理,2004,13(4):25-29. 被引量：3
5耿志强,朱群雄,李芳.知识粗糙性的粒度原理及其约简[J].系统工程与电子技术,2004,26(8):1112-1116. 被引量：26
6杨明,梁大开,万鹏飞.复合材料结构损伤的属性理论综合评估[J].材料科学与工程学报,2004,22(5):666-668. 被引量：1
7张燕姑.广义模糊粒化本体论在知识工程中的应用——模糊理论本质研究[J].计算机工程与应用,2005,41(1):67-69. 被引量：2
8徐峰,张铃.基于商空间的非均匀粒度聚类分析[J].计算机工程,2005,31(3):26-28. 被引量：14
9巩建闽,王国胜,萧蓓蕾.保持分类能力不变的一种连续属性离散化方法[J].曲阜师范大学学报（自然科学版）,2005,31(1):95-99. 被引量：2
10徐峰,张铃,王伦文.基于商空间理论的模糊粒度计算方法[J].模式识别与人工智能,2004,17(4):424-429. 被引量：11

同被引文献297

1陈海霞,宁宁.人体平衡功能评定研究的最新进展[J].中华现代护理杂志,2006,12(23):2173-2175. 被引量：46
2宋晨希,李明佳,何雅玲,陶文铨.火电厂综合能效评价模型的探索[J].工程热物理学报,2015,36(2):229-233. 被引量：4
3陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
4李道国,苗夺谦,张红云.粒度计算的理论、模型与方法[J].复旦学报（自然科学版）,2004,43(5):837-841. 被引量：41
5周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
6刘勇国,张伟,陈克非,廖晓峰.基于禁忌搜索的聚类簇数目估算算法[J].计算机科学,2005,32(1):168-171. 被引量：2
7张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
8王伦文.聚类的粒度分析[J].计算机工程与应用,2006,42(5):29-31. 被引量：19
9刘英姿,吴昊.客户细分方法研究综述[J].管理工程学报,2006,20(1):53-57. 被引量：86
10郝占刚,王正欧.基于遗传算法和k-medoids算法的聚类新算法[J].现代图书情报技术,2006(5):44-46. 被引量：5

引证文献39

1李莲,罗可,周博翔.一种改进人工蜂群的K-medoids聚类算法[J].计算机工程与应用,2013,49(16):146-150. 被引量：9
2李莲,罗可,周博翔.基于粒计算的粗糙集聚类算法[J].计算机应用研究,2013,30(10):2916-2919. 被引量：9
3代亮,谢晓尧.改进的量子遗传进化激励的快速数据分类算法[J].计算机仿真,2014,31(2):340-343. 被引量：3
4吕康,孟慧丽,马媛媛.基于粒计算的超市会员数据的聚类算法[J].信阳师范学院学报（自然科学版）,2014,27(2):284-287.
5潘楚,罗可.基于改进粒计算的K-medoids聚类算法[J].计算机应用,2014,34(7):1997-2000. 被引量：11
6罗可,陈阳.一种改进禁忌搜索的K-medoids聚类算法[J].长沙理工大学学报（自然科学版）,2014,11(3):72-77. 被引量：1
7许竣玮,徐蔚鸿.基于扰动免疫粒子群和K均值的混合聚类算法[J].计算机工程与应用,2014,50(22):163-169. 被引量：2
8罗志增,王新栋,唐增.静立平衡压力中心参数的年龄性别因素研究[J].航天医学与医学工程,2014,27(6):425-429. 被引量：2
9颜宏文,周雅梅,潘楚.基于宽度优先搜索的K-medoids聚类算法[J].计算机应用,2015,35(5):1302-1305. 被引量：5
10谢娟英,鲁肖肖,屈亚楠,高红超.粒计算优化初始聚类中心的K-medoids聚类算法[J].计算机科学与探索,2015,9(5):611-620. 被引量：13

二级引证文献179

1饶近秋,赵启铎,邱峰.太赫兹时域光谱技术在中药鉴别中的应用进展[J].中国中药杂志,2020,45(4):825-828. 被引量：7
2陈西江,安庆,班亚,王德欣,李坤,刘海鹏.融合高斯核及指数函数聚类的点云目标物提取[J].应用科学学报,2022,40(3):411-422.
3管雪婷,石鸿雁.融合云模型优化萤火虫的K-mediods聚类算法[J].统计与决策,2021(5):34-39. 被引量：3
4佐磊,胡小敏,何怡刚,孙洪凯,李兵.小样本数据处理的加速寿命预测方法[J].电子测量与仪器学报,2020,32(11):26-32. 被引量：8
5梁敏渝.新一代背投电视大巡礼[J].实用影音技术,2000(3):22-26.
6吕透莲意欲何为[J].新华月报,2000(5):42-43.
7潘楚,罗可.基于改进粒计算的K-medoids聚类算法[J].计算机应用,2014,34(7):1997-2000. 被引量：11
8周晓,冬雷,郝颖,廖晓钟,高阳.基于膨胀腐蚀聚类方法的风电功率预测[J].太阳能学报,2018,39(12):3536-3543. 被引量：3
9罗可,陈阳.一种改进禁忌搜索的K-medoids聚类算法[J].长沙理工大学学报（自然科学版）,2014,11(3):72-77. 被引量：1
10熊众望,罗可.基于改进的简化粒子群聚类算法[J].计算机应用研究,2014,31(12):3550-3552. 被引量：7

1谢娟英,鲁肖肖,屈亚楠,高红超.粒计算优化初始聚类中心的K-medoids聚类算法[J].计算机科学与探索,2015,9(5):611-620. 被引量：13
2李莲,罗可,周博翔.一种改进人工蜂群的K-medoids聚类算法[J].计算机工程与应用,2013,49(16):146-150. 被引量：9
3潘楚,罗可.基于改进粒计算的K-medoids聚类算法[J].计算机应用,2014,34(7):1997-2000. 被引量：11
4潘楚,张天伍,罗可.两种新搜索策略对K-medoids聚类算法建模[J].小型微型计算机系统,2015,36(7):1453-1457. 被引量：5
5张雪萍,龚康莉,赵广才.基于MapReduce的K-Medoids并行算法[J].计算机应用,2013,33(4):1023-1025. 被引量：33
6颜宏文,周雅梅,潘楚.基于宽度优先搜索的K-medoids聚类算法[J].计算机应用,2015,35(5):1302-1305. 被引量：5
7罗可,陈阳.一种改进禁忌搜索的K-medoids聚类算法[J].长沙理工大学学报（自然科学版）,2014,11(3):72-77. 被引量：1
8蒋君,徐蔚鸿,潘楚.基于粒计算和模拟退火的K-medoids聚类算法[J].计算机仿真,2015,32(12):214-217. 被引量：6
9Intel和Micron开始提供50nm NAND闪存样片[J].电子产品世界,2006,13(08X):18-18.
10谢娟英,高瑞.方差优化初始中心的K-medoids聚类算法[J].计算机科学与探索,2015,9(8):973-984. 被引量：13

计算机应用

2012年第7期

浏览历史

内容加载中请稍等...

基于粒计算的K-medoids聚类算法被引量：39

参考文献11

二级参考文献39

共引文献256

同被引文献297

引证文献39

二级引证文献179

相关作者

相关机构

相关主题

浏览历史

基于粒计算的K-medoids聚类算法 被引量：39

参考文献11

二级参考文献39

共引文献256

同被引文献297

引证文献39

二级引证文献179

相关作者

相关机构

相关主题

浏览历史

基于粒计算的K-medoids聚类算法被引量：39