基于稠密区域的K-medoids聚类算法被引量：6

Novel K-medoids clustering algorithm based on dense regional block

下载PDF

导出

摘要针对传统K-medoids聚类算法对初始中心点敏感,以及迭代次数较高等缺点,提出一种可行的初始化方法和中心点搜索更新策略。新算法首先利用密度可达思想为数据集中每个对象建立一个稠密区域,遴选出K个密度大且距离较远的稠密区域,把对应的稠密区域的核心对象作为聚类算法的K个初始中心点;其次,把K个中心点搜索更新范围锁定在所选的K个有效稠密区域里。新算法在Iris、Wine、PId标准数据集中测试,获取了理想中心点和稠密区域,并且在较少的迭代次数内收敛到最优解或近似最优解。 In view of the traditional K-medoids clustering algorithm is sensitive to the initial center, as well as the shortcomingof high number of iterations, put forward a feasible initialization method and a center search update strategy. New algorithmfirstly using the density-reachable thought to establish a dense regional block for each object of the data set, select Kdense regional blocks which their densities are larger and the distance are far away for each selected dense regionalblocks, put the core object of the corresponding dense regional blocks as the K initial centers;Secondly, the centers searchupdate scope is locking the K selected effective dense regional blocks. Tested on Iris, Wine and PId standard data sets,this new algorithm obtains ideal initial centers and dense regional blocks, what’s more, converges to the optimal solutionor approximate optimum solution within less number of iterations.

作者赵湘民陈曦潘楚 ZHAO Xiangmin;CHEN Xi;PAN Chu(Institute of Computer and Communication Engineering, Changsha University of Sciences and Technology, Changsha 410114, China;Changsha College of Commerce & Tourism, Changsha 410004, China;College of Computer Science and Electronic Engineering, Hunan University, Changsha 410082, China)

机构地区长沙理工大学计算机与通信工程学院长沙商贸旅游职业技术学院湖南大学信息科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2016年第16期85-89,99,共6页 Computer Engineering and Applications

基金国家自然科学基金(青年)资助项目(No.61402056 No.61303043) 湖南省研究生科研创新项目(No.CX2014B386)

关键词 K-medoids聚类算法稠密区域初始中心点中心点搜索更新 K-medoids clustering algorithm dense regional block initial center center search update

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1翟东海,鱼江,高飞,于磊,丁锋.最大距离法选取初始簇中心的K-means文本聚类算法的研究[J].计算机应用研究,2014,31(3):713-715. 被引量：108
2马箐,谢娟英.基于粒计算的K-medoids聚类算法[J].计算机应用,2012,32(7):1973-1977. 被引量：39
3Amineh Amini,Teh Ying Wah,Hadi Saboohi.On Density-Based Data Streams Clustering Algorithms: A Survey[J].Journal of Computer Science & Technology,2014,29(1):116-141. 被引量：10
4孟颖,罗可,姚丽娟,王琳.一种基于ACO的K-medoids聚类算法[J].计算机工程与应用,2012,48(16):136-139. 被引量：9
5夏宁霞,苏一丹,覃希.一种高效的K-medoids聚类算法[J].计算机应用研究,2010,27(12):4517-4519. 被引量：47
6潘楚,罗可.基于改进粒计算的K-medoids聚类算法[J].计算机应用,2014,34(7):1997-2000. 被引量：11
7于彦伟,王沁,邝俊,何杰.一种基于密度的空间数据流在线聚类算法[J].自动化学报,2012,38(6):1051-1059. 被引量：28
8姚丽娟,罗可,孟颖.一种新的k-medoids聚类算法[J].计算机工程与应用,2013,49(19):153-157. 被引量：18

二级参考文献89

1高小梅,冯云,冯兴杰.增量式K-Medoids聚类算法[J].计算机工程,2005,31(B07):181-183. 被引量：9
2陈卓,孟庆春,魏振钢,任丽婕,窦金凤.一种基于网格和密度凝聚点的快速聚类算法[J].哈尔滨工业大学学报,2005,37(12):1654-1657. 被引量：14
3王伦文.聚类的粒度分析[J].计算机工程与应用,2006,42(5):29-31. 被引量：19
4朱蔚恒,印鉴,谢益煌.基于数据流的任意形状聚类算法[J].软件学报,2006,17(3):379-387. 被引量：51
5徐晓华,陈崚.一种自适应的蚂蚁聚类算法[J].软件学报,2006,17(9):1884-1889. 被引量：55
6刘波,潘久辉.基于蚁群优化的分类算法的研究[J].计算机应用与软件,2007,24(4):50-53. 被引量：11
7彭京,杨冬青,唐世渭,付艳,蒋汉奎.一种基于语义内积空间模型的文本聚类算法[J].计算机学报,2007,30(8):1354-1363. 被引量：44
8HAN Jia-wei,KAMBER M.数据挖掘概念与技术[M].2版.北京:机械工业出版社,2008:263-266.
9CHEN Xin-quan,PENG Hong,HU Jing-song.K-medoids substitution clustering method and a new clustering validity index method[C] //Proc of the 6th World Congress on Intelligent Control and Automation.2006:5896-5900.
10HE Zeng-you.Farthest-point heuristic based initialization methods for K-modes clustering[EB/OL].(2006-10-10).http://arxiv.org/ftp/cs/papers/0610/0610043.pdf.

共引文献235

1张雅琳,王虹,程田莉.基于聚类分析的全源导航算法数据多层次评估[J].微波学报,2021,37(S01):220-224. 被引量：3
2段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
3刘建华,王进,杨洪春,孟颖.基于ACO-PAM综合算法的电力负荷聚类分析[J].电力科学与技术学报,2011,26(4):94-99. 被引量：6
4刘呈龙,贾胜颖,张丽萍,刘东升.基于AST的代码抄袭检测方法研究[J].计算机工程与设计,2012,33(4):1660-1664. 被引量：7
5马箐,谢娟英.基于粒计算的K-medoids聚类算法[J].计算机应用,2012,32(7):1973-1977. 被引量：39
6蔡悦洁,胡方明.一种基于LEACH路由协议的改进算法[J].电子科技,2012,25(8):128-131. 被引量：3
7赵烨,黄泽君.蚁群K-medoids融合的聚类算法[J].电子测量与仪器学报,2012,26(9):800-804. 被引量：10
8左国才,周荣华,黎自强.改进k-means算法在电信CRM客户分类中的应用[J].计算机系统应用,2012,21(11):153-155. 被引量：4
9于彦伟,王沁,王小东,王欢,何杰.面向实时查询处理的轨迹流挖掘框架[J].仪器仪表学报,2012,33(12):2803-2811. 被引量：1
10李莲,罗可,周博翔.一种改进人工蜂群的K-medoids聚类算法[J].计算机工程与应用,2013,49(16):146-150. 被引量：9

同被引文献50

1余建桥,张帆.基于数据场改进的PAM聚类算法[J].计算机科学,2005,32(1):165-167. 被引量：15
2高小梅,冯云,冯兴杰.增量式K-Medoids聚类算法[J].计算机工程,2005,31(B07):181-183. 被引量：9
3孟伟,韩学东,洪炳镕.蜜蜂进化型遗传算法[J].电子学报,2006,34(7):1294-1300. 被引量：78
4蔡元萃,陈立潮.聚类算法研究综述[J].科技情报开发与经济,2007,17(1):145-146. 被引量：21
5贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量：225
6张钊,王锁柱,张雨.一种基于SOM和PAM的聚类算法[J].计算机应用,2007,27(6):1400-1402. 被引量：8
7孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1074
8慕彩红,焦李成,刘逸.M-精英协同进化数值优化算法[J].软件学报,2009,20(11):2925-2938. 被引量：30
9李静滨,杨柳,华蓓.基于多核平台并行K-Medoids算法研究[J].计算机应用研究,2011,28(2):498-500. 被引量：9
10王世卿,张书春.基于网格结构的快速PAM算法[J].计算机工程与设计,2011,32(3):952-954. 被引量：2

引证文献6

1陈静杰,车洁.基于IK-medoids算法的飞机油耗聚类方法[J].计算机科学,2018,45(8):306-309. 被引量：5
2宋飞豹,贾瑞玉.精英遗传K-medoids聚类算法[J].计算机工程与应用,2018,54(22):144-149. 被引量：8
3韩冰,姜合.一种非独立同分布下针对数值型数据的PAM改进算法[J].齐鲁工业大学学报,2019,33(2):56-61.
4韩冰,姜合.基于相似度计算公式改进的K-中心点算法[J].计算机与现代化,2019(5):113-117. 被引量：2
5陈胜发,贾瑞玉.基于密度权重Canopy的改进K-medoids算法[J].计算机工程与科学,2019,41(10):1823-1828. 被引量：8
6王宗山,丁洪伟,李波,李浩,李艾珊.能量高效的WSNs分簇路由协议[J].计算机工程与设计,2021,42(2):324-330. 被引量：9

二级引证文献32

1胡聪,徐敏,洪德华,刘翠玲,薛晓茹,王海鑫.基于改进K-medoids聚类和SVM的异常用电模式在线检测方法[J].国外电子测量技术,2022,41(2):53-59. 被引量：8
2秦映波,曹步清,邓春晖.一种基于竞争型群体优化的数据聚类方法[J].计算机与现代化,2019(1):75-79. 被引量：3
3陈静杰,崔金成.基于不同采样率的短航程油耗估计[J].科学技术与工程,2019,19(24):254-259. 被引量：1
4付宏鹏.基于K-medoids聚类的层次化教学质量提升评估研究[J].现代电子技术,2019,42(23):110-114.
5刘佳耀,王佳斌.Slope One算法的改进及其在大数据平台的实现[J].计算机工程与应用,2020,56(1):83-91. 被引量：5
6汤洪涛,闫伟杰,陈青丰,鲁建厦,詹燕.自动化立体仓库货位分配与作业调度集成优化[J].计算机科学,2020,47(5):204-211. 被引量：23
7陈胜发,贾瑞玉.基于残差和密度网格的簇心自确认聚类算法[J].计算机工程与应用,2020,56(12):149-155.
8贾瑞玉,宋飞豹,汤深伟.双精英遗传策略的基因聚类算法[J].小型微型计算机系统,2020,41(7):1375-1380. 被引量：7
9邓玉芳,张继福.一种基于标准差的K-medoids聚类算法[J].计算机技术与发展,2020,30(8):53-60. 被引量：4
10郭雪昆,秦远辉,杜亮,罗永亮,王宏安.基于MEBN的大型舰船舰面保障作业检测[J].计算机工程与应用,2021,57(1):242-253. 被引量：1

1陈亚丽,张龙波,李彩虹,张树森,刘希昱.数据密集型计算环境下离群点挖掘算法设计与实现[J].山东理工大学学报（自然科学版）,2013,27(5):32-35. 被引量：1
2朱增玺,魏振春,韩江洪,卫星,赵意.WSN中基于多波束转换天线的网络拓扑控制算法[J].计算机系统应用,2014,23(10):183-187.
3刘艳丽,刘希云.一种基于密度的K-均值算法[J].计算机工程与应用,2007,43(32):153-155. 被引量：15
4张净,孙志挥.GDLOF:基于网格和稠密单元的快速局部离群点探测算法[J].东南大学学报（自然科学版）,2005,35(6):863-866. 被引量：6
5韦相.基于密度的改进BIRCH聚类算法[J].计算机工程与应用,2013,49(10):201-205. 被引量：16
6武方方,赵银亮,蒋泽飞.基于密度聚类的支持向量机分类算法[J].西安交通大学学报,2005,39(12):1319-1322. 被引量：11
7张枫,邱保志.基于网格的高效DBSCAN算法[J].计算机工程与应用,2007,43(17):167-169. 被引量：8
8潘楚,张天伍,罗可.两种新搜索策略对K-medoids聚类算法建模[J].小型微型计算机系统,2015,36(7):1453-1457. 被引量：5
9赵剑,韩斌,张其亮.基于改进ORB算法的虚实注册方法[J].计算机应用,2014,34(9):2725-2729. 被引量：2
10杨丹丹.数据挖掘中聚类分析算法性能分析[J].消费电子,2014(16):159-159. 被引量：1

计算机工程与应用

2016年第16期

浏览历史

内容加载中请稍等...

基于稠密区域的K-medoids聚类算法被引量：6

参考文献8

二级参考文献89

共引文献235

同被引文献50

引证文献6

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于稠密区域的K-medoids聚类算法 被引量：6

参考文献8

二级参考文献89

共引文献235

同被引文献50

引证文献6

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于稠密区域的K-medoids聚类算法被引量：6