面向LBSN的k-medoids聚类算法被引量：1

Ak-medoids based clustering algorithm in location based social networks

下载PDF

导出

摘要常用的聚类算法存在诸多不足,为此提出了一种基于初始半径r的k-medoids改进算法,主要针对LBSN中的位置数据进行聚类,改善初始聚类中心敏感对聚类结果的影响,其本质是基于密度聚类,不同之处在于k值的选取是依赖于半径r.通过大量真实签到数据集进行实验,结果显示本文算法聚类结果更稳定.本文算法在基于位置的社交网络应用中获得更好的聚类效果和更快的收敛速度.实验中将距离平方和作为准则函数进行对比,相对于传统k-medoids算法优势明显,对退化的k-medoids算法也能够缩小1.2%到2%. The commonly-used clustering algorithms have several drawbacks. Aiming to solve the above problems, an improved k-medoids algorithm was proposed based on the initial radius r, which is used for clustering using location data. The algorithm is actually a density-based clustering approach. The difference is that the k value depends on the radius r. Extensive experiments are conducted on real check-in data, and the results show that the improved k-mediods algorithm on the radius r is more stable. In addition, by comparing the sum of the square of distance between objects in the same cluster among different algorithms, the proposed algorithm can obtain better clustering results and convergence speed when applied to location based social networks. Compared to the traditional k medoids algorithm, the cost has obviously reduced, as for and the degraded k-medoids algorithm, the cost can be reduced among 1.20% and 2%.

作者罗维佳乔少杰韩楠元昌安闭应洲舒红平

机构地区西南交通大学信息科学与技术学院成都信息工程大学信息安全工程学院成都信息工程大学管理学院广西师范学院科学计算与智能信息处理广西高校重点实验室成都信息工程大学软件工程学院

出处《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第1期70-79,共10页 JUSTC

基金国家自然科学基金(61100045 61165013 61363037) 教育部人文社会科学研究规划基金(15YJAZH058) 教育部人文社会科学研究青年基金(14YJCZH046) 四川省教育厅资助科研项目(14ZB0458) 成都市软科学项目(2015-RK00-00059-ZF) 科学计算与智能信息处理广西高校重点实验室开放课题(GXSCIIP201407)资助

关键词社交网络密度聚类 k-medoids 签到数据距离相似度 social networks density-based clustering k-medoids check-in data distance similarity

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1孙秀娟,刘希玉.基于初始中心优化的遗传K-means聚类新算法[J].计算机工程与应用,2008,44(23):166-168. 被引量：17
2夏宁霞,苏一丹,覃希.一种高效的K-medoids聚类算法[J].计算机应用研究,2010,27(12):4517-4519. 被引量：47
3姚丽娟,罗可,孟颖.一种新的k-medoids聚类算法[J].计算机工程与应用,2013,49(19):153-157. 被引量：18
4李巍,孙涛,陈建孝,罗梓恒,李雄飞.基于加权余弦相似度的XML文档聚类研究[J].吉林大学学报（信息科学版）,2010,28(1):68-76. 被引量：10
5杨志,罗可.一种改进的基于粒子群的粗糙K-medoids算法[J].计算机工程与应用,2014,50(20):110-114. 被引量：2

二级参考文献65

1苏守宝,刘仁金.基于佳点集遗传算法的聚类技术[J].计算机应用,2005,25(3):643-645. 被引量：7
2杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：191
3MacQueen J.Some methods for classification and analysis of multivariate observations[C]//Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability, 1967.
4Wang Wei.Yang Jiong,Muntz R.STING:a statistical information grid approach to spatial data mining[C]//Proc of the 23rd International Conference on Very Large Data Bases,1997.
5Pakhiraa M K,Bandyopadhyayb S I,JjwalMaulikc U.Validity index for crisp and fuzzy clusters[J].Pattern Rccognition,2004,37:487-501.
6Agrawal R,Gehrke J,Gunopulcs D.Automatic subspaee clustering of high dimensional data for data mining application[C]//Proc of ACM SIGMOD Intconfon Management on Data,Seattle,WA,1998:94-205.
7Bandyopadhyay S I,JjwalMaulik U.An evolutionary technique based on K-means algorithm for optimal clustering in RN[J].Information Sciences, 2002,146 : 221-237.
8Guha S,Rastogi R,Shim K.Cure:an efficient clustering algorithm for large database[C]//Proc of ACM-SIGMOND Int Conf Management on Data,Seattle,Washington,1998:73-84.
9Hall L O, Ozyurt I B,Bezdek J C.Clustering with a genetically optimized approach[J].IEEE Transactions on Evolutionary Computation, 1999,3(2) : 103-112.
10Li J,Gao X B,Ji H B.A feature weighted FCM clustering algorithm based on evolutionary strategy[C]//Proeeedings of the 4th World Congress on Intelligent Control and Automation,Shanghai, China, 2003 : 1540-1553.

共引文献84

1曹树志,项响琴.基于改进的K_Means算法的城市高架桥交通流分析[J].公路交通科技（应用技术版）,2010,6(10):261-264.
2潘崇,朱红斌.改进k-means算法在图像标注和检索中的应用[J].计算机工程与应用,2010,46(4):183-185. 被引量：8
3山拜.达拉拜,曹红丽,尤努斯.艾沙.基于遗传算法的K-means初始化EM算法及聚类应用[J].现代电子技术,2010,33(15):102-103. 被引量：1
4洪亮亮,罗可.改进的基于遗传算法的粗糙聚类方法[J].计算机工程与应用,2010,46(25):142-145. 被引量：10
5姚跃华,史秀岭.一种优化初始中心的K-means粗糙聚类算法[J].计算机工程与应用,2010,46(34):126-128. 被引量：14
6曹红丽,山拜.达拉拜.混合EM算法研究及聚类应用[J].通信技术,2010,43(11):150-152. 被引量：1
7周爱武,潘勇,崔丹丹,肖云.AGNES算法在K-means算法中的应用[J].微型机与应用,2011,30(23):79-81. 被引量：2
8刘建华,王进,杨洪春,孟颖.基于ACO-PAM综合算法的电力负荷聚类分析[J].电力科学与技术学报,2011,26(4):94-99. 被引量：6
9刘呈龙,贾胜颖,张丽萍,刘东升.基于AST的代码抄袭检测方法研究[J].计算机工程与设计,2012,33(4):1660-1664. 被引量：7
10陈英,何中市,黄敏.一种优化的K-means聚类中心算法研究[J].制造业自动化,2012,34(8):19-22. 被引量：5

同被引文献7

1吴诗极,李川,唐常杰,李洋涛,曾卫,杨尚乾,杨宁.面向大规模信息网络的高效自适应聚类算法[J].计算机科学与探索,2014,8(4):406-416. 被引量：3
2任重鲁,李金明.非负矩阵分解在微阵列数据分类和聚类发现中的应用[J].计算机工程与科学,2014,36(7):1389-1397. 被引量：5
3张新萍,张孝远,刘杰.基于差分进化算法的模糊核聚类算法及其在故障诊断中的应用[J].电力系统保护与控制,2014,42(17):102-106. 被引量：4
4李欢,刘锋,朱二周.基于改进K-means算法的海量数据分析技术研究[J].微电子学与计算机,2016,33(5):52-57. 被引量：9
5王凤领.一种改进差分进化的自动聚类算法研究[J].数学的实践与认识,2018,48(21):187-194. 被引量：2
6杨青,张亚文,张琴,袁佩玲.基于Hadoop的多维关联规则挖掘算法研究及应用[J].计算机工程与科学,2019,41(12):2127-2133. 被引量：18
7马汉达,郝晓宇,马仁庆.基于Hadoop的并行PSO-kmeans算法实现Web日志挖掘[J].计算机科学,2015,42(S1):470-473. 被引量：13

引证文献1

1邓斌涛,徐胜超.基于动态双子种群的差分进化K中心点聚类算法[J].计算机与现代化,2021(7):54-59. 被引量：2

二级引证文献2

1冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：13
2杨骏,王劲林,倪宏,盛益强.工控网络异常检测中基于灵敏度的动态迁移算法[J].计算机与现代化,2023(5):46-51.

1阜艳,陈杰.距离相似度在支持向量数据描述中的应用[J].广东农工商职业技术学院学报,2010,26(3):70-72.
2李红林,杨莉,伍红玲,陈小骏,申静.基于多种特征的车牌定位方法[J].云南大学学报（自然科学版）,2006,28(S2):94-96.
3阜艳,李霆,黄日辉,汪兆栋.一种改进的支持向量数据描述算法[J].五邑大学学报（自然科学版）,2008,22(2):52-56. 被引量：2
4陈维义,王克明,邓万彬.面向CBR的案例库组织与快速检索方法[J].舰船科学技术,2014,36(4):126-129. 被引量：5
5冷何英,王敬儒,蔡敬菊.基于相似度的双搜索多目标识别算法[J].红外与激光工程,2002,31(6):465-468. 被引量：5
6欧巧凤,张会生,熊邦书,李立欣.二维凝胶图像一致蛋白质点集提取方法[J].计算机应用研究,2014,31(9):2850-2852.
7李兆南,杨博,刘大有.复杂网络社区挖掘的距离相似度算法[J].计算机科学与探索,2011,5(4):336-346. 被引量：3
8李文博,王大轶,刘成瑞.动态系统实际故障可诊断性的量化评价研究[J].自动化学报,2015,41(3):497-507. 被引量：22
9赵兹,马江洪.信息检索中的两个数据融合方法比较[J].计算机应用,2010,30(A01):54-56. 被引量：1
10徐选华,王兵,周艳菊.基于信任机制的不完全信息大群体决策方法[J].控制与决策,2016,31(4):577-585. 被引量：18

中国科学技术大学学报

2017年第1期

浏览历史

内容加载中请稍等...

面向LBSN的k-medoids聚类算法被引量：1

参考文献5

二级参考文献65

共引文献84

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

面向LBSN的k-medoids聚类算法 被引量：1

参考文献5

二级参考文献65

共引文献84

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

面向LBSN的k-medoids聚类算法被引量：1