基于密度可达的多密度聚类算法被引量：7

Density-reachable Based Clustering Algorithm for Multi-density

下载PDF

导出

摘要为对多密度数据集聚类,提出一种基于密度可达的多密度聚类算法。使用网格划分技术来提高计算每个点密度值的效率,每次聚类都是从最高密度点开始,根据密度可达的概念和广度优先的策略逐步向外扩展进行聚类。实验表明,该算法能够有效地对任意形状、大小的均匀数据集和多密度数据集进行聚类,并能较好地识别出孤立点和噪声,其精度和效率优于SNN算法。 In order to cluster multi-density dataset, a clustering algorithm based on density-reachable for multi-density is proposed. Grid partition method is used to improve efficiency when computing each point＇s density. A clustering starts with the highest density point and uses expansion to form a cluster based on density-reachable and breadth-first strategy. Experimental results show that this algorithm can effectively discover clusters of arbitrary shapes for multi-density and uniformity density data sets with noises. It can get good cluster quality and is more efficient than SNN algorithm.

作者薛丽香邱保志

机构地区郑州大学信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2009年第17期66-68,共3页 Computer Engineering

基金国家自然科学基金资助项目(60673087) 郑州大学骨干教师基金资助项目

关键词聚类算法邻域网格密度可达广度优先多密度 clustering algorithm neighborhood grid density-reachable breadth-first multi-density

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1邱保志,沈钧毅.网格聚类中的边界处理技术[J].模式识别与人工智能,2006,19(2):277-280. 被引量：13
2邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量：25
3赵艳厂,宋梅,谢帆,宋俊德.用于不同密度聚类的多阶段等密度线算法[J].北京邮电大学学报,2003,26(2):42-47. 被引量：14

二级参考文献12

1Zhao Yanchang, Song Junde. AGRID: an efficient algorithm for clustering large high-dimensional datasets[A]. Proc the 7th Pacific-Asia Conf on Knowledge Discovery and Data Mining (PAKDD-03)[C]. Seoul ,Korea : 2003.
2Ester M, Kriegel H P, Sander J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[A]. Proc the 2nd Int Conf On Knowledge Discovery and Data Mining[C].Portland, Oregon : 1996. 226-- 231.
3HanJW KamberM.数据挖掘概念与技术[M].机械工业出版社,2001..
4Wang W, Yang J, Muntz R R. STING: A Statistical Information Grid Approach to Spatial Data Mining. In: Proc of the 23rd International Conference on Very Large Data Bases. Athens,Greece, 1997, 186-195
5Sheikholeslami G, Chatterjee S, Zhang A D. WaveCluster: A Multi-Resolution Clustering Approach for Very I.arge Spatial Databases. In: Proc of the 24th International Conference on Very Large Data Bases. New York, USA, 1998, 428-439
6Agrawal R, Gehrke J, Gunopulos D, Raghavan P. Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications. In: Proc of the ACM SIGMOD International Conference on Management of Data. Seattle, USA, 1998, 94-105
7Zhao Y C, Song J D. GDILC: A Grid-Based Density-lsoline Clustering Algorithm. In: Proc of the International Conference on Info-Teeh and Info-Net. Beijing, China, 2001, 140-145
8Hsu C M, Chen M S. Subspace Clustering of High Dimensional Spatial Data with Noises. In: Proe of the Pacific-Asia Conference on Knowledge Discovery and Data Mining. Sydney, Australia, 2004, 31-40
9Ma E W M, Chow T W S. A New Shifting Grid Clustering Algorithm. Pattern Recognition, 2004, 37(3): 503-514
10Hinneburg A, Keim D A. Optional Grid-Clustering: Towards Breaking the Curse of Dimensionality in High-Dimensional Clustering. In: Proc of the 25th International Conference on Very Large Data Bases. Edinburgh, Scotland, 1999, 506-517

共引文献43

1李卫平,张志鸿.基于引力的网格聚类算法[J].光盘技术,2006(5):39-41.
2张西芝,姬波,邱保志.基于网格的多密度聚类算法[J].微计算机信息,2005,21(12X):101-103. 被引量：7
3刘敏娟,柴玉梅.基于网格的共享近邻聚类算法[J].计算机应用,2006,26(7):1673-1675. 被引量：7
4邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量：25
5牛琨,张舒博,陈俊亮.融合网格密度的聚类中心初始化方案[J].北京邮电大学学报,2007,30(2):6-10. 被引量：15
6朵春红,王翠茹.网格和密度的聚类算法在CRM中的应用[J].电子科技大学学报,2007,36(6):1289-1291. 被引量：3
7邱保志,张枫,岳峰.基于统计信息的聚类边界模式检测算法[J].计算机工程,2008,34(3):91-93. 被引量：2
8邱保志,刘洋,陈本华.基于网格熵的边界点检测算法[J].计算机应用,2008,28(3):732-734. 被引量：7
9邱保志,岳峰.基于引力的边界点检测算法[J].小型微型计算机系统,2008,29(2):279-282. 被引量：3
10邱保志,余田.基于网格梯度的边界点检测算法的研究[J].微电子学与计算机,2008,25(3):77-80. 被引量：9

同被引文献88

1吴泓辰,王新军,成勇,彭朝晖.基于协同过滤与划分聚类的改进推荐算法[J].计算机研究与发展,2011,48(S3):205-212. 被引量：20
2祝佳,李生红,李建华.邮件内容过滤的中文编码盲识别算法[J].计算机工程与应用,2005,41(10):131-133. 被引量：1
3岳士弘,王正友.二分网格聚类方法及有效性[J].计算机研究与发展,2005,42(9):1505-1510. 被引量：15
4裘国相,汪思源,王文标.数据挖掘在火电厂运行优化目标值确定中的应用[J].自动化技术与应用,2006,25(3):6-9. 被引量：18
5邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量：25
6王鑫,王洪国,王珺,王金枝.数据挖掘中聚类方法比较研究[J].计算机技术与发展,2006,16(10):20-22. 被引量：22
7李建强,刘吉臻,张栾英,牛成林.基于数据挖掘的电站运行优化应用研究[J].中国电机工程学报,2006,26(20):118-123. 被引量：61
8曹晖.字符集与字符编码标准[J].西北民族大学学报（自然科学版）,2006,27(3):36-42. 被引量：6
9刘敏娟,柴玉梅,张西芝.基于相似度的网格聚类算法[J].计算机工程与应用,2007,43(7):198-201. 被引量：12
10洪军,崔彦锋,毕小龙,司风琪,徐治皋.机组在线运行优化系统及实时目标工况的确定[J].电力系统自动化,2007,31(6):86-90. 被引量：15

引证文献7

1孙英娟,孙英慧,蒲东兵.模糊C均值聚类算法在识别中的应用研究[J].长春师范学院学报（自然科学版）,2010,29(5):13-14. 被引量：4
2章晟,张启飞,潘雪增,朱旭辉.搜索引擎中基于密度聚类的混合编码检测算法[J].数据采集与处理,2011,26(1):95-100.
3陈曦,马一峰.空间数据聚类中的网格粒度求解方法[J].计算机工程,2011,37(19):65-67.
4黄红伟,黄天民.基于网格相对密度差的扩展聚类算法[J].计算机应用研究,2014,31(6):1702-1705. 被引量：12
5高申,龙泽,高诠,龙之玥.基于无损二次衰减调制的电池能耗优化控制方法[J].科技通报,2015,31(6):67-69.
6秦绪华,王秋平,陈志强.基于改进k-means算法的电站最优外部运行工况划分[J].热力发电,2017,46(6):28-33. 被引量：7
7费陈,郑晗,赵亮.无人机集群控制技术研究[J].弹箭与制导学报,2023,43(3):45-55.

二级引证文献23

1刘德馨,李晓理,周翔,陈先中,尹怡欣,侯庆文.模糊C均值聚类算法在高炉料面分类中的应用[J].北京科技大学学报,2012,34(6):683-690. 被引量：6
2杨正理.模糊C-均值聚类算法在动态汽车衡中的应用[J].自动化仪表,2013,34(9):73-77. 被引量：9
3赵伟,任凤国.基于模糊C均值聚类算法的矿井煤炭自燃预测[J].煤矿安全,2015,46(11):183-185. 被引量：2
4徐正国,郑辉,贺亮,姚佳奇.基于局部密度下降搜索的自适应聚类方法[J].计算机研究与发展,2016,53(8):1719-1728. 被引量：6
5刘建军,周廷英.一种基于局部密度的网格排序聚类算法[J].计算机应用研究,2016,33(11):3279-3283. 被引量：2
6陈圣楠,钱红燕,李伟.基于角度方差的多层次高维数据异常检测算法[J].计算机应用研究,2016,33(11):3383-3386. 被引量：14
7徐明钊,杨春,范健,张健,张耐民.一种基于网格的等密度线聚类算法[J].兵器装备工程学报,2017,38(2):88-91. 被引量：2
8钱雪忠,韩利钊,罗靖,宋威.基于动态的网格相对密度差聚类算法研究[J].软件导刊,2017,16(6):32-36. 被引量：1
9刘国满,盛敬,李志和.基于模糊C均值聚类法检测发动机舱火灾[J].消防科学与技术,2017,36(5):721-724. 被引量：2
10林俐,费宏运,刘汝琛,潘险险.基于分层聚类算法的地区风电出力典型场景选取方法[J].电力系统保护与控制,2018,46(7):1-6. 被引量：18

1韦相.基于密度的改进BIRCH聚类算法[J].计算机工程与应用,2013,49(10):201-205. 被引量：16
2武方方,赵银亮,蒋泽飞.基于密度聚类的支持向量机分类算法[J].西安交通大学学报,2005,39(12):1319-1322. 被引量：11
3张枫,邱保志.基于网格的高效DBSCAN算法[J].计算机工程与应用,2007,43(17):167-169. 被引量：8
4周红芳,王鹏.DBSCAN算法中参数自适应确定方法的研究[J].西安理工大学学报,2012,28(3):289-292. 被引量：42
5邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量：25
6孟海东,宋飞燕,郝永宽.基于密度与划分方法的聚类算法设计与实现[J].计算机工程与应用,2007,43(27):171-174. 被引量：4
7辜季艳.基于主动网络技术的网络管理模型研究[J].电子技术与软件工程,2014(19):19-19.
8夏英,李克非,丰江帆.基于网格梯度的多密度聚类算法[J].计算机应用研究,2008,25(11):3278-3280. 被引量：4
9周悦来,谭建豪.基于网格和信息熵的多密度聚类算法[J].计算机系统应用,2011,20(10):189-192. 被引量：3
10潘冬明,黄德才.基于相对密度的不确定数据聚类算法[J].计算机科学,2015,42(B11):72-74. 被引量：9

计算机工程

2009年第17期

浏览历史

内容加载中请稍等...

基于密度可达的多密度聚类算法被引量：7

参考文献3

二级参考文献12

共引文献43

同被引文献88

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于密度可达的多密度聚类算法 被引量：7

参考文献3

二级参考文献12

共引文献43

同被引文献88

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于密度可达的多密度聚类算法被引量：7