DBSCAN算法在高性能计算中心用户分类的应用研究被引量：2

Application Research of DBSCAN Algorithm Based on High-Performance Computing Center Users Classification

下载PDF

导出

摘要为提高集群资源使用效率,管理员需要对用户进行分类,从而对不同用户提出资源使用策略。DBSCAN(Density Based Spatial Clustering of Applications with Noise)聚类算法可对用户进行分类,但对初始参数敏感。为此,提出改进算法,首先将密度进行层次划分,由此得出各层次的密度阈值,在每种阈值下采用DBSCAN算法,解决全局参数问题。在此基础上,创新地使用一个直接可达距离排序队列,将排序信息作为可变参数,减小初始参数对结果的影响。通过高性能计算中心用户数据的实例验证了其可行性。实验结果表明,改进后的算法提高了用户分类的准确性和全面性。 To enhance service efficiency on cluster resource,administrator needs to make classification of users,and provide various strategies on resource utilization to different users.DBSCAN（Density Based Spatial Clustering of Applications with Noise） algorithm can achieve users＇ classification,but the initial parameters are very sensitive.The improved algorithm classifies the level of density firstly,then gets the densitythreshold of each level,and uses DBSCAN under each threshold which solves the problem of global parameters.It uses a sorted queue of directly accessible distance as an innovation,makes the sorting information as variable parameter to decrease the influence of initial parameter.The algorithm has verified its feasibility through example data of HPC users.The experimental result demonstrates that this improved algorithm can achieve a more accurate and comprehensive user classification.

作者徐海啸麻婧吴旗

机构地区吉林大学计算机科学与技术学院吉林大学高性能计算中心

出处《吉林大学学报（信息科学版）》 CAS 2013年第5期528-534,共7页 Journal of Jilin University（Information Science Edition）

基金大学生创新实验国家级基金资助项目(2011A53101)

关键词聚类分析 DBSCAN算法高性能计算中心用户分类数据挖掘 clustering analysis density based spatial clustering of applications with noise（DBSCAN） high performance computing center users classification data mining

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1高迪驹,王天真,刘远,刘洋.一种调整簇阀值的加速聚类分析算法及其应用[J].数据采集与处理,2012,27(3):287-293. 被引量：1
2马帅,王腾蛟,唐世渭,杨冬青,高军.一种基于参考点和密度的快速聚类算法[J].软件学报,2003,14(6):1089-1095. 被引量：108
3王桂芝,王广亮.改进的快速DBSCAN算法[J].计算机应用,2009,29(9):2505-2508. 被引量：24
4武佳薇,李雄飞,孙涛,李巍.邻域平衡密度聚类算法[J].计算机研究与发展,2010,47(6):1044-1052. 被引量：22
5潘玲玲,张育平,徐涛.核DBSCAN算法在民航客户细分中的应用[J].计算机工程,2012,38(10):70-73. 被引量：11
6REN Hong,ZHENG Yan,WU Ye-rong.Clustering analysis of telecommunication customers[J].The Journal of China Universities of Posts and Telecommunications,2009,16(2):114-116. 被引量：2
7HU Ruifei YIN Guofu TAN Ying CAI Peng.COOPERATIVE CLUSTERING BASED ON GRID AND DENSITY[J].Chinese Journal of Mechanical Engineering,2006,19(4):544-547. 被引量：4
8于亚飞,周爱武.一种改进的DBSCAN密度算法[J].计算机技术与发展,2011,21(2):30-33. 被引量：35
9周水庚,周傲英,曹晶.基于数据分区的DBSCAN算法[J].计算机研究与发展,2000,37(10):1153-1159. 被引量：98
10ESTER M, KRIEGEL H, SANDER J, et al. A Density-Based Algorithm for Discovering Cluster S in Large Spatial Databases with Noise [ C]//Proc of the 1996 2nd Int 1 Conf on Knowledge Discovery and Data Mining. Portland: AAAI Press, 1996: 226 -231.

二级参考文献87

1郑苗苗,吉根林.DK-Means——分布式聚类算法K-Dmeans的改进[J].计算机研究与发展,2007,44(z2):84-88. 被引量：9
2周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
3倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量：18
4王红,李晓晖.基于数据挖掘的航空公司客户信息分析[J].计算机工程,2005,31(B07):189-191. 被引量：4
5邹远强,李国徽,赵梓屹.基于遗传和蚁群算法融合的聚类新方法[J].科学技术与工程,2006,6(23):4700-4704. 被引量：9
6HU Ruifei YIN Guofu TAN Ying CAI Peng.COOPERATIVE CLUSTERING BASED ON GRID AND DENSITY[J].Chinese Journal of Mechanical Engineering,2006,19(4):544-547. 被引量：4
7任兴平,何忠龙,孟增辉.改进DBSCAN算法中参数Eps值的确定[J].现代电子技术,2007,30(11):120-121. 被引量：5
8CHEN M S, HAN J H, YU P S. Data mining: An overview from a database perspective [ J]. IEEE Transactions on Knowledge and Data Engineering, 1996, 8(6): 866 -883.
9KAUFAN L, RPUSSEEUW P J. Finding groups in data: An introduction to cluster analysis [ M]. New York: John Wiley & Sons, 1990.
10ESTER M, KRIEGEL H P, XU X W. Knowledge discovery in large SPATIAL database: Focusing techniques for efficient class identification [ C]//Proceedings of the 4th International Symposium on Advances in Spatial Databases, LNCS 951. London: Springer-Verlag, 1995:67-82.

共引文献312

1杨然,王虹,孙传波,余国才.基于因子图优化的DBSCAN聚类组合导航算法[J].微波学报,2023,39(S01):409-413.
2宗长富,文龙,何磊.基于欧几里得聚类算法的三维激光雷达障碍物检测技术[J].吉林大学学报（工学版）,2020,50(1):107-113. 被引量：24
3李玉鑑.自适应K-均值聚类算法[J].计算机研究与发展,2007,44(z2):100-104. 被引量：5
4张勇,倪巍伟,崇志宏,胡新平.基于邻域相关性的面向聚类数据扰动方法[J].计算机研究与发展,2011,48(S3):79-85. 被引量：1
5宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
6薛永生,翁伟,文娟,王劲波,张宇.LSNCCP——一种基于最大不相含核心点集的聚类算法[J].计算机研究与发展,2004,41(11):1930-1935. 被引量：2
7陈燕,耿国华,郑建国.一种改进的基于密度的聚类算法[J].微机发展,2005,15(3):17-19. 被引量：13
8栾丽华,吉根林.一种基于四叉树的快速聚类算法[J].计算机应用,2005,25(5):1001-1003. 被引量：6
9王恬宇.基于空间聚类的图像检索方法[J].情报杂志,2005,24(4):108-109.
10倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量：18

同被引文献30

1ZHONG DengHua,CUI Bo,LIU DongHai,TONG DaWei.Theoretical research on construction quality real-time monitoring and system integration of core rockfill dam[J].Science China(Technological Sciences),2009,52(11):3406-3412. 被引量：61
2许雪燕.模糊综合评价模型的研究及应用[D].成都:西南石油大学,2011.
3朱扬勇,熊赟.DNA序列数据挖掘技术[J].软件学报,2007,18(11):2766-2781. 被引量：37
4Ertoz L, Steinbach M, Kumar V. Fiding Clusters of Different Sizes, Shapes, and Densities in Noise, High Dimensional Data ER. Philadelphia: SIAM, 2003.
5Ester M, Kriegel H P, Sander J, et al. A Density-Based Algorithm for Discovering Cluster in Large Spatial Databases with Noise E C//Proeeeding the 2nd International Conference on Knowledge Discovery and Data Mining. Palo Alto, USA. AAAI, 1996. 226-231.
6Kisilevieh S, Mansmann F, Keim D. P-DBSCAN: A Density Based Clustering Algorithm for Exploration and Analysis of Attractive Areas Using Collections of Geo-Tagged Photos -C//Proeeedings of the 1st International Conference and Exhibition on Computing for Geospatial Research Application. New York: ACM, 2010 38.
7Kieu L M, Bhaskar A, Chung E. Transit Passenger Segmentation Using Travel Regularity Mined from Smart Card Transactions Data [C]//Transportation Research Board 93rd Annual Meeting. Brisbane: [s. n. ], 2014: 12-16.
8Verkasalo H, L6pez-Nicolfis C, Molina-Castillo F J, et al. Analysis of Users and Non-users of Smartphone Applications [J]. Telematies and Informatics, 2010, 27(3). 242-255.
9Hasan T, Hansen J H L. Acoustic Factor Analysis for Robust Speaker Verification I-J. IEEE Transactions on Audio, Speech, and Language Processing, 2013, 21(4). 842-853.
10Hall M, Frank E, Holmes G, et al. The WEKA Data Mining Software. An Update EJ3. ACM SIGKDD Explorations, 2009, 11(1): 10-18.

引证文献2

1姜建华,杨玉免,边海燕,康嘉容,王丽敏,刘颖.改进DBSCAN聚类算法在电子商务网站评价中的应用[J].吉林大学学报（理学版）,2016,54(2):329-336. 被引量：5
2刘东海,吴优.实时监控下堆石坝压实质量模糊综合评估[J].水力发电学报,2019,38(3):142-153. 被引量：10

二级引证文献15

1刘东海,李欣,刘强,孙龙飞.基于压实实时监测的高填方基础薄弱区快速识别研究[J].中国公路学报,2023,36(4):38-47. 被引量：1
2何行,刘旺根,何珊,赵振涵.支线航空网络节点的聚类与关键节点识别[J].舰船电子工程,2023,43(1):101-105. 被引量：1
3陈警钰,陈玉航.基于INNER-DBSCAN和功率曲线模型的风机异常状态检测[J].电力科学与工程,2017,33(8):27-34. 被引量：7
4刘东海,吴优.实时监控下堆石坝压实质量模糊综合评估[J].水力发电学报,2019,38(3):142-153. 被引量：10
5赵庆.MFO-Elman下的法律维权网站评价研究[J].现代科学仪器,2019,0(1):154-158.
6朱莉.基于DBSCAN的原子钟失步故障软件检测方法[J].指挥信息系统与技术,2020,11(2):94-98. 被引量：1
7冯永乾,江辉煌,吴龙梁,向卫国.填筑工程连续压实控制技术研究进展[J].铁道标准设计,2020,64(7):50-58. 被引量：20
8顾春荣,葛佩明,陈云,孔舒莹.水利移民工程总承包管理中的风险分析[J].水力发电,2020,46(7):81-84. 被引量：3
9刘东海,张翼飞,刘强.沥青混凝土心墙摊铺厚度及平整性实时控制研究[J].水力发电学报,2021,40(2):195-203. 被引量：8
10洪燕,田正宏,孙啸,屈嘉程.碾压混凝土薄弱区域压实质量精细评价方法[J].水电能源科学,2021,39(4):80-83. 被引量：1

1吴健.数据中心的发展趋势和面临问题[J].智能建筑与城市信息,2008(7):69-72.
2张欣.浅谈银行卡用户验收测试[J].中国交通信息化,2014(8):140-141.
3Hillstone发布高端新品着力数据中心安全[J].计算机安全,2012(4):96-97.
4赵飞军,贺兴时,王娟.一种改进的基于密度聚类的支持向量机[J].佳木斯大学学报（自然科学版）,2010,28(4):587-589. 被引量：1
5APC Efficient Enterprise^TM解决方案——让电力、制冷不再制约数据中心的预算[J].中国计算机用户,2009(15):50-50.
6华南数据中心用户有福了!dcd深圳数据中心会议隆重召开[J].计算机网络世界,2012(1):31-31.
7施耐德电气荣获“下一代数据中心优秀解决方案奖”[J].低压电器,2009(24):64-64.
8陈宇通.托管数据中心用户的策略和考虑[J].现代建筑电气,2012,3(9):9-12. 被引量：2
9杨雄.谈数据中心SDN和NFV技术关系[J].计算机与网络,2014,40(19):48-49. 被引量：1
10孙萌,姚建民,吕雅娟,姜文斌,刘群.基于最大熵短语重排序模型的特征抽取算法改进[J].中文信息学报,2011,25(2):78-82. 被引量：3

吉林大学学报（信息科学版）

2013年第5期

浏览历史

内容加载中请稍等...

DBSCAN算法在高性能计算中心用户分类的应用研究被引量：2

参考文献12

二级参考文献87

共引文献312

同被引文献30

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

DBSCAN算法在高性能计算中心用户分类的应用研究 被引量：2

参考文献12

二级参考文献87

共引文献312

同被引文献30

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

DBSCAN算法在高性能计算中心用户分类的应用研究被引量：2