一种改进的自适应快速AF-DBSCAN聚类算法被引量：30

An improved adaptive and fast AF-DBSCAN clustering algorithm

下载PDF

导出

摘要基于密度的DBSCAN聚类算法可以识别任意形状簇,但存在全局参数Eps与Min Pts的选择需人工干预,采用的区域查询方式过程复杂且易丢失对象等问题,提出了一种改进的参数自适应以及区域快速查询的密度聚类算法。根据KNN分布与数学统计分析自适应计算出最优全局参数Eps与Min Pts,避免聚类过程中的人工干预,实现了聚类过程的全自动化。通过改进种子代表对象选取方式进行区域查询,无需漏检操作,有效提高了聚类的效率。对4种典型数据集的密度聚类实验结果表明,本文算法使得聚类精度提高了8.825%,聚类的平均时间减少了0.92 s。 The density-based DBSCAN clustering algorithm can identify clusters with arbitrary shape,however,the choice of the global parameters Eps and Min Pts requires manual intervention,the process of regional query is complex and loses objects easily. Therefore,an improved density clustering algorithm with adaptive parameter for fast regional queries is proposed. Using KNN distribution and mathematical statistical analysis,the optimal global parameters Eps and Min Pts are adaptively calculated,so as to avoid manual intervention and enable full automation of the clustering process. The regional query is conducted by improving the selection manner of the object,which is represented by a seed and thus avoiding manual intervention,and so the clustering efficiency is effectively increased. The experiment results looking at density clustering of four typical data sets show that the proposed method effectively improves clustering accuracy by 8.825% and reduces the average time of clustering by 0.92 s.

作者周治平王杰锋朱书伟孙子文

机构地区江南大学物联网工程学院

出处《智能系统学报》 CSCD 北大核心 2016年第1期93-98,共6页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金资助项目(61373126) 江苏省产学研联合创新资金-前瞻性联合研究基金资助项目(BY2013015-33)

关键词密度聚类 DBSCAN 区域查询全局参数 KNN分布数学统计分析 density clustering DBSCAN region query global parameters KNN distribution mathematical statis tics and analysis

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1吉根林,姚瑶.一种分布式隐私保护的密度聚类算法[J].智能系统学报,2009,4(2):137-141. 被引量：2
2岳士弘,李平,郭继东,周水庚.A statistical information-based clustering approach in distance space[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2005,6(1):71-78. 被引量：8
3夏鲁宁,荆继武.SA-DBSCAN:一种自适应基于密度聚类算法[J].中国科学院研究生院学报,2009,26(4):530-538. 被引量：80
4周水庚,周傲英,曹晶,胡运发.一种基于密度的快速聚类算法[J].计算机研究与发展,2000,37(11):1287-1292. 被引量：88

二级参考文献22

1岳士弘,李平,郭继东,周水庚.Using Greedy algorithm： DBSCAN revisited Ⅱ[J].Journal of Zhejiang University Science,2004,5(11):1405-1412. 被引量：2
2李锁花,孙志挥,周晓云.基于特征向量的分布式聚类算法[J].计算机应用,2006,26(2):379-382. 被引量：6
3..http://www.ics.uci.edu/mleam/MLSununary.html,.
4MacQueen J.Some methods for classification and analysis of multivariate observations[C]//LeCam L,Neyman J,eds.Proceedings of the Fifth Berkeley Symposium on Mathematics,Statistics and Probability.Berkeley:University of California Press,1967:281-297.
5Leonard Kaufman,Peter J Rousseenw.Finding groups in data:An introduction to cluster analysis[M].New York:Wiley Press,2005.
6Tan P N,Steinbach M,Kumar V 著,范明,范宏建,等译,数据挖掘导论(Introduction to DataMining).北京:人民邮电出版社,2006.
7Ester M,Kriegel H P,Sander J.A density-based algorithm for discovering clusters in large spatial databases with noise[C]//Simoudis E,Hart JW,Fayyad UM,eds.Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining.Portland:AAAI Press,1996:226-231.
8Ankerst M,Breunig M M,Kriegcl H P.OPTICS:ordering points to identify the clustering structure[C]//Alex Dells,Christns Faloutscs,Shahram Ghandeharizadeh eds.Proceedings of the ACM SIGMOD'99 lnt Conf on Management of Data.Philadelphia Pennsylvania:ACM Press,1999:49-60.
9Hinneburg A,Keim D A.An efficient approach to clustering in large multimedia databases with noise[C]//Rakesh Agrawal,Paul Stolorz,eds.Proceedings of the 4th lnt Conf on Knowledge Discovery and Data Mining.New York:AAAI Press,1998:58-65.
10Feng P J,C,e L D.Adaptive DBSCAN-bused algorithm for constellation reconstruction and modulation identification[C]//Keyun Tang,Dayong Lio,eds.Proceedings of Radio Science Conference 2004.Beijing:Pub House of Electronics Industry,2004:177-180.

共引文献170

1梁敏君,倪志伟,倪丽萍,杨葛钟啸.基于网格与分形维数的聚类算法[J].计算机应用,2009,29(3):830-832. 被引量：4
2周文勇.改进的K-均值聚类算法[J].光盘技术,2007(2):54-56. 被引量：6
3王海,王忠民.一种基于密度和网格的聚类算法在KDD中的应用[J].计算机工程与应用,2004,40(24):180-182. 被引量：3
4周永权,焦李成.高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J].电子学报,2004,32(8):1342-1345. 被引量：3
5林小红,蒋伟进.基于RS近似算法的医疗诊断知识挖掘[J].海军工程大学学报,2004,16(5):48-51.
6薛永生,翁伟,文娟,王劲波,张宇.LSNCCP——一种基于最大不相含核心点集的聚类算法[J].计算机研究与发展,2004,41(11):1930-1935. 被引量：2
7郭伟,唐晓君,刘万军.一种基于划分的聚类算法分析与改进[J].辽宁工程技术大学学报（自然科学版）,2004,23(6):826-828. 被引量：4
8万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16
9郭俊,樊彦国.一种改进的CURE聚类算法[J].内蒙古石油化工,2005,31(4):14-17.
10石陆魁,何丕廉.一种基于密度的高效聚类算法[J].计算机应用,2005,25(8):1824-1826. 被引量：21

同被引文献289

1陶建科,刘遂庆.建立给水管网微观动态水力模型标准方法研究[J].给水排水,2000,26(5):4-8. 被引量：18
2陈志军,吴超仲,吕能超,马杰.基于改进三次Hermite插值的车辆时空轨迹重构研究[J].交通信息与安全,2013,31(6):43-46. 被引量：10
3周国亮,宋亚奇,王桂兰,朱永利.状态监测大数据存储及聚类划分研究[J].电工技术学报,2013,28(S2):337-344. 被引量：41
4岳士弘,李平,郭继东,周水庚.A statistical information-based clustering approach in distance space[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2005,6(1):71-78. 被引量：8
5李新延,李德仁.DBSCAN空间聚类算法及其在城市规划中的应用[J].测绘科学,2005,30(3):51-53. 被引量：34
6倪世宏 ,史忠科 ,谢川 ,王彦鸿 .军用战机机动飞行动作识别知识库的建立[J].计算机仿真,2005,22(4):23-26. 被引量：36
7王训俭,王增义.论给水管网压力监测点的选择[J].中国给水排水,1989,5(3):9-12. 被引量：29
8黄劲松,刘峻宁,刘成宝,田辉.GPS信号载噪比研究[J].武汉大学学报（信息科学版）,2007,32(5):427-430. 被引量：15
9文畅平.埃尔米特插值函数在公路平面线形设计中的应用[J].测绘科学,2007,32(3):149-150. 被引量：2
10许刚,张土乔,吕谋.基于灵敏度分析和蚁群算法的管网监测点优化选择[J].中国给水排水,2007,23(11):94-96. 被引量：10

引证文献30

1伏家云,靖常峰,杜明义.空间密度聚类模式挖掘方法DBSCAN研究回顾与进展[J].测绘科学,2018,43(12):50-57. 被引量：6
2殷文辉.基于动态演化聚类算法的E-Learning培训搜索研究[J].电子设计工程,2016,24(22):90-93. 被引量：1
3方潜生,张兆祥,谢陈磊,张猛,张振亚.基于特征聚类的给水管网压力监测点优化布置[J].安徽大学学报（自然科学版）,2017,41(4):55-62. 被引量：3
4邵东恒,杨文元,赵红.应用k-means算法实现标记分布学习[J].智能系统学报,2017,12(3):325-332. 被引量：8
5王平,于祥春.基于密度聚类的能耗数据采集网关设计[J].电子技术应用,2018,44(6):35-38. 被引量：2
6林涛,马同宽,秦冬阳,董栅.基于改进DBSCAN算法的风机故障诊断研究[J].现代电子技术,2018,41(21):146-149. 被引量：4
7李文杰,闫世强,蒋莹,张松芝,王成良.自适应确定DBSCAN算法参数的算法研究[J].计算机工程与应用,2019,55(5):1-7. 被引量：92
8王星捷,卫守林.基于角度的全局搜索聚类算法的研究[J].计算机应用与软件,2019,36(3):249-254. 被引量：1
9田继伟,王劲松,石凯,薛玉岱,岳欣.基于聚类和时间权重的协同过滤位置预测算法[J].天津理工大学学报,2019,35(3):48-52. 被引量：1
10犹峰,王渊.优化GSA算法在电力调度系统不良数据检测中的应用[J].自动化技术与应用,2019,38(7):33-36. 被引量：5

二级引证文献222

1王晶,李炜,洪心睿,吴宸之.基于改进密度聚类算法的语音信号欠定盲分离[J].信息与控制,2023,52(6):784-796.
2张峰,陈兵,赵怿平,张南,李岳.基于层次聚类法的航空维修方案分析[J].飞机设计,2019,0(5):35-38.
3周润,滕奇志.基于改进DBSCAN算法的金相图像晶粒聚集检测方法[J].智能计算机与应用,2021,11(4):44-48. 被引量：1
4魏巍巍.空间数据挖掘的方法进展及其问题探究[J].产业与科技论坛,2020(8):35-36.
5Qi Zhang,Jianshe Cao,Yanfeng Sui.Development of a research platform for BEPCⅡ accelerator fault diagnosis[J].Radiation Detection Technology and Methods,2020,4(3):269-276.
6庞军,贾钰铭,陈燕,罗华,殷圣琼.98例肺癌骨转移临床分析[J].泸州医学院学报,2000,23(1):72-73. 被引量：2
7李海玲.大规模并行网络动态演化特征挖掘技术[J].科学技术与工程,2018,18(27):59-64.
8邹臣嵩,段桂芹.基于改进K-medoids的聚类质量评价指标研究[J].计算机系统应用,2019,28(6):235-242. 被引量：8
9胡佳辉,陈心灵,朱杰华,赵增旭.基于嵌入式平台和子地图局部关联算法的AGV设计[J].电子测量技术,2019,42(11):51-55.
10应毅,黄慧,刘定一.基于PageRank的热点发现混合算法研究[J].计算机技术与发展,2019,29(9):81-85. 被引量：3

1南欢.Pro/E中的对象选取技术浅析[J].机械研究与应用,2006,19(4):114-115.
2周黄斌,周永华,朱丽娟.基于MATLAB的改进BP神经网络的实现与比较[J].计算技术与自动化,2008,27(1):28-31. 被引量：36
3陈亚丽,张龙波,张树森.数据密集型计算环境下的离群点挖掘算法[J].计算技术与自动化,2015,34(2):74-77. 被引量：2
4杜雪琴.财会电算化对会计理论与会计实务影响探讨[J].经济视野,2013(22). 被引量：1
5余主正,杨马英.基于网络时滞补偿的模型预测控制[J].控制工程,2010,17(S1):18-21. 被引量：2
6任午令,何志均.基于遗传算法的决策对象选取模型研究[J].计算机工程,1998,24(12):25-30.
7王伟,曾国荪,刘涛.基于信任机制的协作系统形成与演化机制[J].通信学报,2006,27(11):31-35. 被引量：4
8程建强,段世轻,赵有福.MAPGIS环境中的自动矢量化及图边修饰问题[J].西部探矿工程,2007,19(6):112-113.
9吴杰长,陈国钧.未知非线性系统的神经网络建模与控制仿真研究[J].海军工程大学学报,2004,16(4):53-56. 被引量：1
10董辉,李林鑫.水平多关节机械手运动学分析与仿真[J].浙江工业大学学报,2013,41(5):562-566. 被引量：11

智能系统学报

2016年第1期

浏览历史

内容加载中请稍等...

一种改进的自适应快速AF-DBSCAN聚类算法被引量：30

参考文献4

二级参考文献22

共引文献170

同被引文献289

引证文献30

二级引证文献222

相关作者

相关机构

相关主题

浏览历史

一种改进的自适应快速AF-DBSCAN聚类算法 被引量：30

参考文献4

二级参考文献22

共引文献170

同被引文献289

引证文献30

二级引证文献222

相关作者

相关机构

相关主题

浏览历史

一种改进的自适应快速AF-DBSCAN聚类算法被引量：30