一种基于相对密度和决策图的聚类算法被引量：8

A novel clustering algorithm based on relative density and decision graph

导出

摘要聚类是数据挖掘领域的一个重要研究方向,针对复杂数据集中存在的簇间密度不均匀、聚类形态多样、聚类中心的识别等问题,引入样本点k近邻信息计算样本点的相对密度,借鉴快速搜索和发现密度峰值聚类(CFSFDP)算法的簇中心点识别方法,提出一种基于相对密度和决策图的聚类算法,实现对任意分布形态数据集聚类中心快速、准确地识别和有效聚类.在7类典型测试数据集上的实验结果表明,所提出的聚类算法具有较好的适用性,与经典的DBSCAN算法和CFSFDP等算法相比,在没有显著提高时间复杂度的基础上,聚类效果更好,对不同类型数据集的适应性也更广. Clustering is an important research domain in data mining. For some knotty problems in clustering complex datasets, such as uneven densities among clusters, miscellaneous patterns of clusters and the identification of the centers,a clustering method is proposed based on relative density and decision graph, which introduces the idea of k-nearest neighbors to compute the relative densities of data points, and uses the clustering by fast search and find of density peaks（CFSFDP） algorithm for identifying central points, which can identify central points quickly and accurately and cluster datasets of arbitrary distribution effectively. The experimental results on seven typical test datasets show that the proposed clustering algorithm has good feasibility and performance. Compared with the classical density-based spatial clustering of application with noise（DBSCAN） algorithm and CFSFDP algorithm, the proposed algorithm has better clustering effect and accuracy, and has a wider range of adaptation.

作者周世波徐维祥 ZHOU Shi-bo;XU Wei-xiang(School of Traffic and Transportation,Beijing Jiaotong University,B eijing 100044,China;Navigation College,Jimei University,Xiamen 361021,China)

机构地区北京交通大学交通运输学院集美大学航海学院

出处《控制与决策》 EI CSCD 北大核心 2018年第11期1921-1930,共10页 Control and Decision

基金国家自然科学基金项目(61672002 61272029 41501490) 福建省自然科学基金项目(2016J01243)

关键词聚类相对密度决策图密度峰值 K-近邻数据挖掘 clustering relative density decision graph density peaks k-nearest neighbors data mining

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献7

1李晓瑜,俞丽颖,雷航,唐雪飞.一种K-means改进算法的并行化实现与应用[J].电子科技大学学报,2017,46(1):61-68. 被引量：49
2李武,赵娇燕,严太山.基于平均差异度优选初始聚类中心的改进K-均值聚类算法[J].控制与决策,2017,32(4):759-762. 被引量：30
3雷小锋,谢昆青,林帆,夏征义.一种基于K-Means局部最优性的高效聚类算法[J].软件学报,2008,19(7):1683-1692. 被引量：114
4范敏,李泽明,石欣.一种基于区域中心点的聚类算法[J].计算机工程与科学,2014,36(9):1817-1822. 被引量：5
5朱亮,李东波,何非,童一飞,袁延强.采用改进型DENCLUE和SVM的电子皮带秤故障诊断[J].哈尔滨工业大学学报,2015,47(7):122-128. 被引量：2
6贾培灵,樊建聪,彭延军.一种基于簇边界的密度峰值点快速搜索聚类算法[J].南京大学学报（自然科学版）,2017,53(2):368-377. 被引量：6
7谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104

二级参考文献83

1唐发明,王仲东,陈绵云.支持向量机多类分类算法研究[J].控制与决策,2005,20(7):746-749. 被引量：90
2高琰,谷士文,唐琎,蔡自兴.机器学习中谱聚类方法的研究[J].计算机科学,2007,34(2):201-203. 被引量：31
3Han JW, Kamber M. Data Mining: Concepts and Techniques. 2nd ed., San Francisco: Morgan Kaufmann Publishers, 2001. 223-250.
4Ester M, Kriegel HP, Sander J, Xu XW. A density-based algorithm for discovering clusters in large spatial database with noise. In: Simoudis E, Han J, Fayyad UM, eds. Proc. of the 2nd Int'l Conf. on Knowledge Discovery and Data Mining. Portland: AAAI Press, 1996. 226-231.
5Zhang T, Ramakrishnan R, Linvy M. BIRCH: An efficient data clustering method for very large databases. In: Jagadish HV, Mumick IS, eds. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. Montreal: ACM Press, 1996. 103-114.
6Guha S, RastogiR, Shim K. CURE: An efficient clustering algorithm for large databases. In: Haas LM, Tiwary A, eds. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. New York: ACM Press, 1998. 73-84.
7Ankerst M, Breuning M, Kriegel HP, Sander J. OPTICS: Ordering points to identify the clustering structure. In: Delis A, Faloutsos C, Ghandeharizadeh S, eds. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. Philadelphia: ACM Press, 1999. 49-60.
8Karypis G, Han EH, Kumar V. CHAMELEON: A hierarchical clustering algorithm using dynamic modeling. Computer, 1999,32(8): 68-75.
9Hand DJ, Vinciotti V. Choosing k for two-class nearest neighbour classifiers with unbalanced classes. Pattern Recognition Letters, 2003,24(9): 1555-1562.
10Stonebraker M, Frew J, Gardels K, Meredith J. The SEQUOIA 2000 storage benchmark. In: Buneman P, ed. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. Washington: ACM Press, 1993.2-11.

共引文献294

1吕政阳,邓涛,张丽艳.一种基于机器视觉的飞机钣金件跨粒度识别方法[J].仪器仪表学报,2020,41(2):195-204. 被引量：10
2张文杰,蒋烈辉.基于MapReduce并行化计算的大数据聚类算法[J].计算机应用研究,2020,37(1):53-56. 被引量：20
3夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：16
4骆梅柳.基于大数据的校园舆情热点话题跟踪研究[J].智能计算机与应用,2020(8):287-289. 被引量：1
5王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
6周慧芳.自适应的k-means聚类算法SA-K-means[J].科技创新导报,2009,6(34):4-5. 被引量：3
7罗晖霞,曲晓玲.基于网络舆情的K-Means算法的改进研究[J].电脑开发与应用,2010,23(8):4-6. 被引量：3
8彭柳青,张军英,许进.基于k-Means均匀效应的健壮聚类初始算法[J].华中科技大学学报（自然科学版）,2010,38(8):73-76. 被引量：2
9李东艳,李绍滋,柯逍.基于外部数据库的图像自动标注改善模型[J].计算机应用,2010,30(10):2610-2613. 被引量：1
10刘琳,于海斌.异构无线传感器网络中簇首的优化部署策略[J].通信学报,2010,31(10):229-237. 被引量：7

同被引文献73

1Bo HU,Yudun LI,Hejun YANG,He WANG.Wind speed model based on kernel density estimation and its application in reliability assessment of generating systems[J].Journal of Modern Power Systems and Clean Energy,2017,5(2):220-227. 被引量：13
2李存华,孙志挥,陈耿,胡云.核密度估计及其在聚类算法构造中的应用[J].计算机研究与发展,2004,41(10):1712-1719. 被引量：64
3向长波,刘太辉,宋建中.基本矩阵的鲁棒贪心估计算法[J].计算机辅助设计与图形学学报,2007,19(5):651-655. 被引量：11
4黄以君,刘伟军.基于LQS的基本矩阵计算方法[J].中国图象图形学报,2009,14(10):2069-2073. 被引量：4
5赵渊,张夏菲,周家启.电网可靠性评估的非参数多变量核密度估计负荷模型研究[J].中国电机工程学报,2009,29(31):27-33. 被引量：50
6张伯明,吴文传,郑太一,孙宏斌.消纳大规模风电的多时间尺度协调的有功调度系统设计[J].电力系统自动化,2011,35(1):1-6. 被引量：235
7鲁珊,雷英杰,孔韦韦,雷阳,郑寇全.基于模糊核聚类的鲁棒性基础矩阵估计算法[J].吉林大学学报（工学版）,2012,42(2):434-439. 被引量：9
8周林,平西建,徐森,张涛.基于谱聚类的聚类集成算法[J].自动化学报,2012,38(8):1335-1342. 被引量：62
9李静,杨宜民,张学习.一种改进的MLESAC基本矩阵估计算法[J].计算机工程,2012,38(19):214-217. 被引量：8
10林俐,谢永俊,朱晨宸,汪宁渤.基于优先顺序法的风电场限出力有功控制策略[J].电网技术,2013,37(4):960-966. 被引量：67

引证文献8

1王治和,黄梦莹,杜辉,秦红武.基于密度峰值与密度聚类的集成算法[J].计算机应用,2019,39(2):398-402. 被引量：5
2赵燕伟,朱芬,桂方志,任设东,谢智伟,徐晨.融合可拓关联函数的密度峰值聚类算法[J].小型微型计算机系统,2019,40(12):2512-2518. 被引量：8
3张健,卢恒,姚光,孙其振,王晓鹏,张文栋.基于多重知识推演的电力遥控防误自动闭锁方法研究[J].自动化与仪器仪表,2020,0(3):68-71.
4王剑峰,王宏伟,闫学勤.基于多核学习-密度峰值聚类的基础矩阵估计[J].激光与光电子学进展,2020,57(4):184-192. 被引量：2
5高挺挺,王晓艺.基于PDM框架的可移动农业机械化术语查询系统设计[J].自动化与仪器仪表,2020(8):76-79. 被引量：1
6张江民,石慧,董增寿.基于相对密度核估计的实时剩余寿命预测[J].振动与冲击,2022,41(22):308-318.
7汪勇,李巧娜,艾学轶.基于两阶段搜索的密度聚类算法[J].计算机工程与设计,2023,44(1):188-193. 被引量：1
8张志壮,高文华,石慧,董增寿.自适应截断距离与样本分配的密度峰值聚类算法[J].太原科技大学学报,2023,44(2):91-96.

二级引证文献17

1刘盛,吴辰,杨浩楠,段奥,呼延明,李国强.基于SLP方法和层次分析法的刀具车间布置优化[J].工业技术创新,2021,8(3):147-152. 被引量：1
2全球片式电容器面面观(之一)[J].世界产品与技术,2000(1):42-43. 被引量：2
3王巧玲,乔非,蒋友好.基于聚合距离参数的改进K-means算法[J].计算机应用,2019,39(9):2586-2590. 被引量：27
4郑国凯,黄彩娥.基于大数据的智能商务分析平台开发和设计[J].现代电子技术,2020,43(5):163-166. 被引量：7
5罗军锋,锁志海,郭倩.一种基于k近邻的密度峰值聚类算法[J].软件,2020,41(7):185-188. 被引量：1
6白仲航,王雯,张敏,裴卉宁.基于可拓学与因果链分析的产品创新设计研究[J].机械设计,2020,37(11):139-144. 被引量：9
7李敏,杨亚锋,雷宇,李丽红.基于可拓域变化代价最小的最优粒度选择[J].山东大学学报（理学版）,2021,56(2):17-27. 被引量：2
8张长勇,冯冰,陈治华.基于点云聚类的垛型角点检测方法[J].现代电子技术,2021,44(11):93-97.
9周捷,王萍,毛倩,王奥斯.基于极限学习机的乳房形态识别[J].西安工程大学学报,2022,36(1):17-24. 被引量：2
10范淼.应用灰色关联法分析农业机械动力变化研究[J].现代化农业,2022(4):90-91. 被引量：2

1刘如辉,黄炜平,王凯,刘创,梁军.半监督约束集成的快速密度峰值聚类算法[J].浙江大学学报（工学版）,2018,52(11):2191-2200. 被引量：23
2徐晓,丁世飞,孙统风,廖红梅.基于网格筛选的大规模密度峰值聚类算法[J].计算机研究与发展,2018,55(11):2419-2429. 被引量：24
3刘勇,何婧,姚绍文,向毅,张浩.基于重心点转移的St-DBSCAN改进算法[J].计算机技术与发展,2018,28(11):6-11. 被引量：1
4赵凯,徐友春,李永乐,王任栋.基于VG-DBSCAN算法的大场景散乱点云去噪[J].光学学报,2018,38(10):362-367. 被引量：33
5赵怀鑫,张英杰,邓然然,丁明航,孙朝云,李伟.基于快速峰值聚类的高速公路异常事件识别方法[J].长安大学学报（自然科学版）,2018,38(5):205-212. 被引量：2
6朱红,何瀚志,方谦昊,代岳.基于改进密度峰值聚类的医学图像分割[J].徐州医科大学学报,2018,38(10):652-658. 被引量：3
7王灿,台玉红.生产效率与转型升级——基于房地产业的分析[J].西部经济管理论坛,2018,29(6):64-72. 被引量：2
8管建,王亚娟,王立功.K近邻分类指导的区域迭代图割算法研究[J].计算机应用与软件,2018,35(11):237-244. 被引量：6
9苏国栋,徐世武,蔡碧丽.基于动态质心迭代与偏差修正的室内定位方法[J].计算机系统应用,2018,27(11):265-270.
10李智慧,陆建平,沈浮.基于磁共振T2WI高分辨率图像的影像组学模型对直肠良恶性病变的鉴别诊断价值[J].中国医学计算机成像杂志,2018,24(5):388-392. 被引量：13

控制与决策

2018年第11期

浏览历史

内容加载中请稍等...

一种基于相对密度和决策图的聚类算法被引量：8

参考文献7

二级参考文献83

共引文献294

同被引文献73

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

一种基于相对密度和决策图的聚类算法 被引量：8

参考文献7

二级参考文献83

共引文献294

同被引文献73

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

一种基于相对密度和决策图的聚类算法被引量：8