不确定数据信任密度峰值聚类算法被引量：1

Belief Density Peak Clustering Algorithm for Uncertain Data

导出

摘要密度峰值聚类算法具有简单高效、无需迭代计算和提前设定类簇数的优势,但是在划分非类中心样本时容易产生“多米诺骨牌”效应,并且不能准确划分重叠区域的样本和噪声。为了解决以上问题,提出了不确定数据信任密度峰值聚类算法。首先,该算法在密度峰值聚类算法获取类中心样本的基础上,利用非类中心样本的K近邻求出样本属于不同类的信任值,将样本划分到信任值最大的类别,得到基于K近邻的初步聚类结果。然后,计算关于密度的上分位数得到密度阈值,在证据推理框架下进行信任划分,将密度小于该阈值的孤立样本划分到噪声类;处于重叠部分的样本划分到相关单类组成的复合类;信任值强烈支持属于某个类别的样本划分到相应的单类。该算法通过引入复合类和噪声类能够更加准确地展现样本在现有属性信息下的不确定性。实验结果表明,该算法在人工数据集和UCI数据集上相比于其他对比算法,能够取得更好的聚类性能。 The density peak clustering algorithm is simple and efficient and does not require iterative calculations.It has the advantages of setting the number of clusters in advance,but it is easy to produce a“domino”effect when dividing non-centered samples.Moreover,it cannot accurately partition the samples and noise in the overlapping area.To solve the above problems,the belief density peak clustering algorithm for uncertain data is proposed.First,the algorithm uses the K-nearest neighbors of non-class center samples to determine the degree of belief of the samples belonging to different clusters based on the density peak clustering algorithm so as to obtain the cluster center samples and partition the samples into a meta-cluster with the largest degree of belief to obtain the preliminary clustering results of K-nearest neighbors.Then,the upper quantile of the density is calculated to obtain the density threshold and credal partition under the framework of evidence reasoning,and isolated samples whose density is less than the threshold are classified into the noise cluster.Afterward,the samples in the overlapping part are partitioned into the composite cluster composed of related single clusters.The degree of belief strongly supports the classification of samples belonging to a certain cluster into the corresponding single cluster.The algorithm introduces the composite cluster and noise cluster to accurately show the uncertainty of the sample under the existing attribute information.Experimental results show that this algorithm can achieve better clustering performance compared with other algorithms on artificial and UCI datasets.

作者汪康马宗方田鸿朋宋琳 WANG Kang;MA Zongfang;TIAN Hongpeng;SONG Lin(Xi'an University of Architecture and Technology,College of Information and Control Engineering,Xi'an 710055,China)

机构地区西安建筑科技大学信息与控制工程学院

出处《信息与控制》 CSCD 北大核心 2022年第3期349-360,共12页 Information and Control

基金国家重点研发计划(2019YFC1907105) 陕西省重点研发计划(2020GY-186,2020SF-367)。

关键词聚类密度峰值 K近邻证据推理信任划分 clustering density peak K-nearest neighbors(KNN) evidential reasoning credal partition

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献13

1陈叶旺,申莲莲,钟才明,王田,陈谊,杜吉祥.密度峰值聚类算法综述[J].计算机研究与发展,2020,57(2):378-394. 被引量：49
2丁伟,王宏伟,崔龙,田申,王森.基于聚类分析和运动描述语言的扑翼飞行机器人行为规划[J].信息与控制,2021,50(1):102-112. 被引量：3
3章永来,周耀鉴.聚类算法综述[J].计算机应用,2019,39(7):1869-1882. 被引量：204
4金辉,钱雪忠.自然最近邻优化的密度峰值聚类算法[J].计算机科学与探索,2019,13(4):711-720. 被引量：22
5丁志成,葛洪伟.优化分配策略的密度峰值聚类算法[J].计算机科学与探索,2020,14(5):792-802. 被引量：8
6贾露,张德生,吕端端.物理学优化的密度峰值聚类算法[J].计算机工程与应用,2020,56(13):47-53. 被引量：14
7刘如辉,黄炜平,王凯,刘创,梁军.半监督约束集成的快速密度峰值聚类算法[J].浙江大学学报（工学版）,2018,52(11):2191-2200. 被引量：23
8朱庆峰,葛洪伟.K近邻相似度优化的密度峰聚类[J].计算机工程与应用,2019,55(2):148-153. 被引量：8
9王鸿飞,刘海斌,邓鑫洋,蒋雯.基于幂均算子和证据理论的故障诊断方法[J].信息与控制,2019,48(5):567-572. 被引量：4
10曹可劲,赵宗贵,江汉.不确定性证据聚类问题讨论[J].信息与控制,2006,35(1):55-58. 被引量：3

二级参考文献73

1唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
2符冰,方宗德,侯宇.微型扑翼飞行器控制系统的研究现状[J].飞行力学,2005,23(2):15-18. 被引量：5
3尹慧琳,王磊.D-S证据推理改进方法综述[J].计算机工程与应用,2005,41(27):22-24. 被引量：26
4Shafer G.A Mathematical Theory of Evidence[M].Princeton:Princeton University,1976.
5Sidenbladh H,Svenson P,Schubert J.Comparing multi-target trackers on different force unit levels[A].Sisal Processing,Sensor Fusion,and Target Recognition XIII[C].Bellingham,USA:SPIE,2004.306 ～314.
6Bergsten U,Schubert J,Svensson P.Applying data mining and machine learning techniques to submarine intelligence analysis[A].Proceedings of the 3rd International Conference on Knowledge Discovery and Data Mining[C].Menlo Park,CA,USA:AAAI Press,1997.127 ～ 130.
7Schubert J.On nonspecific evidence[J].International Journal of Intelligent Systems,1993,8(6):711 ～725.
8Schubert J.Specifying nonspecific evidence[J].Internationalc Journal of Intelligent Systems,1996,11 (8):525 ～ 563.
9RossTJ 钱同惠沈其聪.模糊逻辑及其工程应用[M].北京:电子工业出版社,2001..
10杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117

共引文献340

1冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：11
2许文坚,高维新,程耀坤.基于钻石模型的广东省生猪产业竞争力评价分析[J].现代畜牧兽医,2022(12):56-62. 被引量：2
3刘振宇,丁宇祺.自然环境中被遮挡果实的识别方法研究[J].计算机应用研究,2020,37(S02):333-335. 被引量：6
4张仲宸,周浩,林波荣,李嘉麒,田昕,吴佳欣,陈帅元,黄莉.基于数据挖掘的办公建筑运行阶段碳排放分析[J].建筑节能,2020,48(11):1-6. 被引量：8
5薛丁文,李建中.基于KD树的k-means聚类算法优化[J].智能计算机与应用,2021,11(11):194-197. 被引量：6
6Ye Qing Wu Xiaoping Chen Zemao.AN APPROACH FOR EVIDENCE CLUSTERING USING GENERALIZED DISTANCE[J].Journal of Electronics(China),2009,26(1):18-23.
7周大伟,叶清.基于互冲突量和自冲突量分析的证据聚类方法[J].火力与指挥控制,2011,36(6):39-41. 被引量：1
8赵楠,高嵩,宋晓茹,马贝.基于主元证据理论在车辆识别中的应用[J].计算机测量与控制,2017,25(5):199-202. 被引量：1
9陆军.化学教学中引领学生模型认知的思考与探索[J].化学教学,2017,0(9):19-23. 被引量：78
10袁杰,王福利,王姝,赵露平.基于D-S融合的混合专家知识系统故障诊断方法[J].自动化学报,2017,43(9):1580-1587. 被引量：37

同被引文献3

1何云斌,董恒,万静,李松.基于密度峰值和近邻优化的聚类算法[J].计算机科学与探索,2020,14(4):554-565. 被引量：7
2罗浩,王彦捷,牛明航,邱存月,张利.动态区间的加权模糊聚类算法[J].计算机科学与探索,2020,14(7):1142-1153. 被引量：5
3钱晓东,罗彦福.基于互信息属性排序的不完整数据聚类算法[J].信息与控制,2019,48(1):80-87. 被引量：10

引证文献1

1张利,路颜萍,侯晴,张皓博.K近邻空间密度分布的模糊聚类算法[J].辽宁大学学报（自然科学版）,2023,50(4):289-301.

1杨兴俊,杨兴华.机器学习在医疗数据发展中的应用思考[J].应用数学进展,2022,11(6):3496-3501.
2耿昌福.中和反应论证考查的新动向[J].理科考试研究,2022,29(14):54-55.
3袁红军.图书馆数字信任框架及其建构机制[J].图书馆学研究,2022(3):69-74. 被引量：2
4裘英俊.初探相声广播可持续发展之路[J].新闻文化建设,2022(7):140-142.
5崔建双,尚天泽,杨帆,蔚婧文.基于多标签k近邻方法实现元启发式算法的排名推荐[J].控制与决策,2022,37(5):1289-1298.
6何川,侯进,李金彪.基于图神经网络的百万数据人脸聚类[J].微电子学与计算机,2022,39(7):24-35.
7张娜娜.高中化学“变化观念与平衡思想”素养下的教学策略研究[J].试题与研究,2022(18):39-40. 被引量：1
8王玲,邢东阳,曾仲献,李金燕.基于“证据推理”建构沉淀溶解平衡的深度认识路径--从2021年广东学业水平选择性考试(化学)17题说起[J].化学教与学,2022(7):73-76. 被引量：2
9张登云.探析初中化学实验教学中如何培养学生独立思考能力[J].今天,2020(1):185-186.
10裘英俊.广播相声节目中串联词的作用[J].卫星电视与宽带多媒体,2022(10):189-191.

信息与控制

2022年第3期

浏览历史

内容加载中请稍等...

不确定数据信任密度峰值聚类算法被引量：1

参考文献13

二级参考文献73

共引文献340

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

不确定数据信任密度峰值聚类算法 被引量：1

参考文献13

二级参考文献73

共引文献340

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

不确定数据信任密度峰值聚类算法被引量：1