一种深度自监督聚类集成算法被引量：6

A deep self-supervised clustering ensemble algorithm

下载PDF

导出

摘要针对聚类集成中一致性函数设计问题,本文提出一种深度自监督聚类集成算法。该算法首先根据基聚类划分结果采用加权连通三元组算法计算样本之间的相似度矩阵,基于相似度矩阵表达邻接关系,将基聚类由特征空间中的数据表示变换至图数据表示;在此基础上,基聚类的一致性集成问题被转化为对基聚类图数据表示的图聚类问题。为此,本文利用图神经网络构造自监督聚类集成模型,一方面采用图自动编码器学习图的低维嵌入,依据低维嵌入似然分布估计聚类集成的目标分布;另一方面利用聚类集成目标对低维嵌入过程进行指导,确保模型获得的图低维嵌入与聚类集成结果是一致最优的。在大量数据集上进行了仿真实验,结果表明本文算法相比HGPA、CSPA和MCLA等算法可以进一步提高聚类集成结果的准确性。 In this study,we propose a deep self-supervised clustering ensemble algorithm to obtain the design of a consensus function in a clustering ensemble.In this algorithm,a weighted connected-triple algorithm is applied to the cluster components for estimating the similarity matrix of the samples,based on which the adjacency relation can be determined.Thus,the cluster components can be transformed from data representation in the feature space to graph data representation.On this basis,the consistency integration problem of cluster components is transformed into a graph clustering problem for the graph data representation of cluster components.Further,a graph neural network is used to construct the self-supervised clustering ensemble model.This model uses a graph autoencoder to obtain the low-dimensional embedding of the graph,and the target distribution of the cluster ensemble can be estimated based on the likelihood distribution generated via low-dimensional embedding.The clustering ensemble guides the learning of low-dimensional embedding.The above methods ensure that the low-dimensional embedding and clustering ensemble results obtained by the model are consistent and optimal.Simulation experiments were conducted on a large number of data sets.Results show that the proposed algorithm improves the accuracy of the clustering ensemble result compared with the accuracies obtained using algorithms such as HGPA,CSPA,and MCLA.

作者杜航原张晶王文剑 DU Hangyuan;ZHANG Jing;WANG Wenjian(College of Computer and Information Technology,Shanxi University,Taiyuan 030006,China;Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,Shanxi University,Taiyuan 030006,China)

机构地区山西大学计算机与信息技术学院山西大学计算智能与中文信息处理教育部重点实验室

出处《智能系统学报》 CSCD 北大核心 2020年第6期1113-1120,共8页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(61902227,61673249,61773247,U1805263) 山西省国际合作重点研发计划项目(201903D421050) 山西省基础研究计划项目(201901D211192) 山西省应用基础研究计划项目(201701D121053) 山西省1331工程项目.

关键词特征空间聚类算法一致性函数图表示相似性度量自监督学习图数据神经网络模型 feature space clustering algorithm consistency function graph representation similarity measure self-supervised learning graphical data neural network model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072
2杨草原,刘大有,杨博,池淑珍,金弟.聚类集成方法研究[J].计算机科学,2011,38(2):166-170. 被引量：15

二级参考文献32

1唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
2阳琳贇,王文渊.聚类融合方法综述[J].计算机应用研究,2005,22(12):8-10. 被引量：28
3李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
4罗会兰,孔繁胜,李一啸.聚类集成中的差异性度量研究[J].计算机学报,2007,30(8):1315-1324. 被引量：36
5Judd D,Mckinley P,Jain A K.Large-scale parallel data clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(8):871-876.
6Bhatia S K,Deogun J S.Conceptual clustering information retrieval[J].IEEE Transactions on Systems,Man,and Cyberne-tics,1998,28(3):427-436.
7Frigui H,Krishnapuram R.A robust competitiveclustering algorithm with applications in computer vision[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1999,21(5):450-465.
8Jain A K,Murty M N,Flynn P J.Data clustering:A review[J].ACM Computing Surveys,1999,31(3):264 -323.
9Wang Xi,Yang Chunyu,Zhou Jie.Clustering aggregation by probability accumulation[J].Pattern Recognition,2009,42(5):668-675.
10Fraley C,Raftery A E.How many clusters?Which clustering method?Answers via model based cluster analysis[J].The Computer Journal,1998,41(8):578-588.

共引文献1082

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献37

1贾宗维,崔军.一种发现社团结构的快速凝聚聚类算法[J].湘潭大学自然科学学报,2012,34(4):103-107. 被引量：2
2王振飞,陈金磊,郑志蕴,刘冰.面向心血管疾病的自适应模块化神经网络预测模型[J].小型微型计算机系统,2019,40(1):232-235. 被引量：10
3李大娟,李楠,李琰延.基于MatPCA和PNN融合的笔迹鉴定方法[J].信息通信,2015,28(6):28-29. 被引量：1
4谢宜婷,王爱平,邹海.基于自顶向下分裂聚类的图像匹配算法研究[J].计算机应用研究,2017,34(5):1590-1593. 被引量：2
5朱杰,陈黎飞.核密度估计的聚类算法[J].模式识别与人工智能,2017,30(5):439-447. 被引量：14
6吴德超,刘晓红,曲志坚.基于Hadoop的分布式聚类算法研究[J].山东理工大学学报（自然科学版）,2018,32(4):25-29. 被引量：3
7陈健,周平.基于胶囊网络的汉字笔迹鉴定算法[J].包装学报,2018,10(5):51-56. 被引量：3
8寇大磊,权冀川,张仲伟.基于深度学习的目标检测框架进展研究[J].计算机工程与应用,2019,55(11):25-34. 被引量：68
9王娜,胡超芳.基于客观聚类的手写数字识别方法[J].复杂系统与复杂性科学,2019,16(2):77-84. 被引量：5
10郭春妮,高瑜翔,黄坤超.基于二维双向PCA的手写数字识别算法研究[J].无线电工程,2019,49(12):1099-1102. 被引量：3

引证文献6

1徐慧英,董仕豪,朱信忠,赵建民.基于自编码器的多模态深度嵌入式聚类[J].浙江师范大学学报（自然科学版）,2022,45(1):26-34. 被引量：2
2蔡鲲鹏.基于手写识别的K-means聚类分析[J].新疆师范大学学报（自然科学版）,2022,41(3):64-72. 被引量：1
3侯海薇,丁世飞,徐晓.基于无监督表征学习的深度聚类研究进展[J].模式识别与人工智能,2022,35(11):999-1014. 被引量：1
4盛振涛,陈雁翔,齐国君.面向多模态自监督特征融合的音视频对抗对比学习[J].中国图象图形学报,2023,28(1):317-332. 被引量：1
5刘嘉轩,胡非易,张辉,张金洲,李玲.上下文空间与实例信息的皮肤镜图像自监督分类[J].智能系统学报,2023,18(4):783-792.
6何一帆,何玉林,崔来中,黄哲学.基于子空间的I-nice聚类算法[J].计算机科学,2024,51(6):153-160.

二级引证文献5

1刘俊奇.联合编码属性图聚类算法研究[J].信息记录材料,2022,23(4):176-178.
2李小强.基于机器学习的零件加工在线监测研究[J].自动化与仪器仪表,2022(11):124-128. 被引量：3
3王顺杰,蔡国永,吕光瑞,唐炜博.方面级多模态协同注意图卷积情感分析模型[J].中国图象图形学报,2023,28(12):3838-3854. 被引量：1
4聂耀鑫,蒋东来,程国军.一种基于深度学习的自聚类算法[J].信息记录材料,2024,25(3):126-128.
5尹浩文,成秋明.基于机器学习的深海多金属结核成因分类[J].科学技术与工程,2024,24(25):10605-10619.

1王育辉,单志峰,张洋铭,李建涛,蔡忠义.基于FA-FAHP的军代表室工作质量评价方法[J].信息工程大学学报,2020,21(3):378-384.
2罗红星,李兴怀,张志俊.工程项目全过程跟踪审计的研究[J].四川建筑,2020,40(4):374-376. 被引量：1
3吴晓富,尹梓睿,宋越,张磊,谢奔,赵师亮,张索非.面向行人重识别分集特征挖掘的多分支深度神经网络构造进展[J].南京邮电大学学报（自然科学版）,2021,41(1):78-85. 被引量：7
4于祥.聚类集成中的外部有效性指标评估研究[J].盐城工学院学报（自然科学版）,2020,33(4):18-23.
5郑锐,刘振涛,李继华.基于DSM的系统集成项目任务流程优化方法[J].科技与创新,2021(5):63-65.
6曾宪华,陆宇喆,童世玥,徐黎明.结合马尔科夫场和格拉姆矩阵特征的写实类图像风格迁移[J].南京大学学报（自然科学版）,2021,57(1):1-9. 被引量：4
7张蕾,张绪平,张思维,庄全超.白藜芦醇对长期贮存锂离子电池电解液性能的影响[J].电化学,2021,27(1):83-91. 被引量：1
8符杨,刘欢欢,苏向敬,米阳,郑舒.基于线性化前推回代方程的不平衡配电网概率潮流计算[J].太阳能学报,2021,42(3):283-289.
9徐飞.突破新纪元——全新迈凯伦ARTURA[J].世界汽车,2021(3):12-19.
10许紫婷,陈铮,刘沈,王建.化学发光法检测光动力过程单态氧相对产率实验设计[J].实验技术与管理,2020,37(11):83-87.

智能系统学报

2020年第6期

浏览历史

内容加载中请稍等...

一种深度自监督聚类集成算法被引量：6

参考文献2

二级参考文献32

共引文献1082

同被引文献37

引证文献6

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种深度自监督聚类集成算法 被引量：6

参考文献2

二级参考文献32

共引文献1082

同被引文献37

引证文献6

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种深度自监督聚类集成算法被引量：6