基于核K-means的增量多视图聚类算法被引量：1

Incremental multi-view clustering algorithm based on kernel K-means

导出

摘要针对基于核的多视图聚类算法(kernel based multi-view clustering method,MVKKM)在处理大规模数据集时运行时间长的缺点,引入增量聚类模型的概念,将MVKKM算法与增量聚类模型相结合,提出基于核K-means的多视图增量聚类算法(incremental multi-view clustering algorithm based on kernel K-means,IMVCKM)。通过将数据集分块,在每个数据块中使用M VKKM算法聚类,并将每个数据块的聚类中心作为下个数据块的初始聚类中心。将所有块的聚类中心进行整合后再次进行多视图聚类,得到最终的聚类结果。试验结果表明,在3个大规模数据集上,IMVCKM算法相较于MVKKM算法在3个评价指标上具有更好的聚类结果,且运行时间更短。该算法在保证聚类性能的基础上大大降低算法的运行时间。 Because of the defect of long running time in the kernel based multi-view clustering algorithm（ MVKKM） when dealing with large-scale datasets,the concept of incremental clustering model was introduced. The incremental multi-view clustering algorithm based on kernel K-means（ IMVKKM） was proposed by combining MVKKM algorithm and incremental clustering framework.The dataset was divided into chunks and the MVKKM method was used in each data chunk to obtain a set of cluster centers,which was regarded as the initial cluster center of the next chunk. The cluster centers of all the chunks were combined and the final set of cluster result was identified by using MVKKM. The experimental results showed that IMVKKM algorithm had better clustering results and shorter running time than MVKKM algorithm on three large-scale datasets. The proposed approach could reduce the running time while keeping the clustering performance.

作者张佩瑞杨燕邢焕来喻琇瑛 ZHANG Peirui;YANG Yan;XING Huanlai;YU Xiuying(School of Information Science and Technology, Southwest Jiaotong University, Chengdu 611756, Sichuan, China)

机构地区西南交通大学信息科学与技术学院

出处《山东大学学报（工学版）》 CAS 北大核心 2018年第3期48-53,共6页 Journal of Shandong University（Engineering Science）

基金国家自然科学基金资助项目(61572407) 国家科技支撑计划课题资助项目(2015BAH19F02)

关键词多视图聚类核函数多视图核K-means 增量聚类数据块聚类中心 multi-view clusterting kernel function multi-view kernel K-means incremental clustering dataset chunk cluster center

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1邓强,杨燕,王浩.一种改进的多视图聚类集成算法[J].计算机科学,2017,44(1):65-70. 被引量：8
2李滔,王士同.适合大规模数据集的增量式模糊聚类算法[J].智能系统学报,2016,11(2):188-199. 被引量：17
3杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
4刘晓勇.一种基于树核函数的半监督关系抽取方法研究[J].山东大学学报（工学版）,2015,45(2):22-26. 被引量：2

二级参考文献64

1李洁,高新波,焦李成.一种基于修正划分模糊度的聚类有效性函数[J].系统工程与电子技术,2005,27(4):723-726. 被引量：8
2张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
3何婷婷,徐超,李晶,赵君喆.基于种子自扩展的命名实体关系抽取方法[J].计算机工程,2006,32(21):183-184. 被引量：25
4普运伟,金炜东,朱明,胡来招.核模糊C均值算法的聚类有效性研究[J].计算机科学,2007,34(2):207-210. 被引量：28
5HALKIDI M, VAZIRGIANNIS M, BATISTAKIS Y. Quality scheme assessment in the clustering process [ C ]//Proc of the 4th Eur Conf Principles and Practice of Knowledge Discovery in Databases. 2000: 165-276.
6THEODORIDIS S, KOUTROUBAS K. Pattern recognition[ M]. [S.l. ] :Academic Press, 1999.
7HALKIDI M, BATISTAKIS Y, VAZIRGIANNIS M. On clustering validation techniques [ J ]. Intelligent Information Systems, 2001, 17 (2-3) :107-145.
8HALKIDI M, VAZIRGIANNIS M. Clustering validity assessment using multi representatives[ C]//Proc of SETN Conference. 2002.
9YANG Yan, KAMEL M, JIN Fan. A model of document clustering using ant colony algorithm and validity index [ C ]//Proc of IEEE International Joint Conference on Neural Networks. Montreal: [ s. n. ], 2005 : 2730- 2735.
10RESSOM H, WANG D, NATARAJAN P. Adaptive double self-organizing maps for clustering gene expression profiles [ J ]. Neural Networks ,2003,16(5-6) :633-640.

共引文献140

1何灵敏,潘益民.一种基于GA的聚类集成算法[J].中国计量学院学报,2011,22(3):282-285. 被引量：2
2谢凤英,秦世引,姜志国,孟如松.皮肤镜黑素细胞瘤图像自适应聚类的进化寻优[J].计算机辅助设计与图形学学报,2009,21(12):1745-1752. 被引量：2
3王超,刘涛,杜利平,杨桢,班晓娟,周贤伟.一种新的认知无线电主用户信号识别方法[J].电波科学学报,2009,24(6):1119-1123. 被引量：12
4刘春晓,张翠芳.基于SOM和PSO的聚类组合算法[J].通信技术,2010,43(1):208-209. 被引量：7
5刘志勇,邓贵仕.一种基于矩阵变换的层次聚类算法[J].郑州大学学报（理学版）,2010,42(2):39-42. 被引量：6
6廉琪,苏屹.基于SOM和PSO聚类组合算法的客户细分研究[J].华东经济管理,2011,25(1):118-121. 被引量：2
7谭维,杨燕.基于自组织特征映射的聚类集成算法[J].计算机工程与设计,2010,31(22):4885-4888. 被引量：4
8施蓓琦,刘春,陈能,林文鹏.典型地物实测光谱的相似性测度与实验分析[J].同济大学学报（自然科学版）,2011,39(2):292-298. 被引量：6
9刘燕驰.基于密度的最佳聚类数确定方法[J].中国管理信息化,2011,14(9):30-33. 被引量：4
10叶青,唐鹏举.一种改进的基于MST的聚类算法[J].计算机与现代化,2011(8):17-19. 被引量：2

同被引文献5

1刘婕,马帅.结构图正则低秩子空间聚类[J].计算机工程与应用,2018,54(18):1-7. 被引量：5
2刘玉馨,何光辉.k近邻约束的稀疏子空间聚类[J].计算机工程与应用,2019,55(3):39-45. 被引量：11
3邢毓华,李明星.基于投影的鲁棒低秩子空间聚类算法[J].计算机科学,2020,47(6):92-97. 被引量：1
4王中元,刘惊雷.基于二阶近邻的核子空间聚类[J].计算机科学,2021,48(6):86-95. 被引量：2
5马凯,王伟文,由从哲(指导).基于核的低秩子空间聚类算法[J].江苏理工学院学报,2021,27(4):32-37. 被引量：1

引证文献1

1李理,李敬豪,张小乾.基于张量学习的潜在多视图子空间聚类[J].西南科技大学学报,2022,37(3):52-59.

1匡秋明,杨雪冰,张文生,何险峰,惠建忠.多源数据融合高时空分辨率晴雨分类[J].软件学报,2017,28(11):2925-2939. 被引量：3
2郑文萍,李晋玉,王杰.基于遗传算法的蛋白质复合物识别算法[J].计算机科学与探索,2018,12(5):794-803. 被引量：8
3Chunmao Jiang,Yibing Li,Zhicong Li.Energy Optimization Oriented Three-Way Clustering Algorithm for Cloud Tasks[J].Journal of Beijing Institute of Technology,2018,27(2):189-197. 被引量：1
4Jin Dai,Yi Yan,Yuhong He.Grey incidence clustering method based on multidimensional dynamic time warping distance[J].Journal of Systems Engineering and Electronics,2017,28(5):946-954. 被引量：1
5Yugai JIA,Xijin TANG.Generating Storyline with Societal Risk from Tianya Club[J].Journal of Systems Science and Information,2017,8(6):524-536. 被引量：1
6张雪松,贾彩燕.一种基于频繁词集表示的新文本聚类方法[J].计算机研究与发展,2018,55(1):102-112. 被引量：14
7文传军,詹永照.粒子群高斯诱导核模糊C均值聚类算法[J].科学技术与工程,2018,18(8):78-84. 被引量：4
8Xue Li,Hongfu Liu.Greedy Optimization for K-Means-Based Consensus Clustering[J].Tsinghua Science and Technology,2018,23(2):184-194. 被引量：4
9Chunkai Zhang,Haodong Liu,Ao Yin.Research of Detection Algorithm for Time Series Abnormal Subsequence[J].国际计算机前沿大会会议论文集,2017(1):4-6.

山东大学学报（工学版）

2018年第3期

浏览历史

内容加载中请稍等...

基于核K-means的增量多视图聚类算法被引量：1

参考文献4

二级参考文献64

共引文献140

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于核K-means的增量多视图聚类算法 被引量：1

参考文献4

二级参考文献64

共引文献140

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于核K-means的增量多视图聚类算法被引量：1