大规模多视图聚类旨在解决传统多视图聚类算法中计算速度慢、空间复杂度高,以致无法扩展到大规模数据的问题.其中,基于锚点的多视图聚类方法通过使用整体数据集合的锚点集构建后者对于前者的重构矩阵,利用重构矩阵进行聚类,有效地降低...大规模多视图聚类旨在解决传统多视图聚类算法中计算速度慢、空间复杂度高,以致无法扩展到大规模数据的问题.其中,基于锚点的多视图聚类方法通过使用整体数据集合的锚点集构建后者对于前者的重构矩阵,利用重构矩阵进行聚类,有效地降低了算法的时间和空间复杂度.然而,现有的方法忽视了锚点之间的差异,均等地看待所有锚点,导致聚类结果受到低质量锚点的限制.为定位更具有判别性的锚点,加强高质量锚点对聚类的影响,提出一种基于加权锚点的大规模多视图聚类算法(Multi-view clustering with weighted anchors,MVC-WA).通过引入自适应锚点加权机制,所提方法在统一框架下确定锚点的权重,进行锚图的构建.同时,为增加锚点的多样性,根据锚点之间的相似度进一步调整锚点的权重.在9个基准数据集上与现有最先进的大规模多视图聚类算法的对比实验结果验证了所提方法的高效性与有效性.展开更多
随着数据来源方式的多样化发展,多视图聚类成为研究热点。大多数算法过于专注利用图结构寻求一致表示,却忽视了如何学习图结构本身;此外,一些方法通常基于固定视图进行算法优化。为了解决这些问题,提出了一种基于相似图投影学习的多视...随着数据来源方式的多样化发展,多视图聚类成为研究热点。大多数算法过于专注利用图结构寻求一致表示,却忽视了如何学习图结构本身;此外,一些方法通常基于固定视图进行算法优化。为了解决这些问题,提出了一种基于相似图投影学习的多视图聚类算法(multi-view clustering based on similarity graph projection learning, MCSGP),通过利用投影图有效地融合了全局结构信息和局部潜在信息到一个共识图中,而不仅是追求每个视图与共识图的一致性。通过在共识图矩阵的图拉普拉斯矩阵上施加秩约束,该算法能够自然地将数据点划分到所需数量的簇中。在两个人工数据集和七个真实数据集的实验中,MCSGP算法在人工数据集上的聚类效果表现出色,同时在涉及21个指标的真实数据集中,有17个指标达到了最优水平,从而充分证明了该算法的优越性能。展开更多
多视图聚类(Multi-View Clustering,MVC)旨在利用不同视图间的一致性和互补性来高效处理多视图数据,是大数据分析中重要的研究方向之一.然而,现有方法无法有效学习到多视图信息间的潜在联系,且缺乏考虑视图重要性差异问题.针对上述这些...多视图聚类(Multi-View Clustering,MVC)旨在利用不同视图间的一致性和互补性来高效处理多视图数据,是大数据分析中重要的研究方向之一.然而,现有方法无法有效学习到多视图信息间的潜在联系,且缺乏考虑视图重要性差异问题.针对上述这些问题,本文提出了一种基于分布对齐变分自编码器的深度多视图聚类方法(Deep Multi-View Clustering based on Distribution Aligned Variational Autoencoder,DMVCDA).首先,针对特定视图我们利用多个变分自编码器从不同视图中提取潜在特征,并对特征的分布进行对齐,以挖掘包含基本信息的潜在特征;然后,引入视图权重参数,获取共享的潜在特征;最后,在潜在特征上建立面向聚类的损失目标,使得学习到的潜在特征更适合聚类任务,从而提高聚类精度.在五个公共多视图数据集上的实验结果表明,我们的模型在精确度(ACC)、标准互信息(NMI)和纯度(Purity)等多个聚类评价指标上均表现出优异的性能.展开更多
文摘大规模多视图聚类旨在解决传统多视图聚类算法中计算速度慢、空间复杂度高,以致无法扩展到大规模数据的问题.其中,基于锚点的多视图聚类方法通过使用整体数据集合的锚点集构建后者对于前者的重构矩阵,利用重构矩阵进行聚类,有效地降低了算法的时间和空间复杂度.然而,现有的方法忽视了锚点之间的差异,均等地看待所有锚点,导致聚类结果受到低质量锚点的限制.为定位更具有判别性的锚点,加强高质量锚点对聚类的影响,提出一种基于加权锚点的大规模多视图聚类算法(Multi-view clustering with weighted anchors,MVC-WA).通过引入自适应锚点加权机制,所提方法在统一框架下确定锚点的权重,进行锚图的构建.同时,为增加锚点的多样性,根据锚点之间的相似度进一步调整锚点的权重.在9个基准数据集上与现有最先进的大规模多视图聚类算法的对比实验结果验证了所提方法的高效性与有效性.
文摘随着数据来源方式的多样化发展,多视图聚类成为研究热点。大多数算法过于专注利用图结构寻求一致表示,却忽视了如何学习图结构本身;此外,一些方法通常基于固定视图进行算法优化。为了解决这些问题,提出了一种基于相似图投影学习的多视图聚类算法(multi-view clustering based on similarity graph projection learning, MCSGP),通过利用投影图有效地融合了全局结构信息和局部潜在信息到一个共识图中,而不仅是追求每个视图与共识图的一致性。通过在共识图矩阵的图拉普拉斯矩阵上施加秩约束,该算法能够自然地将数据点划分到所需数量的簇中。在两个人工数据集和七个真实数据集的实验中,MCSGP算法在人工数据集上的聚类效果表现出色,同时在涉及21个指标的真实数据集中,有17个指标达到了最优水平,从而充分证明了该算法的优越性能。
文摘多视图聚类(Multi-View Clustering,MVC)旨在利用不同视图间的一致性和互补性来高效处理多视图数据,是大数据分析中重要的研究方向之一.然而,现有方法无法有效学习到多视图信息间的潜在联系,且缺乏考虑视图重要性差异问题.针对上述这些问题,本文提出了一种基于分布对齐变分自编码器的深度多视图聚类方法(Deep Multi-View Clustering based on Distribution Aligned Variational Autoencoder,DMVCDA).首先,针对特定视图我们利用多个变分自编码器从不同视图中提取潜在特征,并对特征的分布进行对齐,以挖掘包含基本信息的潜在特征;然后,引入视图权重参数,获取共享的潜在特征;最后,在潜在特征上建立面向聚类的损失目标,使得学习到的潜在特征更适合聚类任务,从而提高聚类精度.在五个公共多视图数据集上的实验结果表明,我们的模型在精确度(ACC)、标准互信息(NMI)和纯度(Purity)等多个聚类评价指标上均表现出优异的性能.