大规模多视图聚类旨在解决传统多视图聚类算法中计算速度慢、空间复杂度高,以致无法扩展到大规模数据的问题.其中,基于锚点的多视图聚类方法通过使用整体数据集合的锚点集构建后者对于前者的重构矩阵,利用重构矩阵进行聚类,有效地降低...大规模多视图聚类旨在解决传统多视图聚类算法中计算速度慢、空间复杂度高,以致无法扩展到大规模数据的问题.其中,基于锚点的多视图聚类方法通过使用整体数据集合的锚点集构建后者对于前者的重构矩阵,利用重构矩阵进行聚类,有效地降低了算法的时间和空间复杂度.然而,现有的方法忽视了锚点之间的差异,均等地看待所有锚点,导致聚类结果受到低质量锚点的限制.为定位更具有判别性的锚点,加强高质量锚点对聚类的影响,提出一种基于加权锚点的大规模多视图聚类算法(Multi-view clustering with weighted anchors,MVC-WA).通过引入自适应锚点加权机制,所提方法在统一框架下确定锚点的权重,进行锚图的构建.同时,为增加锚点的多样性,根据锚点之间的相似度进一步调整锚点的权重.在9个基准数据集上与现有最先进的大规模多视图聚类算法的对比实验结果验证了所提方法的高效性与有效性.展开更多
多视图聚类已经被广泛研究,它能够采用可用的多源信息来实现更好的聚类性能.然而,大多数之前的工作仍存在两个不足:(1)它们通常关注多视图属性特征的场景,很少留意到多视图属性图数据;(2)它们主要尝试发现一致的结构或多个视图之间的关...多视图聚类已经被广泛研究,它能够采用可用的多源信息来实现更好的聚类性能.然而,大多数之前的工作仍存在两个不足:(1)它们通常关注多视图属性特征的场景,很少留意到多视图属性图数据;(2)它们主要尝试发现一致的结构或多个视图之间的关系,而忽略了多视图观测之间潜在的高阶相关性。为了解决这些问题,我们从广义角度出发,提出了一种新颖的方法,称为混合阶相似性的多视图聚类(Multiview Clustering by Hybridorder Affinity,MCHA).它将结构图和多视图属性特征巧妙融合,同时考虑了低秩概率相似性图和混合阶的相关性.具体而言,我们通过图过滤策略构建了一组保留几何结构的视图特定的平滑表示.同时,我们将从平滑表示中学习得到的多视图概率相似性图堆叠成一个张量,并对该张量给予低秩属性的约束.这可以很好地恢复视图间更高阶的相关性.在八个基准数据集上的实验表明,我们所提出的MCHA方法具有最先进的有效性.展开更多
随着数据来源方式的多样化发展,多视图聚类成为研究热点。大多数算法过于专注利用图结构寻求一致表示,却忽视了如何学习图结构本身;此外,一些方法通常基于固定视图进行算法优化。为了解决这些问题,提出了一种基于相似图投影学习的多视...随着数据来源方式的多样化发展,多视图聚类成为研究热点。大多数算法过于专注利用图结构寻求一致表示,却忽视了如何学习图结构本身;此外,一些方法通常基于固定视图进行算法优化。为了解决这些问题,提出了一种基于相似图投影学习的多视图聚类算法(multi-view clustering based on similarity graph projection learning, MCSGP),通过利用投影图有效地融合了全局结构信息和局部潜在信息到一个共识图中,而不仅是追求每个视图与共识图的一致性。通过在共识图矩阵的图拉普拉斯矩阵上施加秩约束,该算法能够自然地将数据点划分到所需数量的簇中。在两个人工数据集和七个真实数据集的实验中,MCSGP算法在人工数据集上的聚类效果表现出色,同时在涉及21个指标的真实数据集中,有17个指标达到了最优水平,从而充分证明了该算法的优越性能。展开更多
文摘大规模多视图聚类旨在解决传统多视图聚类算法中计算速度慢、空间复杂度高,以致无法扩展到大规模数据的问题.其中,基于锚点的多视图聚类方法通过使用整体数据集合的锚点集构建后者对于前者的重构矩阵,利用重构矩阵进行聚类,有效地降低了算法的时间和空间复杂度.然而,现有的方法忽视了锚点之间的差异,均等地看待所有锚点,导致聚类结果受到低质量锚点的限制.为定位更具有判别性的锚点,加强高质量锚点对聚类的影响,提出一种基于加权锚点的大规模多视图聚类算法(Multi-view clustering with weighted anchors,MVC-WA).通过引入自适应锚点加权机制,所提方法在统一框架下确定锚点的权重,进行锚图的构建.同时,为增加锚点的多样性,根据锚点之间的相似度进一步调整锚点的权重.在9个基准数据集上与现有最先进的大规模多视图聚类算法的对比实验结果验证了所提方法的高效性与有效性.
文摘多视图聚类已经被广泛研究,它能够采用可用的多源信息来实现更好的聚类性能.然而,大多数之前的工作仍存在两个不足:(1)它们通常关注多视图属性特征的场景,很少留意到多视图属性图数据;(2)它们主要尝试发现一致的结构或多个视图之间的关系,而忽略了多视图观测之间潜在的高阶相关性。为了解决这些问题,我们从广义角度出发,提出了一种新颖的方法,称为混合阶相似性的多视图聚类(Multiview Clustering by Hybridorder Affinity,MCHA).它将结构图和多视图属性特征巧妙融合,同时考虑了低秩概率相似性图和混合阶的相关性.具体而言,我们通过图过滤策略构建了一组保留几何结构的视图特定的平滑表示.同时,我们将从平滑表示中学习得到的多视图概率相似性图堆叠成一个张量,并对该张量给予低秩属性的约束.这可以很好地恢复视图间更高阶的相关性.在八个基准数据集上的实验表明,我们所提出的MCHA方法具有最先进的有效性.
文摘随着数据来源方式的多样化发展,多视图聚类成为研究热点。大多数算法过于专注利用图结构寻求一致表示,却忽视了如何学习图结构本身;此外,一些方法通常基于固定视图进行算法优化。为了解决这些问题,提出了一种基于相似图投影学习的多视图聚类算法(multi-view clustering based on similarity graph projection learning, MCSGP),通过利用投影图有效地融合了全局结构信息和局部潜在信息到一个共识图中,而不仅是追求每个视图与共识图的一致性。通过在共识图矩阵的图拉普拉斯矩阵上施加秩约束,该算法能够自然地将数据点划分到所需数量的簇中。在两个人工数据集和七个真实数据集的实验中,MCSGP算法在人工数据集上的聚类效果表现出色,同时在涉及21个指标的真实数据集中,有17个指标达到了最优水平,从而充分证明了该算法的优越性能。