多视图聚类(Multi-View Clustering,MVC)旨在利用不同视图间的一致性和互补性来高效处理多视图数据,是大数据分析中重要的研究方向之一.然而,现有方法无法有效学习到多视图信息间的潜在联系,且缺乏考虑视图重要性差异问题.针对上述这些...多视图聚类(Multi-View Clustering,MVC)旨在利用不同视图间的一致性和互补性来高效处理多视图数据,是大数据分析中重要的研究方向之一.然而,现有方法无法有效学习到多视图信息间的潜在联系,且缺乏考虑视图重要性差异问题.针对上述这些问题,本文提出了一种基于分布对齐变分自编码器的深度多视图聚类方法(Deep Multi-View Clustering based on Distribution Aligned Variational Autoencoder,DMVCDA).首先,针对特定视图我们利用多个变分自编码器从不同视图中提取潜在特征,并对特征的分布进行对齐,以挖掘包含基本信息的潜在特征;然后,引入视图权重参数,获取共享的潜在特征;最后,在潜在特征上建立面向聚类的损失目标,使得学习到的潜在特征更适合聚类任务,从而提高聚类精度.在五个公共多视图数据集上的实验结果表明,我们的模型在精确度(ACC)、标准互信息(NMI)和纯度(Purity)等多个聚类评价指标上均表现出优异的性能.展开更多
文摘多视图聚类(Multi-View Clustering,MVC)旨在利用不同视图间的一致性和互补性来高效处理多视图数据,是大数据分析中重要的研究方向之一.然而,现有方法无法有效学习到多视图信息间的潜在联系,且缺乏考虑视图重要性差异问题.针对上述这些问题,本文提出了一种基于分布对齐变分自编码器的深度多视图聚类方法(Deep Multi-View Clustering based on Distribution Aligned Variational Autoencoder,DMVCDA).首先,针对特定视图我们利用多个变分自编码器从不同视图中提取潜在特征,并对特征的分布进行对齐,以挖掘包含基本信息的潜在特征;然后,引入视图权重参数,获取共享的潜在特征;最后,在潜在特征上建立面向聚类的损失目标,使得学习到的潜在特征更适合聚类任务,从而提高聚类精度.在五个公共多视图数据集上的实验结果表明,我们的模型在精确度(ACC)、标准互信息(NMI)和纯度(Purity)等多个聚类评价指标上均表现出优异的性能.