在聚类过程中,多视角数据的高维性和稀疏性使视角内描述样本的不同特征对聚类结果的影响不同,同一样本在不同的视角中对聚类的贡献也不同.层次化区分视角内不同特征的权重和相同样本在不同视角内的权重是提高多视角聚类性能的重要因素....在聚类过程中,多视角数据的高维性和稀疏性使视角内描述样本的不同特征对聚类结果的影响不同,同一样本在不同的视角中对聚类的贡献也不同.层次化区分视角内不同特征的权重和相同样本在不同视角内的权重是提高多视角聚类性能的重要因素.提出了具有特征级和样本级两级权重的多视角聚类(multi-view clustering based on two-level weights,MVC2W)算法.该算法引入了特征级和样本级注意力机制学习每个视角内不同特征的权重和每个样本在不同视角内的权重.两级注意力机制使算法在训练过程中能够更加关注重要的特征和重要的样本,更加合理地融合不同视角的信息,从而有效克服数据高维性和稀疏性对聚类结果的影响.此外,MVC2W将表征学习和聚类过程融为一体,协同训练、相互促进,进一步提升聚类性能.在5个稀疏程度不同的数据集上的实验结果表明:MVC2W算法的聚类性能比11个基线算法均有提升,尤其是在稀疏程度高的数据集上,MVC2W的提升更加显著.展开更多
针对当前大部分影响力最大化算法忽略了异质信息网络包含多种节点类型和多种关系类型,且不同类型节点在原始空间无法直接度量的问题,提出了一种异质信息网络中基于网络嵌入的影响力最大化模型(influence maximization based on network ...针对当前大部分影响力最大化算法忽略了异质信息网络包含多种节点类型和多种关系类型,且不同类型节点在原始空间无法直接度量的问题,提出了一种异质信息网络中基于网络嵌入的影响力最大化模型(influence maximization based on network embedding,IMNE),用于选择初始扩散节点实现影响力最大化。该模型不仅可以在对异质信息网络进行编码的同时表征异质信息网络中潜在的信息,还可以捕获不同类型节点间影响力的不确定和复杂性。在3个真实数据集上的实验验证了IMNE算法的有效性。展开更多
属性网络嵌入旨在映射网络中的节点和链接关系到低维空间,同时保留其固有的结构和属性特征.异质属性网络中多种类型的节点和链接关系给网络嵌入学习提供了丰富的辅助信息,同时也带来了新的挑战.提出异质属性网络嵌入模型(heterogeneous ...属性网络嵌入旨在映射网络中的节点和链接关系到低维空间,同时保留其固有的结构和属性特征.异质属性网络中多种类型的节点和链接关系给网络嵌入学习提供了丰富的辅助信息,同时也带来了新的挑战.提出异质属性网络嵌入模型(heterogeneous attribute network embedding based on the PPMI,HANEP),旨在将网络中多种类型的节点和(或)多种类型的链接关系映射到低维、紧凑的空间,同时保护节点的属性特征和不同类型对象之间的异质链接承载的复杂、多样且丰富的语义信息.HANEP模型首先基于样本属性的相似性构建属性图、依据元路径抽取异质属性网络的拓扑结构,然后通过随机冲浪获得属性和拓扑概率共现(probabilistic co-occurrence,PCO)矩阵,并计算其正点对互信息(positive point-wise mutual information,PPMI),进而采用多个自编码器(auto-encoder,AE)捕捉节点属性和异质链接的本质信息.元路径可以捕捉异质网络中多种类型节点间的链接关系,构建属性图可以清晰描述节点属性的非线性流行结构,属性和拓扑的局部成对约束和图表示有助于整合节点属性和网络拓扑的一致性和互补性关系,PPMI表示可以捕捉属性和拓扑的高阶近邻信息及潜在的复杂非线性关系.在3个真实数据集上的实验结果验证了HANEP算法的有效性.展开更多
文摘在聚类过程中,多视角数据的高维性和稀疏性使视角内描述样本的不同特征对聚类结果的影响不同,同一样本在不同的视角中对聚类的贡献也不同.层次化区分视角内不同特征的权重和相同样本在不同视角内的权重是提高多视角聚类性能的重要因素.提出了具有特征级和样本级两级权重的多视角聚类(multi-view clustering based on two-level weights,MVC2W)算法.该算法引入了特征级和样本级注意力机制学习每个视角内不同特征的权重和每个样本在不同视角内的权重.两级注意力机制使算法在训练过程中能够更加关注重要的特征和重要的样本,更加合理地融合不同视角的信息,从而有效克服数据高维性和稀疏性对聚类结果的影响.此外,MVC2W将表征学习和聚类过程融为一体,协同训练、相互促进,进一步提升聚类性能.在5个稀疏程度不同的数据集上的实验结果表明:MVC2W算法的聚类性能比11个基线算法均有提升,尤其是在稀疏程度高的数据集上,MVC2W的提升更加显著.
文摘针对当前大部分影响力最大化算法忽略了异质信息网络包含多种节点类型和多种关系类型,且不同类型节点在原始空间无法直接度量的问题,提出了一种异质信息网络中基于网络嵌入的影响力最大化模型(influence maximization based on network embedding,IMNE),用于选择初始扩散节点实现影响力最大化。该模型不仅可以在对异质信息网络进行编码的同时表征异质信息网络中潜在的信息,还可以捕获不同类型节点间影响力的不确定和复杂性。在3个真实数据集上的实验验证了IMNE算法的有效性。
文摘属性网络嵌入旨在映射网络中的节点和链接关系到低维空间,同时保留其固有的结构和属性特征.异质属性网络中多种类型的节点和链接关系给网络嵌入学习提供了丰富的辅助信息,同时也带来了新的挑战.提出异质属性网络嵌入模型(heterogeneous attribute network embedding based on the PPMI,HANEP),旨在将网络中多种类型的节点和(或)多种类型的链接关系映射到低维、紧凑的空间,同时保护节点的属性特征和不同类型对象之间的异质链接承载的复杂、多样且丰富的语义信息.HANEP模型首先基于样本属性的相似性构建属性图、依据元路径抽取异质属性网络的拓扑结构,然后通过随机冲浪获得属性和拓扑概率共现(probabilistic co-occurrence,PCO)矩阵,并计算其正点对互信息(positive point-wise mutual information,PPMI),进而采用多个自编码器(auto-encoder,AE)捕捉节点属性和异质链接的本质信息.元路径可以捕捉异质网络中多种类型节点间的链接关系,构建属性图可以清晰描述节点属性的非线性流行结构,属性和拓扑的局部成对约束和图表示有助于整合节点属性和网络拓扑的一致性和互补性关系,PPMI表示可以捕捉属性和拓扑的高阶近邻信息及潜在的复杂非线性关系.在3个真实数据集上的实验结果验证了HANEP算法的有效性.