目前在处理现实世界中知识图谱、引文网络以及社交网络等复杂的图结构数据分类问题上,图卷积神经网络被认为是最有效的半监督方法之一,但存在其学习性能会被严重有限的标记数据影响的问题。本研究针对这一问题提出了一种以图聚类结果作...目前在处理现实世界中知识图谱、引文网络以及社交网络等复杂的图结构数据分类问题上,图卷积神经网络被认为是最有效的半监督方法之一,但存在其学习性能会被严重有限的标记数据影响的问题。本研究针对这一问题提出了一种以图聚类结果作为指导的节点分类方法。具体来说,引入数据增强模块减少了图结构信息中的噪声,设计了一种面向聚类的图嵌入模型作为属性图聚类网络,并根据聚类结果预测出节点的伪标签。同时,为了提升分类任务的性能,筛选出高置信度伪标签来指导图节点分类任务,并设计了一种相似度损失来提高标记节点和未标记节点之间的特征相似度。通过在基准数据集上大量的实验结果表明,与现有的方法相比,该方法可以克服标签数量限制,在图节点分类任务上表现出优越的性能。Currently, graph convolutional neural networks are considered to be one of the most effective semi-supervised methods in dealing with the classification of complex graph-structured data in real-world, such as knowledge graphs, citation networks, and social networks, but there is still the problem that their learning performance can be affected by severely limited labeled data. In this study, a node classification method using graph clustering results as a guide is proposed to address this problem. Specifically, a data enhancement module is introduced to reduce the noise in the graph structure information, a clustering-oriented graph embedding model is designed as an attribute graph clustering network, and the pseudo-labels of the nodes are predicted based on the clustering results. Meanwhile, to improve the performance of the classification task, high-confidence pseudo-labels are screened to guide the graph node classification task, and a similarity loss is designed to improve the feature similarity between labeled and unlabeled nodes. The results of extensive experiments on the benchmark dataset show that the method can overcome the label number limitation and have superior performance on the graph node classification task compared with existing methods.展开更多
图聚类算法可以用于发现社会网络中的社区结构、蛋白质互作用网络中的功能模块等,是当前复杂网络研究的热点之一.对网络中节点的相似性和簇发现结果进行合理度量是核心问题.针对此问题,给出了一种基于节点间点不重复路径度量的节点相似...图聚类算法可以用于发现社会网络中的社区结构、蛋白质互作用网络中的功能模块等,是当前复杂网络研究的热点之一.对网络中节点的相似性和簇发现结果进行合理度量是核心问题.针对此问题,给出了一种基于节点间点不重复路径度量的节点相似性指标.以此为基础提出了一种面向复杂网络的基于“中心-扩展”策略的图聚类算法(A Graph Clustering Algorithm Based on Local Paths between Nodes in Complex Networks,PGC),包括节点相似性计算、中心节点选择、初始簇划分和簇优化四个主要过程.采用点不重复路径对节点相似性进行度量,消除了由大度节点引起较多的点重复路径对节点相似性的影响,提高了算法对大度节点邻域中节点的划分能力.通过与一些经典算法在11个真实网络、22个人工网络数据集上的实验比较分析,结果表明算法PGC在标准互信息、调整兰德系数、F度量、准确度等方面均表现出良好的性能.展开更多
在现有的图聚类方法中,大多数聚类方法只关注图的拓扑结构或节点属性而忽略另一方面.为解决这一问题,相关文献中提出了基于图的结构与属性的图聚类方法.但这些聚类方法存在建立的图模型不准确、聚类效果不理想、算法执行效率低等缺点....在现有的图聚类方法中,大多数聚类方法只关注图的拓扑结构或节点属性而忽略另一方面.为解决这一问题,相关文献中提出了基于图的结构与属性的图聚类方法.但这些聚类方法存在建立的图模型不准确、聚类效果不理想、算法执行效率低等缺点.针对上述图聚类方法中存在的问题,提出了一种基于结构-属性的时空对象图聚类方法(spatio-temporal object graph clustering algorithm based on structure and attribute,STSA).首先提出了属性加权图模型,在此基础上建立了结构-属性的统一度量方法,并采用随机游走模型技术将节点间结构与属性关系转换为相应的相似度矩阵,结合图结构-属性关系及相似度矩阵,采用信息传递算法对图进行聚类,解决了现有图聚类方法中所存在的问题,最后通过实验验证了提出的STSA方法的正确性和有效性.展开更多
文摘目前在处理现实世界中知识图谱、引文网络以及社交网络等复杂的图结构数据分类问题上,图卷积神经网络被认为是最有效的半监督方法之一,但存在其学习性能会被严重有限的标记数据影响的问题。本研究针对这一问题提出了一种以图聚类结果作为指导的节点分类方法。具体来说,引入数据增强模块减少了图结构信息中的噪声,设计了一种面向聚类的图嵌入模型作为属性图聚类网络,并根据聚类结果预测出节点的伪标签。同时,为了提升分类任务的性能,筛选出高置信度伪标签来指导图节点分类任务,并设计了一种相似度损失来提高标记节点和未标记节点之间的特征相似度。通过在基准数据集上大量的实验结果表明,与现有的方法相比,该方法可以克服标签数量限制,在图节点分类任务上表现出优越的性能。Currently, graph convolutional neural networks are considered to be one of the most effective semi-supervised methods in dealing with the classification of complex graph-structured data in real-world, such as knowledge graphs, citation networks, and social networks, but there is still the problem that their learning performance can be affected by severely limited labeled data. In this study, a node classification method using graph clustering results as a guide is proposed to address this problem. Specifically, a data enhancement module is introduced to reduce the noise in the graph structure information, a clustering-oriented graph embedding model is designed as an attribute graph clustering network, and the pseudo-labels of the nodes are predicted based on the clustering results. Meanwhile, to improve the performance of the classification task, high-confidence pseudo-labels are screened to guide the graph node classification task, and a similarity loss is designed to improve the feature similarity between labeled and unlabeled nodes. The results of extensive experiments on the benchmark dataset show that the method can overcome the label number limitation and have superior performance on the graph node classification task compared with existing methods.
文摘图聚类算法可以用于发现社会网络中的社区结构、蛋白质互作用网络中的功能模块等,是当前复杂网络研究的热点之一.对网络中节点的相似性和簇发现结果进行合理度量是核心问题.针对此问题,给出了一种基于节点间点不重复路径度量的节点相似性指标.以此为基础提出了一种面向复杂网络的基于“中心-扩展”策略的图聚类算法(A Graph Clustering Algorithm Based on Local Paths between Nodes in Complex Networks,PGC),包括节点相似性计算、中心节点选择、初始簇划分和簇优化四个主要过程.采用点不重复路径对节点相似性进行度量,消除了由大度节点引起较多的点重复路径对节点相似性的影响,提高了算法对大度节点邻域中节点的划分能力.通过与一些经典算法在11个真实网络、22个人工网络数据集上的实验比较分析,结果表明算法PGC在标准互信息、调整兰德系数、F度量、准确度等方面均表现出良好的性能.
文摘在现有的图聚类方法中,大多数聚类方法只关注图的拓扑结构或节点属性而忽略另一方面.为解决这一问题,相关文献中提出了基于图的结构与属性的图聚类方法.但这些聚类方法存在建立的图模型不准确、聚类效果不理想、算法执行效率低等缺点.针对上述图聚类方法中存在的问题,提出了一种基于结构-属性的时空对象图聚类方法(spatio-temporal object graph clustering algorithm based on structure and attribute,STSA).首先提出了属性加权图模型,在此基础上建立了结构-属性的统一度量方法,并采用随机游走模型技术将节点间结构与属性关系转换为相应的相似度矩阵,结合图结构-属性关系及相似度矩阵,采用信息传递算法对图进行聚类,解决了现有图聚类方法中所存在的问题,最后通过实验验证了提出的STSA方法的正确性和有效性.