期刊文献+
共找到291篇文章
< 1 2 15 >
每页显示 20 50 100
困难样本采样联合对比增强的深度图聚类 被引量:1
1
作者 朱玄烨 孔兵 +2 位作者 陈红梅 包崇明 周丽华 《计算机应用研究》 CSCD 北大核心 2024年第6期1769-1777,共9页
针对困难样本挖掘的图聚类算法是最近的研究热点,目前算法存在的主要问题有:对比方法和样本对加权策略缺少良好的融合机制;采样正样本时忽略了视图内部的“假阴性”样本;忽视图级信息对聚类的帮助。针对上述问题,提出困难样本采样联合... 针对困难样本挖掘的图聚类算法是最近的研究热点,目前算法存在的主要问题有:对比方法和样本对加权策略缺少良好的融合机制;采样正样本时忽略了视图内部的“假阴性”样本;忽视图级信息对聚类的帮助。针对上述问题,提出困难样本采样联合对比增强的图聚类算法。首先使用自编码器学习嵌入,根据计算的伪标签、相似度、置信度信息为表示学习设计一种自加权对比损失,统一不同视图下节点对比和困难样本对加权策略。通过调整不同置信区域样本对的权重,损失函数驱动模型关注不同类型的困难样本以学习有区分性的特征,提高簇内表示的一致性和簇间表示的差异性,增强对样本的判别能力。其次,图级表示经聚类网络投影,通过聚类对比损失最大化不同视图下聚类的表示一致性。最后联合两种对比损失,利用自监督训练机制进行迭代优化,完成聚类任务。该算法在5个真实数据集上与9个基准聚类算法对比,在4个权威指标上达到最优,聚类性能出色。消融实验表明两个对比模块的有效性和可迁移性。 展开更多
关键词 表示学习 属性图聚类 对比学习 困难样本挖掘
下载PDF
基于对比共识图学习的多视图属性图聚类算法
2
作者 刘鹏仪 胡节 +1 位作者 王红军 彭博 《计算机科学》 CSCD 北大核心 2024年第11期73-80,共8页
多视图属性图聚类可以将具有多个视图的图数据的节点划分到不同的簇中,近年来受到了研究者的广泛关注。目前,已有许多基于图神经网络的多视图属性图聚类方法被提出并取得了较好的聚类性能。然而,由于图神经网络难以处理数据收集过程中... 多视图属性图聚类可以将具有多个视图的图数据的节点划分到不同的簇中,近年来受到了研究者的广泛关注。目前,已有许多基于图神经网络的多视图属性图聚类方法被提出并取得了较好的聚类性能。然而,由于图神经网络难以处理数据收集过程中出现的图噪声,因此基于图神经网络的多视图属性图方法很难进一步提高聚类性能。为此,提出了一种新的基于对比共识图学习的多视图属性图聚类算法,以降低噪声对聚类的影响从而得到更好的结果。该算法包括4个步骤:首先,使用图滤波消除图上的噪声,并同时保留完整的图结构;然后,选择少量节点来学习共识图,以降低计算复杂度;随后,使用图对比正则化来帮助学习共识图;最后,利用谱聚类获得聚类结果。大量的实验结果表明,与当前最先进的方法相比,所提算法能够很好地减少图数据中噪声对聚类的影响,并以较高的执行效率取得良好的聚类结果。 展开更多
关键词 多视学习 属性数据 图聚类 对比共识学习 过滤
下载PDF
基于图聚类结果的半监督节点分类方法
3
作者 鲍舟 刘恒 《计算机科学与应用》 2024年第9期12-22,共11页
目前在处理现实世界中知识图谱、引文网络以及社交网络等复杂的图结构数据分类问题上,图卷积神经网络被认为是最有效的半监督方法之一,但存在其学习性能会被严重有限的标记数据影响的问题。本研究针对这一问题提出了一种以图聚类结果作... 目前在处理现实世界中知识图谱、引文网络以及社交网络等复杂的图结构数据分类问题上,图卷积神经网络被认为是最有效的半监督方法之一,但存在其学习性能会被严重有限的标记数据影响的问题。本研究针对这一问题提出了一种以图聚类结果作为指导的节点分类方法。具体来说,引入数据增强模块减少了图结构信息中的噪声,设计了一种面向聚类的图嵌入模型作为属性图聚类网络,并根据聚类结果预测出节点的伪标签。同时,为了提升分类任务的性能,筛选出高置信度伪标签来指导图节点分类任务,并设计了一种相似度损失来提高标记节点和未标记节点之间的特征相似度。通过在基准数据集上大量的实验结果表明,与现有的方法相比,该方法可以克服标签数量限制,在图节点分类任务上表现出优越的性能。Currently, graph convolutional neural networks are considered to be one of the most effective semi-supervised methods in dealing with the classification of complex graph-structured data in real-world, such as knowledge graphs, citation networks, and social networks, but there is still the problem that their learning performance can be affected by severely limited labeled data. In this study, a node classification method using graph clustering results as a guide is proposed to address this problem. Specifically, a data enhancement module is introduced to reduce the noise in the graph structure information, a clustering-oriented graph embedding model is designed as an attribute graph clustering network, and the pseudo-labels of the nodes are predicted based on the clustering results. Meanwhile, to improve the performance of the classification task, high-confidence pseudo-labels are screened to guide the graph node classification task, and a similarity loss is designed to improve the feature similarity between labeled and unlabeled nodes. The results of extensive experiments on the benchmark dataset show that the method can overcome the label number limitation and have superior performance on the graph node classification task compared with existing methods. 展开更多
关键词 机器学习 卷积神经网络 图聚类 节点分
下载PDF
基于离散指示矩阵优化的多视角图聚类方法
4
作者 王念 张炜 +3 位作者 崔智高 苏延召 姜柯 李爱华 《火箭军工程大学学报》 2024年第3期51-59,共9页
为了解决当前多视角图聚类方法依赖于谱分解而导致计算量高且超参数调优过程繁琐的问题,基于离散指示矩阵优化的方式,提出了一种无超参数的多视角图聚类方法。为了避免谱分解的连续松弛,采用一种超集群策略来高效区分数据的离散集群关... 为了解决当前多视角图聚类方法依赖于谱分解而导致计算量高且超参数调优过程繁琐的问题,基于离散指示矩阵优化的方式,提出了一种无超参数的多视角图聚类方法。为了避免谱分解的连续松弛,采用一种超集群策略来高效区分数据的离散集群关系。在优化层面,改进了传统的坐标下降方法,以降低计算复杂度以及实现离散指示矩阵的快速优化。在物体图像、人脸图像、文本数据、手写字体图像中进行了算法性能验证。结果表明:相比于最近常用的多视角图聚类方法,所提方法在聚类精度和运行效率方面具有明显优势。 展开更多
关键词 多视角图聚类 离散指示矩阵 超集群策略 坐标下降 谱分解
下载PDF
HPLC/ELSD指纹图谱和星座图聚类法在清开灵注射液质量评价中的应用 被引量:15
5
作者 严诗楷 辛文锋 +2 位作者 王义明 罗国安 程翼宇 《药学学报》 CAS CSCD 北大核心 2005年第9期842-845,共4页
目的对清开灵注射液的质量进行科学评价,为有效控制中药质量提供一种可靠方法。方法采用HPLC/ELSD指纹图谱技术结合星座图聚类法,测定不同厂家的18个批次清开灵注射液的指纹图谱,并评价产品质量。结果本法直观、准确地表达了产品的质量... 目的对清开灵注射液的质量进行科学评价,为有效控制中药质量提供一种可靠方法。方法采用HPLC/ELSD指纹图谱技术结合星座图聚类法,测定不同厂家的18个批次清开灵注射液的指纹图谱,并评价产品质量。结果本法直观、准确地表达了产品的质量信息。结论本法是中药质量评价的一种直观、合理、有效的技术手段。 展开更多
关键词 高效液相色谱 蒸发光散射 星座图聚类 指纹 清开灵注射液
下载PDF
谱图聚类算法研究进展 被引量:12
6
作者 李建元 周脚根 +1 位作者 关佶红 周水庚 《智能系统学报》 2011年第5期405-414,共10页
近10多年来,关于谱图聚类的研究成果非常丰富,为了总结和理清这些工作之间的脉络关系,揭示最新的研究趋势,回顾和比较了典型的图割目标函数,以及这些目标函数的谱宽松解决方法,总结了谱聚类算法的本质.另外,讨论了谱图聚类的几个关键问... 近10多年来,关于谱图聚类的研究成果非常丰富,为了总结和理清这些工作之间的脉络关系,揭示最新的研究趋势,回顾和比较了典型的图割目标函数,以及这些目标函数的谱宽松解决方法,总结了谱聚类算法的本质.另外,讨论了谱图聚类的几个关键问题:相似图的构建方法、复杂性与扩充性、簇数估计、半监督谱学习等.最后,展望了谱图聚类算法的主要研究趋势,如探寻其理论解释,构建更贴切的相似图,通过学习筛选特征,应用实例化等. 展开更多
关键词 图聚类 割目标函数 谱宽松方法 相似构建 半监督学习
下载PDF
一种基于节点间路径度量的图聚类算法 被引量:6
7
作者 郑文萍 车晨浩 +2 位作者 钱宇华 王杰 杨贵 《计算机学报》 EI CSCD 北大核心 2020年第7期1312-1327,共16页
图聚类算法可以用于发现社会网络中的社区结构、蛋白质互作用网络中的功能模块等,是当前复杂网络研究的热点之一.对网络中节点的相似性和簇发现结果进行合理度量是核心问题.针对此问题,给出了一种基于节点间点不重复路径度量的节点相似... 图聚类算法可以用于发现社会网络中的社区结构、蛋白质互作用网络中的功能模块等,是当前复杂网络研究的热点之一.对网络中节点的相似性和簇发现结果进行合理度量是核心问题.针对此问题,给出了一种基于节点间点不重复路径度量的节点相似性指标.以此为基础提出了一种面向复杂网络的基于“中心-扩展”策略的图聚类算法(A Graph Clustering Algorithm Based on Local Paths between Nodes in Complex Networks,PGC),包括节点相似性计算、中心节点选择、初始簇划分和簇优化四个主要过程.采用点不重复路径对节点相似性进行度量,消除了由大度节点引起较多的点重复路径对节点相似性的影响,提高了算法对大度节点邻域中节点的划分能力.通过与一些经典算法在11个真实网络、22个人工网络数据集上的实验比较分析,结果表明算法PGC在标准互信息、调整兰德系数、F度量、准确度等方面均表现出良好的性能. 展开更多
关键词 复杂网络 图聚类 簇结构 相似性度量 连通性
下载PDF
一种面向蛋白质复合体检测的图聚类方法 被引量:14
8
作者 王杰 梁吉业 郑文萍 《计算机研究与发展》 EI CSCD 北大核心 2015年第8期1784-1793,共10页
蛋白质互作用(protein-protein interaction,PPI)网络是广泛存在的一类复杂生物网络,其网络拓扑特征与功能模块分析密切相关.图聚类是对复杂网络进行分析和处理的一种重要计算方法.传统的PPI网络中蛋白质复合体检测算法通常对网络图中... 蛋白质互作用(protein-protein interaction,PPI)网络是广泛存在的一类复杂生物网络,其网络拓扑特征与功能模块分析密切相关.图聚类是对复杂网络进行分析和处理的一种重要计算方法.传统的PPI网络中蛋白质复合体检测算法通常对网络图中的对象进行硬划分,而寻找网络中的重叠簇的软聚类算法已成为当前研究热点之一.现有的软聚类算法较少关注寻找网络中具有重要生物意义的小规模非稠密簇.对此,基于网络中结点邻域给出了边关联强度的度量方法,并在此基础上提出了一种基于流模拟的PPI网络中复合体检测的图聚类(flow-simulation graph clustering,F-GCL)算法,该算法可以在快速发现PPI网络中的重叠簇的同时找到小规模非稠密簇;同时,与MCODE(molecular complex detection),MCL(Markov clustering),RNSC(restricted neighborhood search clustering)和CPM(clique percolation method)算法在6个酿酒酵母PPI网络上进行比较,该算法在F-measure,Accuracy,Separation方面表现了较好的性能. 展开更多
关键词 流模拟 图聚类 蛋白质互作用网络 蛋白质复合体
下载PDF
复杂生物网络分析的图聚类方法研究进展 被引量:6
9
作者 梅娟 王正祥 +1 位作者 石贵阳 李炜疆 《食品与生物技术学报》 CAS CSCD 北大核心 2008年第5期15-20,共6页
基因组学和高通量技术提供了大量生命系统组成元件(如蛋白质)之间相互关系的数据,由这些关系数据构成的复杂生物网络蕴含着丰富的生命系统运行机制的知识,挖掘这些隐蔽的知识成为当前系统生物学的主要任务之一。作为知识发现重要手段的... 基因组学和高通量技术提供了大量生命系统组成元件(如蛋白质)之间相互关系的数据,由这些关系数据构成的复杂生物网络蕴含着丰富的生命系统运行机制的知识,挖掘这些隐蔽的知识成为当前系统生物学的主要任务之一。作为知识发现重要手段的图聚类方法,在复杂生物网络分析上受到了普遍关注,在远同源性探测、蛋白质功能预测、代谢途径发现等方面取得了令人瞩目的结果。同时也注意到,由于生命系统的高度复杂性,其他领域中卓有成效的方法往往在复杂生物网络分析中遇到困难。评述了近年来图聚类算法在复杂生物网络分析中的进展,简要分析了复杂生物网络研究的图聚类途径所面临的主要问题。 展开更多
关键词 复杂生物网络 图聚类 蛋白质相互作用网络 代谢网络 蛋白质相似性网络
下载PDF
一种遗传算法实现的图聚类匿名隐私保护方法 被引量:12
10
作者 姜火文 曾国荪 胡克坤 《计算机研究与发展》 EI CSCD 北大核心 2016年第10期2354-2364,共11页
聚类匿名是一种典型的社交网数据发布隐私保护方案,其基础工作是图聚类.图聚类为一类NP难的组合优化问题,便于使用搜索优化算法.现有图聚类匿名方法缺少此类启发式搜索算法.为此,研究一种利用遗传算法实现的图聚类匿名方法,利用贪心法... 聚类匿名是一种典型的社交网数据发布隐私保护方案,其基础工作是图聚类.图聚类为一类NP难的组合优化问题,便于使用搜索优化算法.现有图聚类匿名方法缺少此类启发式搜索算法.为此,研究一种利用遗传算法实现的图聚类匿名方法,利用贪心法进行结点聚类预划分,以构造初始种群;依据关系拟合理论建立个体适应度函数;根据个体编码特点,分别提出一种多点错位的交叉算子和基因位交换的变异算子.图聚类模型综合考虑了结点的结构和属性信息,而遗传算法的全局化搜索优化能力保障了图聚类质量,因此,该方法具有较强的隐私保护性.实验表明了该方法在提高聚类质量和减小信息损失方面的有效性. 展开更多
关键词 社交网络 图聚类 隐私保护匿名 遗传算法
下载PDF
基于结构-属性的时空对象图聚类算法的研究 被引量:3
11
作者 韩启龙 赵洪斌 +2 位作者 潘海为 印桂生 常吉羽 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期154-162,共9页
在现有的图聚类方法中,大多数聚类方法只关注图的拓扑结构或节点属性而忽略另一方面.为解决这一问题,相关文献中提出了基于图的结构与属性的图聚类方法.但这些聚类方法存在建立的图模型不准确、聚类效果不理想、算法执行效率低等缺点.... 在现有的图聚类方法中,大多数聚类方法只关注图的拓扑结构或节点属性而忽略另一方面.为解决这一问题,相关文献中提出了基于图的结构与属性的图聚类方法.但这些聚类方法存在建立的图模型不准确、聚类效果不理想、算法执行效率低等缺点.针对上述图聚类方法中存在的问题,提出了一种基于结构-属性的时空对象图聚类方法(spatio-temporal object graph clustering algorithm based on structure and attribute,STSA).首先提出了属性加权图模型,在此基础上建立了结构-属性的统一度量方法,并采用随机游走模型技术将节点间结构与属性关系转换为相应的相似度矩阵,结合图结构-属性关系及相似度矩阵,采用信息传递算法对图进行聚类,解决了现有图聚类方法中所存在的问题,最后通过实验验证了提出的STSA方法的正确性和有效性. 展开更多
关键词 挖掘 图聚类 STSA算法 随机游走 相似度矩阵
下载PDF
基于采样的大规模图聚类分析算法 被引量:3
12
作者 张建朋 陈鸿昶 +2 位作者 王凯 祝凯捷 王亚文 《电子学报》 EI CAS CSCD 北大核心 2019年第8期1731-1737,共7页
针对当前聚类方法(例如经典的GN算法)计算复杂度过高、难以适用于大规模图的聚类问题,本文首先对大规模图的采样算法展开研究,提出了能够有效保持原始图聚类结构的图采样算法(Clustering-structure Representative Sampling,CRS),它能... 针对当前聚类方法(例如经典的GN算法)计算复杂度过高、难以适用于大规模图的聚类问题,本文首先对大规模图的采样算法展开研究,提出了能够有效保持原始图聚类结构的图采样算法(Clustering-structure Representative Sampling,CRS),它能在采样图中产生高质量的聚类代表点,并根据相应的扩张准则进行采样扩张.此采样算法能够很好地保持原始图的内在聚类结构.其次,提出快速的整体样本聚类推断(Population Clustering Inference,PCI)算法,它利用采样子图的聚类标签对整体图的聚类结构进行推断.实验结果表明本文算法对大规模图数据具有较高的聚类质量和处理效率,能够很好地完成大规模图的聚类任务. 展开更多
关键词 大规模 采样 图聚类 整体推断 代表点 扩张准则
下载PDF
图聚类的算法及其在社会关系网络中的应用 被引量:16
13
作者 温菊屏 钟勇 《计算机应用与软件》 CSCD 北大核心 2012年第2期161-163,178,共4页
研究图聚类的算法问题。在基于划分的图聚类中,重点比较点与点之间距离的计算方法及其对聚类结果的影响。由于社会关系网络图中点没有坐标值,所以不能使用欧几里得距离和曼哈坦距离。使用k-medoids聚类算法时,分别采用最短距离和随机漫... 研究图聚类的算法问题。在基于划分的图聚类中,重点比较点与点之间距离的计算方法及其对聚类结果的影响。由于社会关系网络图中点没有坐标值,所以不能使用欧几里得距离和曼哈坦距离。使用k-medoids聚类算法时,分别采用最短距离和随机漫步距离算法,将DBLP数据集构成的社会关系网络图分类成各个子图,通过实验数据验证两种算法的优劣。实验证明最短距离算法获得聚类效果更为理想,达到了较好的分类效果。 展开更多
关键词 图聚类 社会关系网络 k-medoids 最短距离算法 随机漫步距离算法
下载PDF
基于图聚类的协同标记系统资源个性推荐 被引量:4
14
作者 王庆林 薛惠锋 林波 《计算机工程与应用》 CSCD 北大核心 2010年第11期10-13,共4页
协同标记系统允许用户自由标记系统资源,但也由此产生了同义标签和多义标签问题,这使得如何利用用户标签构成的用户概貌信息进行个性化资源推荐成为一个难题。为此首先基于图聚类算法把系统中语义相近的标签构成聚类,然后以标签聚类为... 协同标记系统允许用户自由标记系统资源,但也由此产生了同义标签和多义标签问题,这使得如何利用用户标签构成的用户概貌信息进行个性化资源推荐成为一个难题。为此首先基于图聚类算法把系统中语义相近的标签构成聚类,然后以标签聚类为中介衡量特定用户和资源的相关度。在BibSonomy和Delicious两个数据集上进行了测试,并和另外两种算法进行了对比。实验结果显示应用该算法产生的推荐,其性能优于对比算法,在主题宽泛的系统中效果尤为明显。说明协同标记系统首先进行标签聚类是产生个性化资源推荐的重要方法。 展开更多
关键词 协同标记系统 推荐 图聚类 个性化
下载PDF
玉米自交系的星座图聚类分析 被引量:8
15
作者 席章营 吴建宇 《玉米科学》 CAS CSCD 1999年第1期25-29,共5页
用星座图聚类的方法对28个玉米自交系进行了分析。结果表明:①计算所得的综合值可以客观地度量玉米自交系的综合性状,且玉米自交系的综合值具有相对的稳定性;②依综合值的大小,可以把28个参试玉米自交系划分为性状各异的6个类... 用星座图聚类的方法对28个玉米自交系进行了分析。结果表明:①计算所得的综合值可以客观地度量玉米自交系的综合性状,且玉米自交系的综合值具有相对的稳定性;②依综合值的大小,可以把28个参试玉米自交系划分为性状各异的6个类群或简单地划分为优良、一般、较差3个等级;③星座图聚类是表型性状的聚类,聚类结果与自交系间的血缘无必然的联系。 展开更多
关键词 玉米 自交系 星座图聚类 遗传
下载PDF
基于谱特征和图分割的图聚类算法 被引量:3
16
作者 高阳 李昌华 +1 位作者 李智杰 崔欢欢 《计算机工程与应用》 CSCD 北大核心 2017年第15期222-226,共5页
为了对图数据库中的结构化数据有效的聚类分析,首先对不同的图数据样本进行特征的深度挖掘,构造了包含节点间连接层次关系的关联度矩阵,与拉普拉斯矩阵结合共同完成谱特征分析;然后利用高斯核函数进行相似度矩阵的构建,将相似度归一化到... 为了对图数据库中的结构化数据有效的聚类分析,首先对不同的图数据样本进行特征的深度挖掘,构造了包含节点间连接层次关系的关联度矩阵,与拉普拉斯矩阵结合共同完成谱特征分析;然后利用高斯核函数进行相似度矩阵的构建,将相似度归一化到0到1的范围内便于后期处理;最后结合图分割与k-means算法将相似度矩阵进行k分割,得到k个聚类。经过大量分析实验表明,改进的拉普拉斯矩阵对样本内部结构有更为精细的划分,提高了前期样本处理效果。最小比率割算法在保证精度的前提下,将NP难的问题转化为多项式时间内解决的问题,提高了算法的效率。 展开更多
关键词 谱特征分解 分割 相似度矩阵 图聚类
下载PDF
用星座图聚类法对玉米自交系综合性状的定量研究 被引量:3
17
作者 吴建宇 孙书安 郑国清 《河南农业大学学报》 CAS CSCD 1992年第4期375-379,405,共6页
本文首次用星座图对玉米自交系10个数量性状进行了聚类,用计算所得的综合指标值较为客观地度量玉米自交系的综合性状,并把55个玉米自交系划为综合性状各异的6个类群。权重对分类结果影响较大,而当主指标确定以后,不等指标对分类的影响... 本文首次用星座图对玉米自交系10个数量性状进行了聚类,用计算所得的综合指标值较为客观地度量玉米自交系的综合性状,并把55个玉米自交系划为综合性状各异的6个类群。权重对分类结果影响较大,而当主指标确定以后,不等指标对分类的影响存在一定的稳定性。 展开更多
关键词 玉米 自交系 星座图聚类 性状 分析
下载PDF
基于能量函数和模块最优化的不确定图聚类 被引量:2
18
作者 丁悦 张阳 +1 位作者 王勇 李伟卫 《计算机应用研究》 CSCD 北大核心 2012年第8期3173-3175,共3页
为证明不确定性的存在对聚类结果不可忽略的影响,改进了基于能量模型布局和模块化聚类的算法LinLogLayout,使之可以处理不确定图数据。提出了不确定图的定义并产生满足Zipf分布的不确定图数据,对确定算法进行不确定化使之满足应用要求... 为证明不确定性的存在对聚类结果不可忽略的影响,改进了基于能量模型布局和模块化聚类的算法LinLogLayout,使之可以处理不确定图数据。提出了不确定图的定义并产生满足Zipf分布的不确定图数据,对确定算法进行不确定化使之满足应用要求。实验结果表明,不论是在确定图数据、不确定图数据还是人工数据集、真实数据集上,改进的LinLogLayout算法都具有较好的聚类效果。实验结果也表明,不确定性的存在对聚类结果具有不可忽略的影响。 展开更多
关键词 不确定 挖掘 能量模型 模块化 图聚类
下载PDF
基于动态类簇形成博弈的属性图聚类方法 被引量:6
19
作者 卜湛 王煜尧 +2 位作者 马丽娜 蒋玖川 曹杰 《计算机学报》 EI CAS CSCD 北大核心 2021年第9期1824-1840,共17页
以微博、微信为代表的社交网络不仅包含丰富的节点属性信息,还蕴含复杂的网络拓扑信息,这些社交网络通常可被建模为属性图.传统的图聚类方法假设节点属性与网络拓扑共享同一类簇结构.然而,在真实社交网络中,节点属性与网络拓扑所对应的... 以微博、微信为代表的社交网络不仅包含丰富的节点属性信息,还蕴含复杂的网络拓扑信息,这些社交网络通常可被建模为属性图.传统的图聚类方法假设节点属性与网络拓扑共享同一类簇结构.然而,在真实社交网络中,节点属性与网络拓扑所对应的类簇结构并非完全一致.譬如,通过社团发现技术分析新浪微博的好友关注列表能够直观地获取聚集在同一群组的用户集合;而借助文本挖掘技术分析同一群组的用户生成内容却会发现用户讨论话题的分布广泛,体现出差异化的用户偏好特征.如何有效融合属性与拓扑信息对属性图进行聚类是理解、分析和可视化大规模社交网络的关键难题之一.为此,本文将属性图聚类建模为多目标优化问题,提出一种基于动态类簇形成博弈的属性图聚类方法.首先定义一种新颖的中心性指标度量节点的影响力,并提出一种启发式方法初始化属性图类簇质心;其次在动态博弈理论框架下,提出一种贪心的局部搜索策略更新节点类簇标签,并严格证明该局部搜索策略可使类簇结构收敛至局部帕累托最优解;最后设计一种基于多智能体自治计算的属性图聚类算法,该算法无需预设初始类簇个数,且复杂度近似线性于边的数目.为验证本文所提算法的性能,我们依次从三个方面来对其进行测试和评估.首先我们在Google+属性图上对所提算法进行了单独的收敛性分析.我们测试了算法中四个需要优化的目标函数(K-means损失函数、Havrda-Charvat生成熵、负模块度和负紧凑度)在三个不同的Bregman散度(欧氏距离平方、KL散度距离和余弦距离)设置下的收敛性情况.实验结果表明,四个目标函数能在50轮迭代之后达到收敛状态.然后,我们在4个大规模属性图上分别从聚类精度和可扩展性两个方面将本文所提算法与9个基准方法作了充分对比.对比结果表明,本文所提算法在NMI指标下比其它算法所得最优结果高出0.7%;而在AvgF1指标下比大多数算法所得的最优结果高出0.2%.在可扩展性方面,本文所提算法即使在最大规模的Google+属性图上也能在1个小时内计算出聚类结果.最后,我们在小规模PolBK数据集上进行了可视化分析.从可视化结果可以看出,在14轮迭代后本文所提算法就达到了稳定状态,与此同时找到了与真实情况接近的类簇结构.总体实验结果表明,本文方法能够准确发现大规模社交网络潜在的类簇结构,且同已有方法相比具备较好的有效性和高效性. 展开更多
关键词 属性图聚类 多目标优化 动态簇形成博弈 局部帕累托最优 自治计算
下载PDF
基于模块性的检测簇结构的图聚类算法研究 被引量:2
20
作者 郑文萍 王丹 王杰 《小型微型计算机系统》 CSCD 北大核心 2016年第7期1618-1623,共6页
从大规模的复杂网络中挖掘重要的簇结构已经成为当今研究的热点之一.对复杂网络中基于密度和模块性的图聚类算法中的边权重定义、种子选择与扩展等问题进行了研究,提出一种检测复杂网络中稠密簇结构的局部模块性图聚类算法LM C.算法首... 从大规模的复杂网络中挖掘重要的簇结构已经成为当今研究的热点之一.对复杂网络中基于密度和模块性的图聚类算法中的边权重定义、种子选择与扩展等问题进行了研究,提出一种检测复杂网络中稠密簇结构的局部模块性图聚类算法LM C.算法首先对网络中的边权重和子图的模块性进行定义,然后选择权重最大的边作为聚类"种子边",最后对种子边进行扩展进而得到新簇.采用计算机构造数据和蛋白质作用网络数据对基于局部模块性的图聚类算法LMC进行实验.结果表明,算法LMC相较于其它聚类算法在检测复杂网络中相对稠密的簇结构的性能较好. 展开更多
关键词 复杂网络 模块性 网络簇结构 图聚类
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部