基于KNN与矩阵变换的图节点嵌入归纳式学习算法被引量：1

Inductive Learning Algorithm of Graph Node Embedding Based on KNN and Matrix Transform

下载PDF

导出

摘要图节点的低维嵌入在各种预测任务中是非常有用的,如蛋白质功能预测、内容推荐等。然而,多数方法不能自然推广到不可见节点。图采样聚合算法(Graph Sample and Aggregate,Graphsage)虽然可以提高不可见节点生成嵌入的速度,但容易引入噪声数据,且生成的节点嵌入的表示能力不高。为此,文中提出了一种基于KNN与矩阵变换的图节点嵌入归纳式学习算法。首先,通过KNN选取K个邻节点;然后,根据聚合函数生成聚合信息;最后,利用矩阵变换与全连接层对聚合信息和节点信息进行计算,得到新的节点嵌入。为了有效权衡计算时间与性能,文中提出一种新的聚合函数,对邻节点特征运用最大池化作为聚合信息输出,以更多地保留邻节点信息,降低计算代价。在reddit和PPI两个数据集上的实验表明,所提算法在micro-f1和macro-f1两个评价指标上分别获得了4.995%与10.515%的提升。因此,该算法可以大幅减少噪声数据,提高节点嵌入的表示能力,快速有效地为不可见节点及不可见图生成节点嵌入。 Low-dimensional embedding of graph nodes is very useful in various prediction tasks,such as protein function prediction,content recommendation and so on.However,most methods cannot be naturally extended to invisible nodes.Graph Sample and Aggregate(Graph Sample and Aggregate,Grasage)algorithm can improve the speed of invisible node generation embedding,but it is easy to introduce noise data,and the representation ability of generated node embedding is not high.In this paper,an inductive learning algorithm based on KNN and matrix transformation for graph node embedding is proposed.Firstly,K neighbo-ring nodes are selected by KNN.Then aggregation information is generated by aggregation function.Finally,aggregation information and node information are calculated by matrix transformation and full connection layer,and new node embedding is obtained.In order to balance computing time and performance effectively,this paper proposes a new aggregation function,which uses maximum pooling as aggregation information output for neighbor node features,retains more neighbor node information and reduces computing cost.Experiments on two data sets of reddit and PPI show that the proposed algorithm achieves 4.995%and 10.515%improvement on micro-f1 and macro-f1,respectively.The experimental data fully show that the algorithm can greatly reduce noise data,improve the representation ability of node embedding,and quickly and effectively generate node embedding for invisible nodes and invisible graphs.

作者贺苗苗郭卫斌 HE Miao-miao;GUO Wei-bin(School of Information Science and Engineering,East China University of Science and Technology,Shanghai 200237,China)

机构地区华东理工大学信息科学与工程学院

出处《计算机科学》 CSCD 北大核心 2021年第3期201-205,共5页 Computer Science

基金国家自然科学基金(61672227)。

关键词低维嵌入 KNN 节点嵌入聚合函数表示能力 Low dimensional embedding KNN Node embedding Aggregation function Representation ability

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1兰远东,邓辉舫,陈涛.基于图收缩的半监督聚类算法[J].计算机科学,2012,39(4):236-239. 被引量：2
2张伟鹏,李振军,李荣华,刘宇鸿,毛睿,乔少杰.基于MapReduce的图结构聚类算法[J].软件学报,2018,29(3):627-641. 被引量：4

二级参考文献15

1Duda R O,Hart P E,Stork D G. Pattern Classification[M].New York:John Wiley and Sons,Inc,2001.517-580.
2Chapelle O,Sch61kopf B,Zien A. Semi-Supervised Learning[M].Cambridge,MA:The MIT Press,2006.1-18.
3Zhu X. Semi-Supervised Learning with Graphs[D].Pittsburgh,Pennsylvania,USA:Carnegie Mellon University,2005.5-8.
4Elghazel H,Yoshida T,Deslandres V. A new greedy algorithm for improving b-coloring clustering[J].Lecture Notes in Computer Science,2007,(38):228-239.
5yon Luxburg. A tutorial on spectral clustering[J].Statistics and Computing,2007,(04):395-416.
6Tang Wei,Xiong Hui,Zhong Shi. Enhancing semi-supervised cluStering:A feature projection perspective[A].New York:ACM,2007.707-716.
7Li Zhen-guo,Liu Jian-zhuang,Tang Xiao-ou. Pairwise constraint propagation by semidefinite programming for semi-supervised classification[A].New York:ACM,2008.576-583.
8Basu S,Bilenko M,Mooney R J. A probabilistic framework for semi-supervised clustering[A].Washington:ACM,2004.59-68.
9屈婉玲;耿素云;张立昂.离散数学[M]北京:高等教育出版社,2008273-280.
10Zhong Shi. Efficient online spherical k-means clustering[A].Montreal:IEEE,2005.3180-3185.

共引文献4

1冯珊珊,张月琴,郭旭敏.基于改进图着色理论的聚类算法[J].计算机工程与设计,2013,34(5):1740-1743. 被引量：5
2何玉林,黄哲学.大规模数据集聚类算法的研究进展[J].深圳大学学报（理工版）,2019,36(1):4-17. 被引量：10
3杜鹃,张卓,曹建春.利用快速无偏分层图抽样算法的MapReduce负载平衡方法[J].计算机应用与软件,2021,38(11):288-294. 被引量：2
4李勇,唐国琴,罗琅腾,张天财,杨涛.云环境下海量GPS、视频监控数据存储检索研究[J].电力大数据,2022,25(5):85-92.

同被引文献21

1洪翠,邱仕达,高伟.CEEMDAN与GCN结合的配电变压器故障诊断[J].电子测量与仪器学报,2022,36(12):86-96. 被引量：8
2童晓阳,张绍迅.基于灰色关联度的配电网故障区段定位与类型识别方法[J].电力系统自动化,2019,43(4):113-118. 被引量：43
3贾惠彬,李明舒,张国云.一种基于图论剪枝算法的多分支配电网行波故障定位算法[J].电测与仪表,2017,54(1):27-32. 被引量：14
4洪翠,付宇泽,郭谋发,白蔚楠.改进多分类支持向量机的配电网故障识别方法[J].电子测量与仪器学报,2019,31(1):7-15. 被引量：41
5葛少云,张成昊,刘洪,徐正阳.考虑微能源网支撑作用的配电网弹性提升策略[J].电网技术,2019,43(7):2306-2313. 被引量：40
6袁川来,廖庸邑,孔玲爽,刘建华.时间约束的改进分层模糊Petri网的配电网故障诊断方法[J].电子测量与仪器学报,2020,32(3):126-134. 被引量：17
7杨华,李喜旺,司志坚,张晓.基于图神经网络的配电网故障预测[J].计算机系统应用,2020,29(9):131-135. 被引量：9
8和敬涵,罗国敏,程梦晓,刘艳梅,谭颖婕,李猛.新一代人工智能在电力系统故障分析及定位中的研究综述[J].中国电机工程学报,2020,40(17):5506-5515. 被引量：102
9杨耿杰,许晔,高伟,洪翠,郭谋发.基于能量谱相似度自适应聚类的配电网接地故障区段定位方法[J].电力自动化设备,2021,41(3):25-32. 被引量：23
10任伟,薛永端,杨帆,徐丙垠.中性点不接地配电网电弧接地故障建模与分析[J].电网技术,2021,45(2):705-712. 被引量：21

引证文献1

1洪翠,吴奕炜,高伟,郭谋发.基于GrapSAGE算法的配电网故障定位方法[J].电子测量与仪器学报,2023,37(11):236-245.

1岳徐鑫.核心素养背景下问题驱动法在高中化学复习中的有效运用[J].中学教学参考,2021(8):69-70. 被引量：2
2张智义,倪传斌.基于分布形态的语义和句法选择[J].英语研究,2020,18(2):85-95.
3胡雅菲.大数据背景下移动互联网用户画像技术应用浅析[J].信息通信,2020(12):175-177. 被引量：1
4张晓丹.改进的图神经网络文本分类模型应用研究——以NSTL科技期刊文献分类为例[J].情报杂志,2021,40(1):184-188. 被引量：13
5薛璇,陈平华.基于稀疏子集分析的轨迹聚类发现[J].计算机与数字工程,2021,49(1):138-142.
6李素萍,金玉霞,杨静,唐萍,张卫华,周赤燕,沈华祥.COL2A1基因新发突变导致先天性脊柱骨骺发育不良的遗传分析及产前诊断[J].临床检验杂志,2020,38(12):919-921. 被引量：1
7仇翔,王国顺,赵扬扬,滕游,俞立.基于YOLOv3和EPnP算法的多药盒姿态估计[J].计算机测量与控制,2021,29(2):126-131. 被引量：4
8李志刚,袁蕾.基于GRA-RBF的赤潮影响因素分析与预测方法[J].电脑知识与技术,2021,17(6):4-5.
9张起.基于频域特征相似的仿真模型置信度分析[J].数字海洋与水下攻防,2020,3(6):472-476. 被引量：1
10于晗,赵满坤,潘志成,于宏兵,曹玉鑫,李英杰.烧结全过程节能减排智能控制方法分析[J].中国冶金,2020,30(12):112-118. 被引量：6

计算机科学

2021年第3期

浏览历史

内容加载中请稍等...

基于KNN与矩阵变换的图节点嵌入归纳式学习算法被引量：1

参考文献2

二级参考文献15

共引文献4

同被引文献21

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于KNN与矩阵变换的图节点嵌入归纳式学习算法 被引量：1

参考文献2

二级参考文献15

共引文献4

同被引文献21

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于KNN与矩阵变换的图节点嵌入归纳式学习算法被引量：1