大规模图神经网络研究综述被引量：2

A Survey of Large-Scale Graph Neural Networks

下载PDF

导出

摘要图神经网络凭借其处理非欧氏空间数据及其复杂特征方面的优越性受到了大量的关注,并且被广泛应用于推荐系统、知识图谱、交通道路分析等场景中.面对大规模数据,图结构的不规则性、节点特征的复杂性以及训练样本之间的依赖性对图神经网络模型的计算效率、内存管理以及分布式系统中的通信开销造成了巨大的压力.为应对和缓解以上问题,研究者从应用场景、算法模型、编程框架和硬件结构等多个层面对其进行了优化.本文主要回顾和总结了算法模型及编程框架方面的优化,为读者了解面向大规模数据的图神经网络采样算法以及框架优化相关工作提供帮助,为未来算法-框架协同优化奠定基础.具体来说,本文首先简要介绍图神经网络模型中的消息传递机制,分类介绍常见的图神经网络模型,并分析其在大规模数据训练中面临的困难和挑战;然后对面向大规模数据的图神经网络算法模型进行分类总结和分析,包括基于节点、边和子图的采样算法;接着介绍图神经网络编程框架加速的相关进展,主要包括主流框架的介绍以及优化技术的分类总结和分析;最后对未来面向大规模数据的图神经网络研究进行展望. Graph Neural Networks(GNNs)have garnered increasing attention for their ability to model non-Euclidean graph structures and complex features.They have been applied extensively in various application domains,such as recommender systems,link prediction,and traffic prediction.However,training GNN models on large-scale data poses several challenges,such as irregular graph structures,complex node features,and dependent graph training samples.These challenges can put a strain on computation efficiency,memory management,and the communication cost of distributed computing.To overcome these challenges,many researchers have focused on optimi-zing application methods,algorithm models,programming frameworks,and hardware design.This survey specifically focuses on algorithm optimization and framework acceleration for large-scale GNN models.By examining related works in these areas,this survey aims to help readers understand the existing research as well as lay the foundation for co-optimizing GNN algorithms and frameworks for large-scale data.This survey is structured as follows.Firstly,we provide an overview of the challenges faced by GNNs in large-scale applications and the major optimization methods used to deal with these challenges.In addition,we compare our survey with existing surveys on GNNs.The major difference is that our survey focuses specifically on GNN models in large-scale applications.We summarize and analyze related works on GNN algorithms and framework optimization with a focus on scalability.In the second section,we provide a brief overview of the message passing mechanism and classify GNN models into four categories:Graph Convolutional Networks,Graph Attention Networks,Graph Recurrent Neural Networks,and Graph Autoencoder.For each category,we introduce the major network design,including propagation and aggregation strategies,and analyze the corresponding challenges of processing large-scale data.Furthermore,we provide a summary of the challenges faced by GNN models in large-scale applications,in terms of full-batch and mini-batch training modes.Thirdly,we classify and analyze GNN algorithms for large-scale data.We focus on sampling-based GNNs at different granularities,which use node-,layer-,and subgraph-based sampling strategies to optimize the mini-batch training of GNNs.Specifically,node-based sampling strategies usually select a fixed number of neighbors for each node,layer-based sampling methods operate at each GNN layer,and subgraph-based sampling approaches attempt to find dense subgraphs as mini batches.We provide a summary of each type of sampling strategy,including its key ideas,related works,and a discussion of its advantages and disadvantages.In the fourth section of this survey,we introduce mainstream programming frameworks for GNN models and related optimization techniques for framework acceleration.We briefly introduce mainstream programming frameworks one by one,such as DGL,PyG,Graph-Learn,and also summarize their characteristics.We divide these optimization strategies into five categories:data partition,task scheduling,parallel execution,memory management,and other methods.Finally,we summarize this survey.We also provide prospects for future work in optimizing GNN models and accelerating frameworks for large-scale data,such as reducing redundant computation,algorithm and framework co-optimization,graph-aware optimizations,support for complex graphs,flexible scheduling based on hardware features,optimizations on distributed platforms,framework and hardware co-optimization and minimizing node representation dimensions.

作者肖国庆李雪琪陈玥丹唐卓姜文君李肯立 XIAO Guo-Qing;LI Xue-Qi;CHEN Yue-Dan;TANG Zhuo;JIANG Wen-Jun;LI Ken-Li(College of Computer Science and Electronic Engineering,Hunan University,Changsha 410082;Shenzhen Research Institute,Hunan University,Shenzhen,Guangdong 518000)

机构地区湖南大学信息科学与工程学院湖南大学深圳研究院

出处《计算机学报》 EI CAS CSCD 北大核心 2024年第1期148-171,共24页 Chinese Journal of Computers

基金广东省重点领域研发计划(2021B0101190004) 国家自然科学基金(62172157,62202149) 湖南省科技项目(2023GK2002、2021RC3062) 广东省自然科学基金(2023A1515012915) 深圳市基础研究面上项目(JCYJ20210324135409026) 之江实验室开放课题(2022RC0AB03)资助。

关键词图神经网络大规模数据算法优化框架加速 graph neural network large-scale data algorithm optimization framework acceleration

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1赵港,王千阁,姚烽,张岩峰,于戈.大规模图神经网络系统综述[J].软件学报,2022,33(1):150-170. 被引量：10
2徐冰冰,岑科廷,黄俊杰,沈华伟,程学旗.图卷积神经网络综述[J].计算机学报,2020,43(5):755-780. 被引量：240
3马帅,刘建伟,左信.图神经网络综述[J].计算机研究与发展,2022,59(1):47-80. 被引量：50
4吴越,王英,王鑫,徐正祥,李丽娜.基于超图卷积的异质网络半监督节点分类[J].计算机学报,2021,44(11):2248-2260. 被引量：12
5张伟,李扬,张吉,王建勇.融合时空行为与社交关系的用户轨迹识别模型[J].计算机学报,2021,44(11):2173-2188. 被引量：4
6李涵,严明玉,吕征阳,李文明,叶笑春,范东睿,唐志敏.图神经网络加速结构综述[J].计算机研究与发展,2021,58(6):1204-1229. 被引量：6

二级参考文献7

1毛嘉莉,金澈清,章志刚,周傲英.轨迹大数据异常检测:研究进展及系统框架[J].软件学报,2017,28(1):17-34. 被引量：58
2周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1651
3齐金山,梁循,李志宇,陈燕方,许媛.大规模复杂信息网络表示学习:概念、方法与挑战[J].计算机学报,2018,41(10):2394-2420. 被引量：41
4Chuang-Yi Gui,Long Zheng,Bingsheng He,Cheng Liu,Xin-Yu Chen,Xiao-Fei Liao,Hai Jin.A Survey on Graph Processing Accelerators:Challenges and Opportunities[J].Journal of Computer Science & Technology,2019,34(2):339-371. 被引量：13
5徐冰冰,岑科廷,黄俊杰,沈华伟,程学旗.图卷积神经网络综述[J].计算机学报,2020,43(5):755-780. 被引量：240
6秦涛,沈壮,刘欢,陈周国.基于排序学习的网络舆情演化趋势评估方法研究[J].计算机研究与发展,2020,57(12):2490-2500. 被引量：10
7严明玉,李涵,邓磊,胡杏,叶笑春,张志敏,范东睿,谢源.图计算加速架构综述[J].计算机研究与发展,2021,58(4):862-887. 被引量：5

共引文献301

1杨鑫,李星甫,唐雁冰,戴隽成,戚涛,李闽,刘旭.孔隙—溶孔型碳酸盐岩气驱水动态网络模拟[J].天然气地球科学,2023,34(6):973-979. 被引量：1
2张格,林岚,吴水才.脑群体图中图卷积神经网络应用研究综述[J].生命科学仪器,2021,19(4):23-30. 被引量：2
3朱威,马小明,张纲,周忠志,薛原,邓艾东.基于GraphSage和自注意力机制的滚动轴承半监督故障诊断方法[J].信息化研究,2023,49(4):48-54.
4应嘉顺,张金艺,陈琪.融合时空特征的浓雾短临趋势预测算法[J].电子测量技术,2023,46(19):87-95.
5唐闽,高彦杰,汪长虹.基于图注意力网络的输电线路故障诊断[J].电子测量技术,2023,46(18):92-99.
6邓宇平,王桂棠.基于GoogleNet网络与残差网络的织物纹理分析[J].电子测量技术,2021,44(7):31-38. 被引量：3
7曾瑞,张海翔,马汉杰,蒋明峰,冯杰.基于图卷积的手势骨架生成[J].智能计算机与应用,2021,11(10):33-37.
8马超,熊顺,蒋丹妮.图卷积神经网络在道路网选取中的应用[J].测绘科学,2022,47(12):200-205.
9方健,张光达,张拥军,王璐,温家辉,王会权.图表示学习短视频智能推荐研究综述[J].智能安全,2023,2(1):1-12.
10刘秋生.清香型新型白酒的勾调技术[J].酿酒科技,2000(3):44-45.

同被引文献20

1钟桦,杨晓鸣,焦李成.基于多分辨共生矩阵的纹理图像分类[J].计算机研究与发展,2011,48(11):1991-1999. 被引量：19
2吴宏杰,吕强,吴进珍,黄旭,罗小虎,钱培德.从头预测蛋白质骨架的一种并行蚁群方法及其在CASP8/9中的应用[J].中国科学：信息科学,2012,42(8):1034-1048. 被引量：7
3王振华,胡伏原,吕凡,夏振平.一种自适应增强图像纹理的边缘检测方法[J].苏州科技大学学报（自然科学版）,2018,35(2):68-72. 被引量：7
4胡伏原,李林燕,尚欣茹,沈军宇,戴永良.基于卷积神经网络的目标检测算法综述[J].苏州科技大学学报（自然科学版）,2020,37(2):1-10. 被引量：20
5李娜,顾庆,姜枫,郝慧珍,于华,倪超.一种基于卷积神经网络的砂岩显微图像特征表示方法[J].软件学报,2020,31(11):3621-3639. 被引量：9
6沈军,廖鑫,秦拯,刘绪崇.基于卷积神经网络的低嵌入率空域隐写分析[J].软件学报,2021,32(9):2901-2915. 被引量：11
7李自拓,孙建彬,杨克巍,熊德辉.面向图像分类的对抗鲁棒性评估综述[J].计算机研究与发展,2022,59(10):2164-2189. 被引量：4
8邹长宽,田小平,张晓燕,张雨晴,杜磊.基于GraphSage节点度重要性聚合的网络节点分类研究[J].科学技术与工程,2022,22(32):14306-14312. 被引量：3
9杨朋波,桑基韬,张彪,冯耀功,于剑.面向图像分类的深度模型可解释性研究综述[J].软件学报,2023,34(1):230-254. 被引量：14
10李晓旭,刘忠源,武继杰,曹洁,马占宇.小样本图像分类的注意力全关系网络[J].计算机学报,2023,46(2):371-384. 被引量：4

引证文献2

1钱华,祁枢杰,顾涔,陶然,吴宏杰.基于近邻卷积神经网络的油画分类方法研究[J].苏州科技大学学报（自然科学版）,2024,41(1):69-75.
2王鑫隆,胡睿,郭亚梁,杜航原,张槟淇,王文剑.面向节点分类任务的节点级自适应图卷积神经网络[J].模式识别与人工智能,2024,37(4):287-298.

1张忠贵,董鑫,李成峰,程志远,王玉岚.考虑时空相关的交通事故热点道路识别方法[J].计算机应用与软件,2023,40(10):58-63.
2李丽,李平.基于交互图神经网络的方面级多模态情感分析[J].计算机应用研究,2023,40(12):3683-3689. 被引量：1
3康哲龙.冶金工程领域的新技术应用及影响研究[J].冶金管理,2023(19):37-39.
4郭鑫涛,杨亚琴,蔺温杰,郑建民,张博宇,张幸悦,苗芳,刘斌.难熔金属材料增材制造工艺研究进展[J].铜业工程,2023(6):1-12. 被引量：2
5毛成烈,高小玉,南海燕.二维TMC忆阻器在神经形态计算中的研究进展[J].半导体技术,2024,49(2):109-122.
6范埃米,张翠平,卢媛媛,柳刚,胡福良.蜂胶中的黄酮类化合物[J].福建农林大学学报（自然科学版）,2024,53(1):123-128.
7何家乐,董敏.S-腺苷-L-甲硫氨酸依赖的3-氨基-3-羧基丙基利用酶研究进展[J].生物技术通报,2023,39(12):56-70.
8朱明海.能源互联网背景下电力储能技术分析[J].电力设备管理,2023(23):213-215.
9刘庆龙,李鹏飞,邰骁,刘海涛,杨金广,张少杰,王晓放.网格变形技术及其在能源装备数值仿真中的应用[J].燃气轮机技术,2023,36(4):1-10.
10李桐.当代建筑工程中的智能建造技术及其应用研究[J].智慧中国,2023(12):24-25.

计算机学报

2024年第1期

浏览历史

内容加载中请稍等...

大规模图神经网络研究综述被引量：2

参考文献6

二级参考文献7

共引文献301

同被引文献20

引证文献2

相关作者

相关机构

相关主题

浏览历史

大规模图神经网络研究综述 被引量：2

参考文献6

二级参考文献7

共引文献301

同被引文献20

引证文献2

相关作者

相关机构

相关主题

浏览历史

大规模图神经网络研究综述被引量：2