基于图划分抽样算法的图表示学习被引量：2

Graph representation learning based on graph partition sampling algorithm

下载PDF

导出

摘要在基于神经网络的图表示算法中,当节点属性维度过高、图的规模过大时,从内存到显存的数据传输会成为训练性能的瓶颈。针对这类问题,该方法将图划分算法应用于图表示学习中,降低了内存访问的I/O开销。该方法根据图节点的度数,将图划分成若干个块,使用显存缓存池存储若干个特征矩阵块。每一轮训练,使用缓存池中的特征矩阵块,以此来减少内存到显存的数据拷贝。针对这一思想,该方法使用基于图划分的抽样算法,设计显存的缓存池来降低内存的访问,运用多级负采样算法,降低训练中负样本采样的时间复杂度。在多个数据集上,与现有方法对比发现,该方法的下游机器学习准确率与原算法基本一致,训练效率可以提高2~7倍。实验结果表明,基于图划分的图表示学习能高效训练模型,同时保证节点表示向量的测试效果。今后的课题可以使用严谨的理论证明,阐明图划分模型与原模型的理论误差。 When training graph embedding via neural network,high dimension feature vector and large scale graph cause data transferring from memory to GPU to be a bottleneck. Aimed to solve this problem,this paper proposed graph partition based graph representation learning. This method splitted graph nodes into blocks according to their degree. It stored several node feature matrices in buffer pool on GPU. Every epoch,it trained representation during several blocks which fitted into buffer pool to reduce the data transferred from memory to GPU. Based on block split,this method used blocked based sampling algorithm,cached block feature matrix in GPU buffer pool to reduce memory read and built hierarchical negative sampling table,which could sample nodes in const time complex. Compared to related work on several real world datasets,this method achieves competitive accuracy at downstream machine learning task and 2 ~ 7 times speedup on training process. The experiments show that graph representation learning based on partition can train model efficiently and generate accurate embedding vectors. In future work,it is worth to prove the deviation between partition based method and original method in theory.

作者夏鑫高品陈康姜进磊 Xia Xin;Gao Pin;Chen Kang;Jiang Jinlei(Dept.of Computer Science&Technology,Tsinghua University,Beijing 100084,China;WeChat Group,Tencent Corporation,Shenzhen Guangdong 518057,China)

机构地区清华大学计算机科学与技术系腾讯微信事业群

出处《计算机应用研究》 CSCD 北大核心 2020年第9期2586-2590,2599,共6页 Application Research of Computers

基金国家重点研发计划资助项目(2018YFB1003505)。

关键词图划分图表示学习图抽样图神经网络 graph partition graph representation learning graph sampling graph neural network

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献14

1王军,许永明,王东辉,郭文波.基于多支点骨骼模型的实时行为识别方法[J].华中科技大学学报（自然科学版）,2013,41(S1):144-148. 被引量：4
2刘颖超,张纪元.梯度下降法[J].华东工学院学报,1993(2):12-16. 被引量：43
3张杰.乙型肝炎“大三阳”“小三阳”演变看明白[J].肝博士,2006(3):43-44. 被引量：2
4陈远方,张熳,王小莉,戎毅,彭海燕,管芳.ARIMA模型和BP神经网络模型在我国乙型肝炎发病预测中的应用[J].江苏预防医学,2015,26(3):23-26. 被引量：22
5肖庆新,张菁,张辉,李晓光,卓力.基于轻型卷积神经网络的舌苔颜色分类方法[J].测控技术,2019,38(3):26-31. 被引量：17
6叶永安.中西医结合治疗慢性乙型肝炎的机遇与挑战[J].中西医结合肝病杂志,2019,29(3):197-200. 被引量：19
7江益靓,张旭龙,邓晋,张文强,李伟.数据增强基础上使用卷积神经网络进行闻诊（英文）[J].复旦学报（自然科学版）,2019,58(3):328-334. 被引量：8
8何菊,戴彩艳,胡晨骏,杨涛,胡孔法.基于属性相似度的中药加权网络构建及社团划分方法[J].世界科学技术-中医药现代化,2019,21(12):2746-2752. 被引量：6
9张静,柴变芳,张璞,李文斌.保持聚类结构的属性网络表示学习[J].计算机应用研究,2020,37(6):1647-1651. 被引量：1
10邵志宏,石璟,姚添,冯丹,董爽,石珊,冯永亮,Zhang Yawei,王素萍.美沙酮维持治疗门诊患者特征和HBsAg阳性影响因素的贝叶斯网络模型分析[J].中华流行病学杂志,2020,41(3):331-336. 被引量：4

引证文献2

1曹毅,刘晨,黄子龙,盛永健.时空自适应图卷积神经网络的骨架行为识别[J].华中科技大学学报（自然科学版）,2020,48(11):5-10. 被引量：7
2陈燕,龚庆悦,李铁军,王红云,鲍剑洋,胡孔法.基于DAM_XGCN的疾病辅助诊断模型[J].软件导刊,2021,20(8):70-74.

二级引证文献7

1张家想,刘如浩,金辰曦,卢先领.结合时空注意力机制和自适应图卷积网络的骨架行为识别[J].信号处理,2021,37(7):1226-1234. 被引量：2
2刘颉,杨超颖,周凯波.基于图数据深度挖掘的旋转机械故障诊断[J].华中科技大学学报（自然科学版）,2021,49(9):1-5. 被引量：7
3孙峰,杨观赐,Ajith Kumar V,张安思.基于自我监督学习策略的层智能图卷积网络[J].计算机应用研究,2022,39(1):128-133.
4李颀,邓耀辉,王娇.基于轻量级图卷积网络的校园暴力行为识别[J].液晶与显示,2022,37(4):530-538. 被引量：2
5高治军,顾巧瑜,陈平,韩忠华.基于CNN-LSTM双流融合网络的危险行为识别[J].数据采集与处理,2023,38(1):132-140. 被引量：5
6王蕊,史玉龙,孙辉,张友民.基于轻量化的高分辨率鸟群识别深度学习网络[J].华中科技大学学报（自然科学版）,2023,51(5):81-87. 被引量：4
7朱红蕾,卫鹏娟,徐志刚.基于骨架的人体异常行为识别与检测研究进展[J].控制与决策,2024,39(8):2484-2501.

1苏警.基于采样的深度神经网络测试方法研究[J].佳木斯大学学报（自然科学版）,2020,38(5):65-68.
2贾晓娟.思维导图在小学英语课堂教学中的应用[J].中学生作文指导,2019(38):0126-0126.
3吕何,孔政敏,张成刚.基于混合优化随机森林回归的短期电力负荷预测[J].武汉大学学报（工学版）,2020,53(8):704-711. 被引量：19
4蒋林稼,张琳,孙业远.飞力士棒在力量练习中的运用[J].体育教学,2020,40(9):85-85.
5邢丹,姚俊明.基于势科学的“课程思政”理论探索和教学实践[J].现代计算机,2020,26(27):72-76. 被引量：1
6韩凯峰,胡昌军,刘铁志.大规模移动边缘计算网络:空间建模及计算吞吐量优化[J].中兴通讯技术,2020,26(4):6-12.

计算机应用研究

2020年第9期

浏览历史

内容加载中请稍等...

基于图划分抽样算法的图表示学习被引量：2

同被引文献14

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于图划分抽样算法的图表示学习 被引量：2

同被引文献14

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于图划分抽样算法的图表示学习被引量：2