基于节点−属性二部图的网络表示学习模型

Network representation learning model based on node attribute bipartite graph

下载PDF

导出

摘要在图结构数据上开展推理计算是一项重大的任务,该任务的主要挑战是如何表示图结构知识使机器可以快速理解并利用图数据。对比现有表示学习模型发现,基于随机游走方法的表示学习模型容易忽略属性对节点关联关系的特殊作用,因此提出一种基于节点邻接关系与属性关联关系的混合随机游走方法。首先通过邻接节点间的共同属性分布计算属性权重,并获取节点到每个属性的采样概率;然后分别从邻接节点与含有共有属性的非邻接节点中提取网络信息;最后构建基于节点−属性二部图的网络表示学习模型,并通过上述采样序列学习得到节点向量表达。在Flickr、BlogCatalog、Cora公开数据集上,用所提模型得到的节点向量表达进行节点分类的Micro-F1平均准确率为89.38%,比GraphRNA(Graph Recurrent Networks with Attributed random walks)高出了2.02个百分点,比经典工作DeepWalk高出了21.12个百分点;同时,对比不同随机游走方法发现,提高对节点关联有促进作用的属性的采样概率可以增加采样序列所含信息。 It is an important task to carry out reasoning and calculation on graph structure data.The main challenge of this task is how to represent graph-structured knowledge so that machines can easily understand and use graph structure data.After comparing the existing representation learning models,it is found that the models based on random walk methods are likely to ignore the special effect of attributes on the association between nodes.Therefore,a hybrid random walk method based on node adjacency and attribute association was proposed.Firstly the attribute weights were calculated through the common attribute distribution among adjacent nodes,and the sampling probability from the node to each attribute was obtained.Then,the network information was extracted from adjacent nodes and non-adjacent nodes with common attributes respectively.Finally,the network representation learning model based on node attribute bipartite graph was constructed,and the node vector representations were obtained through the above sampling sequence learning.Experimental results on Flickr,BlogCatalog and Cora public datasets show that the Micro-F1 average accuracy of node classification by the node vector representations obtained by the proposed model is 89.38%,which is 2.02 percentage points higher than that of GraphRNA(Graph Recurrent Networks with Attributed random walk)and 21.12 percentage points higher than that of classical work DeepWalk.At the same time,by comparing different random walk methods,it is found that increasing the sampling probabilities of attributes that promote node association can improve the information contained in the sampling sequence.

作者周乐代婷婷李淳谢军楚博策李峰张君毅刘峤 ZHOU Le;DAI Tingting;LI Chun;XIE Jun;CHU Boce;LI Feng;ZHANG Junyi;LIU Qiao(School of Information and Software Engineering,University of Electronic Science and Technology of China,Chengdu Sichuan 610054,China;Hebei Key Laboratory of Electromagnetic Spectrum Cognition and Control,Shijiazhuang Hebei 050081,China;Key Laboratory of Aerospace Information Applications,China Electronics Technology Group Corporation,Shijiazhuang Hebei 050081,China)

机构地区电子科技大学信息与软件工程学院河北省电磁频谱认知与管控重点实验室中国电子科技集团公司航天信息应用技术重点实验室

出处《计算机应用》 CSCD 北大核心 2022年第8期2311-2318,共8页 journal of Computer Applications

基金国家自然科学基金资助项目(U19B2028,61772117) 中国电子科技集团公司第五十四研究所开放课题(191055,201148,190900,200662) 中央高校基本科研业务费专项基金资助项目(ZYGX2019J077)。

关键词网络嵌入表示学习随机游走网络采样属性网络节点分类 network embedding representation learning random walk network sampling attributed network node classification

分类号 TP391 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1杨晓慧,万睿,张海滨,曾义夫,刘峤.基于符号语义映射的知识图谱表示学习算法[J].计算机研究与发展,2018,55(8):1773-1784. 被引量：15
2方阳,赵翔,谭真,杨世宇,肖卫东.一种改进的基于翻译的知识图谱表示方法[J].计算机研究与发展,2018,55(1):139-150. 被引量：51
3冶忠林,赵海兴,张科,朱宇,肖玉芝.基于邻节点和关系模型优化的网络表示学习[J].计算机研究与发展,2019,56(12):2562-2577. 被引量：14

二级参考文献4

1于戈,谷峪,鲍玉斌,王志刚.云计算环境下的大规模图数据处理技术[J].计算机学报,2011,34(10):1753-1767. 被引量：98
2刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：261
3刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600. 被引量：971
4刘峤,韩明皓,杨晓慧,刘瑶,吴祖峰.基于表示学习和语义要素感知的关系推理算法[J].计算机研究与发展,2017,54(8):1682-1692. 被引量：12

共引文献73

1赵晓函,周子力,李天宇,陈丹华,王凯莉.一种基于IC参数的知识图谱嵌入方法[J].中文信息学报,2021,35(10):48-55.
2詹威威,程序,蔡惠民,刘汪洋,王彬,余正涛.基于综合影响力模型的改进EvolveKG方法及应用研究[J].计算机应用研究,2020,37(S01):159-162.
3王永康,艾山·吾买尔,顾亚东,何江涛.TransREF:一种改进的基于邻域信息的知识表示模型[J].电子测量技术,2023,46(21):7-15.
4侯梦薇,卫荣,陆亮,兰欣,蔡宏伟.知识图谱研究综述及其在医疗领域的应用[J].计算机研究与发展,2018,55(12):2587-2599. 被引量：128
5孙骁骁.新形势下图书馆知识服务机制研究[J].内蒙古科技与经济,2019(5):141-142.
6熊香权,李逸凡,邓蔚,张清华.深度学习中的知识表示与应用综述[J].数码设计,2019,8(9):1-4.
7胡欢,云红艳,贺英,张秀华.半自动构建扶贫领域知识图谱工具的研究[J].计算机与数字工程,2019,47(8):1961-1965. 被引量：4
8朱艳丽,杨小平,王良,张志宇.TransRD：一种不对等特征的知识图谱嵌入表示模型[J].中文信息学报,2019,33(11):73-82. 被引量：9
9安莹,王志娜,陈先来,刘莉,李忠民,罗熹.带权疾病网络上的潜在共病关系预测[J].湖南大学学报（自然科学版）,2019,46(12):33-40. 被引量：4
10孙郑煜,鄂海红,宋美娜,王宁.基于大数据技术的医学知识图谱构建方法[J].软件,2020,41(1):13-17. 被引量：18

1薛佳瑶,陈海勇,周刚.基于卷积循环神经网络的城市区域车流量预测模型[J].信息工程大学学报,2019,20(2):236-241. 被引量：4
2赵婷,金晅宏,侯雨,王源.基于机器视觉的盲孔直径测量[J].软件工程与应用,2021,10(6):757-771.
3曹旭,殷铭,漆翔宇.融合属性熵权和拓扑的局部社区发现算法[J].西南民族大学学报（自然科学版）,2022,48(4):448-453. 被引量：1
4祝毅鸣.群智感知环境下基于节点分类的数据隐私保护增强机制研究[J].长江信息通信,2022,35(7):47-49.
5薛金林,李雨晴,曹梓建.基于深度学习的模糊农田图像中障碍物检测技术[J].农业机械学报,2022,53(3):234-242. 被引量：10
6董天遣.有效运用计算教学中的“错误资源”促进小学生高阶思维的培养[J].好日子,2022(25):100-102.
7任嘉睿,张海燕,朱梦涵,马波.基于元图卷积的异质网络嵌入学习算法[J].计算机研究与发展,2022,59(8):1683-1693. 被引量：4
8Lorenzo Zaninetti.Transport in Astrophysics: I. Diffusion of Solar and Galactic Cosmic Rays[J].International Journal of Astronomy and Astrophysics,2022,12(1):30-52.
9Mark Kempton.Non-Backtracking Random Walks and a Weighted Ihara’s Theorem[J].Open Journal of Discrete Mathematics,2016,6(4):207-226.
10潘玲玲,刘俊,夏旻.基于多尺度深度残差网络的时间序列异常数据检测与修正[J].计算机应用与软件,2022,39(7):38-43. 被引量：7

计算机应用

2022年第8期

浏览历史

内容加载中请稍等...

基于节点−属性二部图的网络表示学习模型

参考文献3

二级参考文献4

共引文献73

相关作者

相关机构

相关主题

浏览历史