基于变分推断和元路径分解的异质网络表示方法

A Heterogeneous Network Representation Method Based on Variational Inference and Meta-Path Decomposition

下载PDF

导出

摘要针对异质网络表示中传统元路径随机游走无法准确描述异质网络结构,不能较好地捕捉网络节点内在的真实分布问题,提出基于变分推断和元路径分解的异质网络表示方法HetVAE.该方法先结合路径相似度的思想,设计了一种节点选择策略对元路径随机游走进行改进,再通过引入变分理论对原始分布中的潜在变量进行有效采样.最后,通过设计个性化的注意力机制,对由分解获得的不同子网络的节点向量表示进行加权,再将其进行融合,使最终的节点向量表示具有更丰富的语义信息.通过在DBLP、AMiner、Yelp这3个真实数据集上进行多组不同网络任务的实验,验证了模型的有效性.在节点分类和节点聚类任务上,与对比算法相比,微观F 1值和标准化互信息分别提升了1.12%~4.36%和1.35%~18%,表明HetVAE能够有效地表征异质网络结构,学习出更符合真实分布的节点向量表示. Aimed at the problem that the traditional meta-path random walk in heterogeneous network representation cannot accurately describe the heterogeneous network structure and cannot capture the true distribution of network nodes well,a heterogeneous network representation method based on variational inference and meta-path decomposition is proposed,which is named HetVAE.First,combining with the idea of path similarity,a node selection strategy is designed to improve the random walk of the meta-path.Next,the variational theory is introduced to effectively sample the latent variables in the original distribution.After that,a personalized attention machanism is implemented,which weights the node vector representation of different sub-networks obtained by decomposition.Then,these node vectors are fused by the proposed model,so that the final node vector representation can have richer semantic information.Finally,several experiments on different network tasks are performed on the three real data sets of DBLP,AMiner,and Yelp.The effectiveness of the model is verified by these results.In node classification and node clustering tasks,compared with some state-of-the-art algorithms,the Micro-F 1 and normalized mutual information(NMI)increase by 1.12%to 4.36%and 1.35%to 18%respectively.It is proved that HetVAE can effectively capture the heterogeneous network structure and learn the node vetcor representation that conforms more with the true distribution.

作者袁铭刘群孙海超谭洪胜 YUAN Ming;LIU Qun;SUN Haichao;TAN Hongsheng(College of Computer Science and Technology,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

机构地区重庆邮电大学计算机科学与技术学院

出处《上海交通大学学报》 EI CAS CSCD 北大核心 2021年第5期586-597,共12页 Journal of Shanghai Jiaotong University

基金国家自然科学基金重点项目(61936001) 国家自然科学基金(61772096) 国家重点研发计划(2016QY01W0200)。

关键词异质网络网络表示变分自编码器随机游走注意力机制 heterogeneous network network representation variational autoencoder random walk attention mechanism

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1涂存超,杨成,刘知远,孙茂松.网络表示学习综述[J].中国科学：信息科学,2017,47(8):980-996. 被引量：102

共引文献101

1余传明,钟韵辞,林奥琛,安璐.基于网络表示学习的作者重名消歧研究[J].数据分析与知识发现,2020,4(2):48-59. 被引量：10
2刘正铭,马宏,刘树新,杨奕卓,李星.一种融合节点文本属性信息的网络表示学习算法[J].计算机工程,2018,44(11):165-171. 被引量：11
3聂煜,廖祥文,魏晶晶,杨定达,陈国龙.基于深度自动编码器的多标签分类研究[J].广西师范大学学报（自然科学版）,2019,37(1):71-79. 被引量：4
4阮璐,熊赟.基于网络表示学习的miRNA功能相似性研究[J].计算机工程,2019,45(2):154-159. 被引量：2
5赵廷廷,王喆,卢奕南.基于传播概率矩阵的异构信息网络表示学习[J].浙江大学学报（工学版）,2019,53(3):548-554. 被引量：4
6贾中浩,古天龙,宾辰忠,常亮,张伟涛,朱桂明.旅游知识图谱特征学习的景点推荐[J].智能系统学报,2019,14(3):430-437. 被引量：12
7赵卫绩,孙晓霞,刘井莲,佟良.面向不同网络结构和应用任务的网络表示学习研究进展[J].绥化学院学报,2019,39(6):150-153.
8王文涛,吴淋涛,黄烨,朱容波.基于密集连接卷积神经网络的链路预测模型[J].计算机应用,2019,39(6):1632-1638. 被引量：8
9张静,李文斌,张志敏.基于半监督聚类的网络嵌入方法[J].河北工业科技,2019,36(4):246-252.
10钱峰,张蕾,赵姝,陈洁,张燕平,刘峰.基于邻域相似的层次粒化的网络表示学习方法[J].模式识别与人工智能,2019,32(6):504-514. 被引量：1

1钟均灏.微课与高职英语教学结合路径探析[J].教育信息化论坛,2020(11):60-61.
2陈玉琳.小学音乐教学中微课的实施应用[J].读与写（中旬）,2021(5):282-282.
3王丹.传统文化与小学语文的结合路径[J].小学时代,2020(32):63-63.
4徐勇.“本真性”的寻找与坚守——关于韩永明小说集《我们唱歌》[J].长江文艺评论,2021(1):63-67.
5何志成.踏上复苏的阶梯——2015年全球与中国经济展望[J].北大商业评论,2015,0(3):24-29.
6林小靖,林共时.单元整合练读写读写结合提技能--小学语文高年级整单元读写结合训练策略浅谈[J].国家通用语言文字教学与研究,2021(5):76-77.
7张广科,王景圣.初次分配中的劳动报酬占比:演变、困境与突破[J].中州学刊,2021(3):22-28. 被引量：16
8王世威,郝振华,王峰,赵宁,肖福魁,范素兵.合成碳酸丙烯酯搅拌釜内气液多相流模拟[J].石油化工,2021,50(4):300-306.
9陈其扬,石磊,闫祖威.内建电场影响下应变纤锌矿ZnSnN_(2)/In_(x)Ga_(1-x)N柱形量子点太阳能电池的转换效率[J].发光学报,2021,42(4):534-541. 被引量：1
10陈波,宋欣欣,吴镜泊.输电塔线体系力学模型研究进展[J].工程力学,2021,38(5):1-21. 被引量：13

上海交通大学学报

2021年第5期

浏览历史

内容加载中请稍等...

基于变分推断和元路径分解的异质网络表示方法

参考文献1

共引文献101

相关作者

相关机构

相关主题

浏览历史