基于优化图结构自编码器的网络表示学习

Network representation learning based on autoencoder with optimized graph structure

下载PDF

导出

摘要网络表示学习(NRL)旨在学习网络顶点的潜在、低维表示,再将得到的表示用于下游的网络分析任务。针对现有采用自编码器的NRL算法不能充分提取节点属性信息,学习时容易产生信息偏差从而影响学习效果的问题,提出一种基于优化图结构自编码器的网络表示学习模型(NR-AGS),通过优化图结构的方式提高准确率。首先,融合结构和属性信息来生成结构和属性联合转移矩阵,进而形成高维表示;其次,利用自编码器学习低维嵌入表示;最后,通过在学习过程中加入深度嵌入聚类算法,对自编码器的训练过程和节点的类别分布划分形成自监督机制,并且通过改进的最大均值差异(MMD)算法减小学习得到的低维嵌入潜在表示层分布和原始数据分布的差距。此外,NR-AGS使用自编码器的重构损失、深度嵌入聚类损失和改进的MMD损失共同优化网络。应用NR-AGS对3个真实数据集进行学习,再使用得到的低维表示完成下游的节点分类和节点聚类任务。实验结果表明,与深度图表示模型DNGR(Deep Neural networks for Graph Representations)相比,NR-AGS在Cora、Citeseer、Wiki数据集上的Micro-F1值分别至少提升了7.2、13.5和8.2个百分点。可见,NR-AGS可以有效提升NRL的学习效果。 The aim of Network Representation Learning(NRL)is to learn the potential and low-dimensional representation of network vertices,and the obtained representation is applied for downstream network analysis tasks.The existing NRL algorithms using autoencoder extract information about node attributes insufficiently and are easy to generate information bias,which affects the learning effect.Aiming at these problems,a Network Representation learning model based on Autoencoder with optimized Graph Structure(NR-AGS)was proposed to improve the accuracy by optimizing the graph structure.Firstly,the structure and attribute information were fused to generate the joint transition matrix,thereby forming the high-dimensional representation.Secondly,the low-dimensional embedded representation was learnt by an autoencoder.Finally,the deep embedded clustering algorithm was introduced during learning to form a self-supervision mechanism in the processes of autoencoder training and the category distribution division of nodes.At the same time,the improved Maximum Mean Discrepancy(MMD)algorithm was used to reduce the gap between distribution of the learnt lowdimensional embedded representation and distribution of the original data.Besides,in the proposed model,the reconstruction loss of the autoencoder,the deep embedded clustering loss and the improved MMD loss were used to optimize the network jointly.NR-AGS was applied to the learning of three real datasets,and the obtained low-dimensional representation was used for downstream tasks such as node classification and node clustering.Experimental results show that compared with the deep graph representation model DNGR(Deep Neural networks for Graph Representations),NR-AGS improves the Micro-F1 score by 7.2,13.5 and 8.2 percentage points at least and respectively on Cora,Citeseer and Wiki datasets.It can be seen that NR-AGS can improve the learning effect of NRL effectively.

作者富坤郝玉涵孙明磊刘赢华 FU Kun;HAO Yuhan;SUN Minglei;LIU Yinghua(School of Artificial Intelligence,Hebei University of Technology,Tianjin 300401,China)

机构地区河北工业大学人工智能与数据科学学院

出处《计算机应用》 CSCD 北大核心 2023年第10期3054-3061,共8页 journal of Computer Applications

基金国家自然科学基金资助项目(62072154)。

关键词网络表示学习属性信息自编码器深度嵌入聚类最大均值差异 Network Representation Learning(NRL) attribute information autoencoder deep embedded clustering Maximum Mean Discrepancy(MMD)

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1孙金清,周慧,赵中英.网络表示学习方法研究综述[J].山东科技大学学报（自然科学版）,2021,40(1):117-128. 被引量：4
2刘昱阳,李龙杰,单娜,陈晓云.融合聚集系数的链接预测方法[J].计算机应用,2020,40(1):28-35. 被引量：4
3尤坊州,白亮.关键节点选择的快速图聚类算法[J].计算机科学与探索,2021,15(10):1930-1937. 被引量：3
4张蕾,钱峰,赵姝,陈洁,张燕平.利用变分自编码器进行网络表示学习[J].计算机科学与探索,2019,13(10):1733-1744. 被引量：4

二级参考文献7

1涂存超,杨成,刘知远,孙茂松.网络表示学习综述[J].中国科学：信息科学,2017,47(8):980-996. 被引量：101
2陈维政,张岩,李晓明.网络表示学习[J].大数据,2015,1(3):8-22. 被引量：16
3邰滢滢,庞影,段苛苛,付云鹏.基于改进权重的D-S证据理论的动态负载平衡算法[J].计算机应用,2018,38(10):2976-2981. 被引量：4
4袁非牛,章琳,史劲亭,夏雪,李钢.自编码神经网络理论及应用综述[J].计算机学报,2019,42(1):203-230. 被引量：146
5丁超,赵海,司帅宗,朱剑.正常衰老的人脑功能网络演化模型[J].计算机应用,2019,39(4):963-971. 被引量：1
6周慧,赵中英,李超.面向异质信息网络的表示学习方法研究综述[J].计算机科学与探索,2019,13(7):1081-1093. 被引量：19
7Wenjing Luan,Guanjun Liu,Changjun Jiang,Liang Qi.Partition-based Collaborative Tensor Factorization for POI Recommendation[J].IEEE/CAA Journal of Automatica Sinica,2017,4(3):437-446. 被引量：5

共引文献10

1陈港,孟相如,康巧燕,翟东.基于最小生成树的vSDN故障快速恢复算法[J].计算机科学,2022,49(S02):861-867. 被引量：1
2杨杰,唐亚纯,谭道军,刘小兵.多通道自编码器深度学习的入侵检测方法[J].计算机科学与探索,2020,14(12):2050-2060. 被引量：6
3梁庆伟,马健,林泽东.基于社交网络分析的学生异常轨迹检测方法研究[J].信息与电脑,2021,33(10):30-33.
4李鹏辉,翟正利,冯舒.图对抗防御研究进展[J].计算机科学与探索,2021,15(12):2292-2303. 被引量：2
5陈滔,张庆国,何金波,周文竹.基于多算法融合的文本抄袭检测的特征提取算法研究[J].湖北民族大学学报（自然科学版）,2022,40(1):67-72. 被引量：2
6杜航原,郝思聪,王文剑.结合图自编码器与聚类的半监督表示学习方法[J].计算机应用,2022,42(9):2643-2651. 被引量：1
7韩津津,李智杰,李昌华,张颉.基于改进图注意机制的网络嵌入方法研究及应用[J].计算机测量与控制,2022,30(9):207-212.
8袁立宁,刘钊.基于One-Shot聚合自编码器的图表示学习[J].计算机应用,2023,43(1):8-14. 被引量：2
9闫晨,杨有龙,刘原园.基于聚类质量的两阶段集成算法[J].吉林大学学报（理学版）,2023,61(4):899-908. 被引量：1
10王可可,朱宇,王晓英,黄建强,曹腾飞.超边约束的异质超网络表示学习方法[J].计算机应用,2023,43(12):3654-3661.

1许铭洋,王华朋,闫道申,杨海涛,楚宪腾.基于深度嵌入向量的说话人分割研究[J].刑事技术,2023,48(5):466-472.
2余柏成,张红毅.县级融媒体深度嵌入基层社会治理新路径[J].新闻战线,2023(18):77-79. 被引量：1
3苏明,周立林,宗培新,杜苏豪,张琳.煤矿机械设备项目全流程数字化管控系统设计及应用[J].项目管理技术,2023,21(7):154-158. 被引量：2
4陈媛,陈红.融合底层信息的电气工程领域神经机器翻译[J].河南科技大学学报（自然科学版）,2023,44(6):42-48. 被引量：1
5张梅芳.ChatGPT的媒介逻辑与学术生产:类人性与学术对话[J].编辑学刊,2023(4):58-62. 被引量：4
6况安轩.融媒语境下的时政新闻报道创新[J].新闻世界,2023(10):69-71. 被引量：3
7金卫卫.数字技术引领下新闻传播发展现状及展望分析[J].中国报业,2023(17):100-101.
8牛宁,刘挺,宋珏.防范小官贪腐勿忘重要岗位军士[J].政工导刊,2023(9):43-44.
9郭小弦,申欣悦,李晓光.共享数字时代的福祉:互联网使用与老年人生活满意度[J].宁夏社会科学,2023(5):156-165. 被引量：6
10佟家栋,鞠欣.经济全球化发展新趋势与中国应对[J].开放导报,2023(5):39-45. 被引量：1

计算机应用

2023年第10期

浏览历史

内容加载中请稍等...

基于优化图结构自编码器的网络表示学习

参考文献4

二级参考文献7

共引文献10

相关作者

相关机构

相关主题

浏览历史