一种大规模网络中基于节点结构特征映射的链接预测方法被引量：9

A Link Prediction Method for Large-Scale Networks

下载PDF

导出

摘要网络链接预测能够获取网络中丢失链接的重要信息或进行网络的动态演变分析.现有的基于节点相似性的网络链接预测方法往往针对简单的一(多)阶邻居信息或特定类型的小型网络,设计较为复杂的计算方法,其扩展性和大规模网络中的可计算性都受到了严峻的挑战.文中基于深度学习在神经网络语言模型中应用的启发,提出了一个LsNet2Vec(Large-scale Network to Vector)模型.通过结合随机游走的网络数据集序列化方法,进行大规模的无监督机器学习,从而将网络中节点的结构特征信息映射到一个连续的、固定维度的实数向量.然后,使用学习到的节点结构特征向量,就可以迅速计算大规模网络中任意节点之间的相似度,以此来进行网络中的链接预测.通过在16个大规模真实数据集上和目前的多个基准的最优预测算法对比发现,LsNet2Vec模型所得到的预测总体效果是最优的:在保证了大规模网络中链接预测计算可行性的同时,于多个数据集上相对已有方法呈现出较大的AUC值提升,最高达8.9%. The problem of link prediction can be categorized into two classes, namely, missing links prediction and future links prediction. The former is the prediction of unknown links in sampling networks; and the other is the prediction of links that may exist in the future of evolving complex networks. Until now, most of the methods for link prediction are designed based on the assumption of node similarity, which defined by using the essential features of nodes. The similarity evaluation of two nodes making the sparsity and huge size of networks become two of the main challenges remain in link prediction problems. In this work, we present a new model, named LsNet2Vec, for link prediction in large-scale networks according to the unsupervised machine learning. The main idea of our method is embedding the features of nodes in large-scale networks into a lower and fixed dimension of vector in the set of real numbers. We conduct extensive experimental analysis on sixteen famous datasets and present a controlled comparison of the LsNet2Vec model against several strong baselines of link prediction methods, SUC h AUC testing. Result show h as Katz index and random Keywords link neural network ; that our model performs comparably with state-of-the-art methods, walk restart method, in various experiment settings.

作者李志宇梁循周小平张海燕马跃峰

机构地区中国人民大学信息学院计算机系

出处《计算机学报》 EI CSCD 北大核心 2016年第10期1947-1964,共18页 Chinese Journal of Computers

基金国家自然科学基金(71271211 71531012) 北京市自然科学基金(4132067) 中国人民大学科学研究基金(10XNI029) 中国人民大学2015年度拔尖创新人才培育资助计划资助~~

关键词链接预测大规模网络节点特征向量连续性表达神经网络机器学习 link prediction large- scale networks node feature vector distributed representation neural network machine learning

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1刘冶,朱蔚恒,潘炎,印鉴.基于低秩和稀疏矩阵分解的多源融合链接预测算法[J].计算机研究与发展,2015,52(2):423-436. 被引量：14
2吴祖峰,梁棋,刘峤,秦志光.基于AdaBoost的链路预测优化算法[J].通信学报,2014,35(3):116-123. 被引量：16
3黄立威,李德毅,马于涛,郑思仪,张海粟,付鹰.一种基于元路径的异质信息网络链路预测模型[J].计算机学报,2014,37(4):848-858. 被引量：35
4吕琳媛.复杂网络链路预测[J].电子科技大学学报,2010,39(5):651-661. 被引量：243
5李玉华,肖海岭,李栋才,李瑞轩.基于链接重要性的动态链接预测方法研究[J].计算机研究与发展,2011,48(S3):40-46. 被引量：7

二级参考文献144

1GETOOR L,DIEHL C P.Link mining:a survey[J].ACM SIGKDD Explorations Newsletter,2005,7(2):3-12.
2SARUKKAI R R.Link prediction and path analysis using markov chains[J].Computer Networks,2000,33(1-6):377-386.
3ZHU J,HONG J,HUGHES J G Using markov chains for link prediction in adaptive web sites[J].Lect Notes Comput Sci,2002,2311:60-73.
4POPESCUL A,UNGAR L.Statistical relational learning for link prediction[C] //Proceedings of the Workshop on Learning Statistical Models from Relational Data.New York:ACM Press,2003:81-87.
5O'MADADHAIN J,HUTCHINS J,SMYTH P.Prediction and ranking algorithms for event-based network data[C] //Proceedings of the ACM SIGKDD 2005.New York:ACM Press,2005:23-30.
6LIN D.An information-theoretic definition of similarity[C] //Proceedings of the 15th Intl Conf Mach.Learn..San Francisco,Morgan Kaufman Publishers,1998:296-304.
7LIBEN-NOWELL D,KLEINBERG J.The link-prediction problem for social networks[J].J Am Soc Inform Sci Technol,2007,58(7):1019-1031.
8CLAUSET A,MOORE C,NEWMAN M E J.Hierarchical structure and the prediction of missing links in networks[J].Nature,2008,453:98-101.
9HOLLAND P W,LASKEY K B,LEINHARD S.Stochastic blockmodels:First steps[J].Social Networks,1983,5:109-137.
10GUIMERA R,SALES-PARDO M.Missing and spurious interactions and the reconstruction of complex networks[J].Proc Natl Sci Acad USA,2009,106(52):22073-22078.

共引文献287

1李文静.国内外电子商务研究的演化路径分析[J].华中师范大学研究生学报,2020(2):133-140.
2刘维,陈崚.复杂网络中的链接预测[J].信息与控制,2020,49(1):1-23. 被引量：2
3王玫申,张鹏,薛乐洋.基于扩散的推荐算法的可预测性[J].中国科技论文在线精品论文,2021(4):462-467. 被引量：1
4刘红芬,刘晓峰,张雪英,黄丽霞,王子中.改进的AdaBoost.M2-SVM在低信噪比语音识别中的应用[J].微电子学与计算机,2015,32(2):88-91. 被引量：1
5吕琳媛,陆君安,张子柯,闫小勇,吴晔,史定华,周海平,方锦清,周涛.复杂网络观察[J].复杂系统与复杂性科学,2010,7(2):173-186. 被引量：29
6王文强,张千明.链路预测的网络演化模型评价方法[J].电子科技大学学报,2011,40(2):174-179. 被引量：4
7东昱晓,柯庆,吴斌.基于节点相似性的链接预测[J].计算机科学,2011,38(7):162-164. 被引量：18
8王林,商超.无标度网络中的链路预测问题研究[J].计算机工程,2012,38(3):67-70. 被引量：7
9赵卫红.海洋中胶体研究的新进展[J].海洋与湖沼,2000,31(2):221-229. 被引量：11
10朱郁筱,吕琳媛.推荐系统评价指标综述[J].电子科技大学学报,2012,41(2):163-175. 被引量：250

同被引文献32

1孙丽娟.科技论文作者署名排序与通讯作者[J].中国科技期刊研究,2005,16(2):242-244. 被引量：21
2吕琳媛.复杂网络链路预测[J].电子科技大学学报,2010,39(5):651-661. 被引量：243
3吴海峰,孙一鸣.引文网络的研究现状及其发展综述[J].计算机应用与软件,2012,29(2):164-168. 被引量：20
4赵星,谭旻,余小萍,闫现洋,叶鹰.我国文科领域知识扩散之引文网络探析[J].中国图书馆学报,2012,38(5):59-67. 被引量：57
5徐恪,张赛,陈昊,李海涛.在线社会网络的测量与分析[J].计算机学报,2014,37(1):165-188. 被引量：65
6丁兆云,贾焰,周斌.微博数据挖掘研究综述[J].计算机研究与发展,2014,51(4):691-706. 被引量：119
7WANG Peng,XU BaoWen,WU YuRong,ZHOU XiaoYu.Link prediction in social networks: the state-of-the-art[J].Science China(Information Sciences),2015,58(1):1-38. 被引量：55
8成清,黄森,黄金才.社会网络的层次结构发现[J].复杂系统与复杂性科学,2015,12(1):8-16. 被引量：1
9Nahla Mohamed Ahmed,Ling Chen,Yulong Wang,Bin Li,Yun Li,Wei Liu.DEEPEYE: Link Prediction in Dynamic Networks Based on Non-negative Matrix Factorization[J].Big Data Mining and Analytics,2018,1(1):19-33. 被引量：13
10刘知远,孙茂松,林衍凯,谢若冰.知识表示学习研究进展[J].计算机研究与发展,2016,53(2):247-261. 被引量：259

引证文献9

1李志宇,梁循,徐志明,齐金山,陈燕方.DNPS:基于阻尼采样的大规模动态社会网络结构特征表示学习[J].计算机学报,2017,40(4):805-823. 被引量：7
2赵超,朱福喜,刘世超.基于SkipGram模型的链路预测方法[J].计算机应用与软件,2017,34(10):241-247. 被引量：5
3齐金山,梁循,李志宇,陈燕方,许媛.大规模复杂信息网络表示学习:概念、方法与挑战[J].计算机学报,2018,41(10):2394-2420. 被引量：42
4刘正铭,马宏,刘树新,杨奕卓,李星.一种融合节点文本属性信息的网络表示学习算法[J].计算机工程,2018,44(11):165-171. 被引量：11
5刘正铭,马宏,刘树新,李海涛,常圣.融合节点描述属性信息的网络表示学习算法[J].计算机应用,2019,39(4):1012-1020. 被引量：3
6周娅,杨邦.基于节点映射与标签数据构建的链接预测方法[J].计算机工程与设计,2020,41(2):373-380. 被引量：6
7陈文杰,许海云.一种基于多元数据融合的引文网络知识表示方法[J].情报理论与实践,2020,43(1):150-154. 被引量：6
8陈文杰.基于翻译模型的科研合作预测研究[J].数据分析与知识发现,2020,4(10):28-36. 被引量：3
9徐涛,邢泽文,卢敏,李忠虎.面向民航旅客同行特征提取与设计[J].计算机工程与设计,2021,42(2):589-594.

二级引证文献80

1刘维,陈崚.复杂网络中的链接预测[J].信息与控制,2020,49(1):1-23. 被引量：2
2余传明,钟韵辞,林奥琛,安璐.基于网络表示学习的作者重名消歧研究[J].数据分析与知识发现,2020,4(2):48-59. 被引量：10
3郭选贤.试论心包腑实和单纯腑实所致神昏的“辨证关键”[J].河南中医,2000,20(3):8-9. 被引量：1
4李志义,黄子风,许晓绵.基于表示学习的跨模态检索模型与特征抽取研究综述[J].情报学报,2018,37(4):422-435. 被引量：20
5王名扬,吴欢,贾晓婷.结合word2vec与扩充情感词典的微博多元情感分类研究[J].东北师大学报（自然科学版）,2019,51(1):55-62. 被引量：13
6齐金山,梁循,李志宇,陈燕方,许媛.大规模复杂信息网络表示学习:概念、方法与挑战[J].计算机学报,2018,41(10):2394-2420. 被引量：42
7黄费涛,杨振国,刘文印.事件分类:使用DeepWalk学习的基线[J].工业控制计算机,2019,32(5):122-124. 被引量：2
8王文涛,吴淋涛,黄烨,朱容波.基于密集连接卷积神经网络的链路预测模型[J].计算机应用,2019,39(6):1632-1638. 被引量：8
9张静,李文斌,张志敏.基于半监督聚类的网络嵌入方法[J].河北工业科技,2019,36(4):246-252.
10李佳,李瑞正.白酒生产加工过程中自动控制方法的研究[J].酿酒科技,2019(8):89-93.

1徐杰,李云,刘博,张晓斌.基于垂直FP树的并行频繁项集挖掘[J].计算机与数字工程,2012,40(10):12-15. 被引量：3
2张冰.实现关系数据库数据传输的序列化[J].中国科技信息,2005(8):21-21.
3陶国祥,吴艳兰,曾辉.TH2002水下地形演变分析与辅助设计系统[J].港工勘察,2004(45):50-51.
4小金.Rootkit技术发展演变分析找出地板下的秘密[J].新电脑,2008,32(3):120-123.
5范全润,陈莉,杨泽民.数据挖掘技术及其应用进展[J].楚雄师范学院学报,2002,17(3):16-18. 被引量：3
6郭翠英.在VB．NET下实现文件读取[J].电脑编程技巧与维护,2008(14):27-30. 被引量：1
7周原冰,左新强,顾杰,赵春晖.基于时间序列演变分析的有效相似性定义和聚类[J].计算机工程与应用,2008,44(10):138-141. 被引量：3
8何山,李少慧.面向对象技术的实时监控系统绘图软件包的设计[J].兵工自动化,2002,21(5):42-45.
9李斌,常明,罗自荣.虚拟现实技术在公路桥梁场景仿真中的应用[J].南昌大学学报（工科版）,2002,24(3):29-31. 被引量：3
10唐俊杰,郭俊峰,周凡利.Modelica模型的序列化方法[J].CAD/CAM与制造业信息化,2012(10):98-100. 被引量：1

计算机学报

2016年第10期

浏览历史

内容加载中请稍等...

一种大规模网络中基于节点结构特征映射的链接预测方法被引量：9

参考文献5

二级参考文献144

共引文献287

同被引文献32

引证文献9

二级引证文献80

相关作者

相关机构

相关主题

浏览历史

一种大规模网络中基于节点结构特征映射的链接预测方法 被引量：9

参考文献5

二级参考文献144

共引文献287

同被引文献32

引证文献9

二级引证文献80

相关作者

相关机构

相关主题

浏览历史

一种大规模网络中基于节点结构特征映射的链接预测方法被引量：9