SQM:基于Spark的大规模单图上的子图匹配算法被引量：1

SQM: subgraph matching algorithm for single large-scale graphs under Spark

下载PDF

导出

摘要针对大规模数据图下基于回溯法的子图查询算法的准确率低、开销大等问题,为提高查询准确率,降低大图下的查询开销,提出一种基于Spark的子图匹配(SQM)算法。首先根据结构信息过滤数据图,再将查询图分割成基本查询单元;然后对每一个基本查询单元分别匹配后进行Join操作;最后运用并行化提高了算法的运行效率,减小了搜索空间。实验结果表明,与Stwig、Turbo ISO算法相比,SQM算法在保证查询结果不变的情况下,速度提高了50%。 Focusing on low accuracy and high costs of backtracking-based subgraph query algorithm applied to large-scale graphs,a Spark-based Subgraph Query Matching(SQM)algorithm was proposed to improve query accuracy and reduce query overhead for large graphs.The data graph was firstly filtered according to structure information,and the query graph was divided into basic query units.Then each basic query unit was matched and joined together.Finally,the algorithm s efficiency was improved and search space was reduced by parallelization.The experimental results show that compared with Stwig(Sub twig)algorithm and TurboISO algorithm,SQM algorithm can increase the speed by 50% while ensuring the same query results.

作者李龙洋董一鸿施炜杰潘剑飞 LI Longyang;DONG Yihong;SHI Weijie;PAN Jianfei(College of Information Science and Engineering,Ningbo University,Ningbo Zhejiang 315211,China;Baidu Online Technology Company Limited,Beijing 100084,China)

机构地区宁波大学信息科学与工程学院北京百度在线科技有限公司

出处《计算机应用》 CSCD 北大核心 2019年第1期46-50,共5页 journal of Computer Applications

基金国家自然科学基金资助项目(61572266) 浙江省自然科学基金资助项目(LY16F020003) 宁波市自然科学基金资助项目(2017A610114)~~

关键词子图匹配图分割大规模单图并行化 SPARK subgraph matching graph segmentation single large-scale graph parallelization Spark

分类号 TP392 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张硕,李建中,高宏,邹兆年.一种多到一子图同构检测方法[J].软件学报,2010,21(3):401-414. 被引量：7
2于静,刘燕兵,张宇,刘梦雅,谭建龙,郭莉.大规模图数据匹配技术综述[J].计算机研究与发展,2015,52(2):391-409. 被引量：36

二级参考文献66

1汪卫,周皓峰,袁晴晴,楼宇波,施伯乐.基于图论的频繁模式挖掘[J].计算机研究与发展,2005,42(2):230-235. 被引量：17
2李先通,李建中,高宏.一种高效频繁子图挖掘算法[J].软件学报,2007,18(10):2469-2480. 被引量：35
3Microsoft Academic Search. Explore researchers' cooperating network.[2009-12-01 J.[2014-11-20]. http://academic. research. microsoft. com/VisualExplorer.
4Brynielsson J, Hogberg J, Kaati L, et al. Detecting social positions using simulation[C]//Proc of 2010 Int Conf on Advances in Social Networks Analysis and Mining (ASONAM). Alamitos, CA: IEEE, 2010: 48-55.
5Palantir. Products Built for A Purpose.[2004-01-01].[2014-11-20]. https://www.palantir.com/.
6Malewicz G, Austern M H, Bik A J C, et al, Pregel , A system for large-scale graph processing[C]//Proc of the 2010 ACM SIGMOD Int Conf on Management of Data. New York: ACM, 2010: 135-146.
7Sarwat M, Elnikety S, He Y, et al. Horton: Online query execution engine for large distributed graphs[C]//Proc of the 28th IEEE Int Conf on Data Engineering (ICDE J. Alamitos, CA: IEEE, 2012: 1289-1292.
8Low y, Gonzalez J, Kyrola A, et al. Graphlab , A new framework for parallel machine learning[C]//Proc of the 26th Conf on Uncertainty in Artificial Intelligence (UA]). Oregon, USA: AUAI, 2010.
9Michael R G, David S J. Computers and intractability: A guide to the theory of NP-completeness[R]. New York: W. H. Freeman Company, 1979.
10Christmas W J, Kittler J, Petrou M. Structural matching in computer vision using probabilistic relaxation[J]. Pattern Analysis and Machine Intelligence, 1995, 17(8): 749-764.

共引文献40

1张硕,高宏,李建中,邹兆年.不确定图数据库中高效查询处理[J].计算机学报,2009,32(10):2066-2079. 被引量：24
2刘波,房斌,张世勇,李直霖.基于关系模型的子图同构检测算法设计与实现[J].计算机工程,2011,37(11):62-63. 被引量：1
3黄云,洪佳明,覃遵跃.基于双索引的近似子图匹配[J].计算机应用,2012,32(7):1994-1997. 被引量：3
4谭伟,杨书新.图近似查询算法研究[J].计算机工程与设计,2013,34(5):1700-1705.
5孙勤红.支持增量图数据的超图查询算法研究[J].四川理工学院学报（自然科学版）,2015,28(3):27-32. 被引量：1
6孙彬.计算机物流服务的约简与优势发现[J].物流技术,2015,34(13):262-265.
7陆兴华,罗文俊,刘仁秋.基于Android系统的自适应跟踪场景渲染技术[J].计算机与网络,2015,41(18):72-75.
8吴志明,阳旸.我国公共信用信息采集:问题与对策[J].金融经济（下半月）,2016(1):130-131.
9林泽琦,赵俊峰,谢冰.一种基于图数据库的代码结构解析与搜索方法[J].计算机研究与发展,2016,53(3):531-540. 被引量：8
10任艳.微信息大数据粗糙集的近似约简[J].沈阳工业大学学报,2016,38(3):309-313. 被引量：4

同被引文献7

1张硕,李建中,高宏,邹兆年.一种多到一子图同构检测方法[J].软件学报,2010,21(3):401-414. 被引量：7
2于静,刘燕兵,张宇,刘梦雅,谭建龙,郭莉.大规模图数据匹配技术综述[J].计算机研究与发展,2015,52(2):391-409. 被引量：36
3罗国辉,林穗,姜文超.一种基于二进制编码处理的数字保序匹配算法[J].广东工业大学学报,2017,34(5):56-59. 被引量：1
4关皓元,朱斌,李冠宇,赵玲.基于RDF图结构切分的高效子图匹配方法[J].计算机应用,2018,38(7):1898-1904. 被引量：3
5关皓元,朱斌,李冠宇,蔡永嘉.基于资源描述框架图切分与顶点选择性的高效子图匹配方法[J].计算机应用,2019,39(2):360-369. 被引量：2
6许文,宋文爱,富丽贞,吕伟.面向大规模图数据的分布式子图匹配算法[J].计算机科学,2019,46(4):28-35. 被引量：6
7孙云浩,李逢雨,李冠宇,韩冰,邢维康.面向RDF图的多模式匹配方法[J].计算机工程与应用,2020,56(13):84-92. 被引量：1

引证文献1

1胡新苗,林穗,姜文超,熊梦,贺忠堂.基于路径适配的大规模RDF数据子图匹配算法[J].广东工业大学学报,2022,39(1):50-55.

1关皓元,朱斌,李冠宇,赵玲.基于RDF图结构切分的高效子图匹配方法[J].计算机应用,2018,38(7):1898-1904. 被引量：3
2楼昀恺,王朝坤.使用社区结构信息的子图匹配算法优化方法[J].计算机科学与探索,2019,13(1):1-22. 被引量：2
3吴小桐,王生怀,钟毓宁,邹春龙.台阶高度评定算法的适应性研究[J].湖北汽车工业学院学报,2018,32(3):32-36. 被引量：1
4阎海玲.复杂网络社区发现方法综述[J].信息与电脑,2018,30(20):162-163. 被引量：2
5赵薇,赵娜,张怡兴.基于颜色不变特征的谱聚类双分图分割方法[J].信息网络安全,2018(12):8-14. 被引量：1
6《中国组织工程研究》杂志2019年投稿须知[J].中国组织工程研究,2019,23(5):822-822.
7刘文,李锐,张晋红,林腾蛟,杨云.斜齿轮时变啮合刚度算法修正及影响因素研究[J].湖南大学学报（自然科学版）,2018,45(2):1-10. 被引量：23
8陈鹏,赵荣彩,单征,韩金,孟曦.基于动静结合的Android恶意代码行为相似性检测[J].计算机应用研究,2018,35(5):1534-1539. 被引量：8
9《中国组织工程研究》杂志2019年投稿须知[J].中国组织工程研究,2019,23(8):1314-1314.
10《中国组织工程研究》杂志2019年投稿须知[J].中国组织工程研究,2019,23(12):1970-1970.

计算机应用

2019年第1期

浏览历史

内容加载中请稍等...

SQM:基于Spark的大规模单图上的子图匹配算法被引量：1

参考文献2

二级参考文献66

共引文献40

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

SQM:基于Spark的大规模单图上的子图匹配算法 被引量：1

参考文献2

二级参考文献66

共引文献40

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

SQM:基于Spark的大规模单图上的子图匹配算法被引量：1