期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于SPARK的大规模RDF数据上的SPARQL查询算法 被引量:1
1
作者 崔家奇 闫威 《计算机应用与软件》 北大核心 2020年第12期26-31,45,共7页
海量RDF很难在单台机器上进行管理和查询RDF数据。针对该问题,提出一种基于Spark的SPARQL查询方法SSQ,将SPARQL查询转化为Spark分布式平台上的RDD操作。将数据图及查询图进行有效划分,增加并行度且减少分区间通信开销。通过谓词索引减... 海量RDF很难在单台机器上进行管理和查询RDF数据。针对该问题,提出一种基于Spark的SPARQL查询方法SSQ,将SPARQL查询转化为Spark分布式平台上的RDD操作。将数据图及查询图进行有效划分,增加并行度且减少分区间通信开销。通过谓词索引减小搜索空间,并优化连接,减少匹配次数,提高查询效率。在Spark集群上实现算法,在合成数据集LUBM上进行测试并与现有方法进行比较。结果表明该算法能够快速执行复杂SPARQL查询,并具有良好的可扩展性。 展开更多
关键词 RDF数据 SPARQL查询 SPARK分布式平台 平衡语义划分 通信开销
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部