-
题名基于核外计算的Datalog引擎设计与实现
- 1
-
-
作者
张奕裕
王归航
左志强
李宣东
-
机构
南京大学计算机科学与技术系
计算机软件新技术国家重点实验室(南京大学)
-
出处
《软件学报》
EI
CSCD
北大核心
2023年第8期3587-3604,共18页
-
基金
国家自然科学基金(61802168)
江苏省自然科学基金(BK20191247)。
-
文摘
随着新兴技术的迅速发展,领域软件对开发效率提出了新的要求.Datalog语言作为一门具有简洁语法和良好语义的声明式编程语言,能帮助开发人员快速开发和解决问题,近年来越来越受到重视与欢迎.但解决真实场景问题时,现有的单机Datalog引擎计算规模往往受限于内存容量大小,不具有可扩展性.为解决上述问题,设计并实现基于核外计算的Datalog引擎.方法首先设计一系列计算Datalog程序所需的支持核外计算的操作算子,然后将Datalog程序转换合成带核外计算算子的C++程序,接着方法设计基于Hash的分区策略和基于搜索树剪枝的最少置换调度策略,将相应的分区文件调度执行计算并得到最终结果.基于该方法,实现原型工具DDL(disk-based Datalog engine),并选取广泛应用的真实Datalog程序,在合成数据集以及真实数据集上进行实验,实验结果体现了DDL良好性能以及高可扩展性.
-
关键词
Datalog引擎
核外计算
操作算子
分区策略
调度策略
-
Keywords
Datalog engine
out-of-core computation
operators
partition strategy
scheduling strategy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-