-
题名全密态数据库密态计算关键技术综述
- 1
-
-
作者
毕树人
钮泽平
李国良
李琦
-
机构
清华大学计算机科学与技术系
清华大学网络科学与网络空间研究院
-
出处
《软件学报》
EI
CSCD
北大核心
2024年第8期3980-4010,共31页
-
基金
国家自然科学基金(61925205,62232009,62102215)
国家重点研发计划(2023YFB4503600)。
-
文摘
随着近些年云服务的流行,越来越多的企业和个人将数据存储在云数据库上.但在享受云服务便利的同时,也带来数据安全的问题.其中一个比较关键的问题是敏感数据的机密性保护,即保护用户的敏感数据不被窥探和泄漏.在这样的背景下,全密态数据库应运而生.相对于传统数据库,全密态数据库能够在数据的传输、存储和计算整个生命周期中对数据进行加密,保护数据的机密性.目前,在对数据加密的同时,支持所有SQL功能并保持高性能等方面还存在很多挑战.全面调研全密态数据库密态计算的关键技术,根据技术类型进行归纳分类,并在功能性、安全性和性能等方面进行对比与总结.首先介绍全密态数据库架构,包括基于加密算法的纯软件架构、基于可信执行环境(TEE)的可信硬件架构和软硬融合式架构.然后,总结归纳各个架构的关键技术.最后,讨论当前研究的挑战和机会,并提供一些未来研究的开放性问题.
-
关键词
全密态数据库
机密性保护
加密算法
可信执行环境(TEE)
-
Keywords
fully encrypted database
confidentiality protection
encryption algorithm
trusted execution environment(TEE)
-
分类号
TP306
[自动化与计算机技术—计算机系统结构]
-
-
题名数据库内AI模型优化
被引量:6
- 2
-
-
作者
钮泽平
李国良
-
机构
清华大学计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2021年第3期622-635,共14页
-
基金
国家自然科学基金(61925205,61632016)。
-
文摘
在大量变化着的数据中,数据分析师常常只关心预测结果为特定值的少量数据.然而,利用机器学习模型进行推理的工作流程中,由于机器学习算法库默认数据以单表方式组织,用户必须先通过SQL语句查询出全部数据,即使随后在模型推理过程中会将大量数据丢弃.指出了在这个过程中,如果可以预先从模型中提取信息,就有望能在数据获取阶段快速排除不需要的数据,从而降低数据获取过程中的多表连接代价、进程间通信代价以及模型预测代价,进而加速整个工作流程.以决策树模型为例,首先提出一种预筛选+验证的执行方法对查询过程进行优化,之后给出了从决策树中提取用于预筛选谓词的离线算法,最后在真实数据集上进行测试.实验结果表明,所提出的方法能够对借助决策树模型推理结果对数据进行筛选的应用场景起到较好的加速效果.
-
关键词
SQL
数据库
决策树
DB4AI
-
Keywords
SQL
database
decision tree
DB4AI
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-