S3ML:一种安全的机器学习推理服务系统被引量：1

S3ML: Secure Serving System for Machine Learning Inference

下载PDF

导出

摘要隐私保护问题在当今机器学习领域日益受到关注,构建具备数据安全保障的机器学习服务系统变得越来越重要.与此同时,以英特尔SGX为代表的可信执行环境技术得到了日益广泛的使用来开发可信应用和系统.SGX为开发者提供了基于硬件的名为飞地的安全容器来保障应用程序的机密性和完整性.本文基于SGX提出了一种面向机器学习推理的安全服务系统S3ML. S3ML将机器学习模型运行在SGX飞地中以保护用户隐私.为了构建一个实用的基于SGX的安全服务系统, S3ML解决了来自两方面的挑战.首先,机器学习推理服务为了保证高可用性和可扩展性,通常包含多个后端模型服务器实例.当这些实例在SGX飞地内运行时,需要新的系统架构和协议来同步证书及密钥,以构建安全的分布式飞地集群. S3ML设计了基于SGX认证机制的飞地配置服务,来专门负责在客户端和模型服务器实例之间生成、持久化和分发证书及密钥.这样S3ML可以复用现有的基础设施来对服务进行透明的负载均衡和故障转移,以确保服务的高可用性和可扩展性.其次, SGX飞地运行在一个名为飞地页面缓存(EPC)的特殊内存区域,该区域的大小有限,由主机上的所有SGX飞地竞争,运行在飞地中应用的性能因此易受到干扰.为了满足机器学习推理服务的服务级别目标,一方面S3ML使用轻量级的机器学习框架和模型来构建模型服务器以减少EPC消耗.另一方面,通过实验发现了使用EPC页交换吞吐量作为保障服务级别目标的间接监控指标是可行的.基于该发现, S3ML提出基于EPC页交换强度来控制服务的负载均衡和水平扩展活动.基于Kubernetes、TensorFlow Lite和Occlum实现了S3ML,并在一系列模型上进行实验,对S3ML的系统开销、可行性和有效性进行了评估. As the privacy-preserving problem gains increasing concerns in today’s machine learning(ML) world, constructing an ML serving system with a data security guarantee becomes very important. Meanwhile, trusted execution environments(e.g., Intel SGX) have been widely used for developing trusted applications and systems. For instance, Intel SGX offers developers hardware-based secure containers(i.e., enclaves) to guarantee application confidentiality and integrity. This paper presents S3ML, an SGX-based secure serving system for ML inference. S3ML leverages Intel SGX to host ML models for users’ privacy protection. To build a practical secure serving system, S3ML addresses several challenges to run model servers inside SGX enclaves. In order to ensure availability and scalability, a frontend ML inference service typically consists of many backend model server instances. When these instances are running inside SGX enclaves, new system architectures and protocols are in need to synchronize cryptographic certificates and keys to construct distributed secure enclave clusters. A dedicated module is designed, it is called attestation-based enclave configuration service in S3ML, responsible for generating, persisting, and distributing certificates and keys among clients and model server instances. The existing infrastructure can then be reused to do transparent load balancing and failover to ensure service high-availability and scalability. Besides, SGX enclaves rely on a special memory region called the enclave page cache(EPC), which has a limited size and is contended by a host’s all enclaves.Therefore, the performance of SGX-based applications is vulnerable to EPC interferences. To satisfy the service-level objective(SLO) of ML inference services, S3ML first integrates lightweight ML framework/models to reduce EPC consumption. Furthermore, through offline analysis, it is found feasible to use EPC paging throughput as indirect monitoring metric to satisfy SLO. Based on this result, S3ML uses real-time EPC paging information to control service load balancing and scaling activities for SLO satisfaction. S3ML has been implemented based on Kubernetes, TensorFlow Lite, and Occlum. The system overhead, feasibility, and effectiveness of S3ML are demonstrated through extensive experiments on a series of popular ML models.

作者马俊明吴秉哲余超凡周爱辉巫锡斌陈向群 MA Jun-Ming;WU Bing-Zhe;YU Chao-Fan;ZHOU Ai-Hui;WU Xi-Bin;CHEN Xiang-Qun(School of Software and Microelectronics,Peking University,Beijing 102600,China;School of Electronics Engineering and Computer Science,Peking University,Beijing 100871,China;Key Laboratory of High Confidence Software Technologies of Ministry of Education(Peking University),Beijing 100871,China;Ant Group,Hangzhou 310013,China)

机构地区北京大学软件与微电子学院北京大学信息科学技术学院高可信软件技术教育部重点实验室(北京大学) 蚂蚁集团

出处《软件学报》 EI CSCD 北大核心 2022年第9期3312-3330,共19页 Journal of Software

基金国家重点研发计划(2017YFE0123600)。

关键词机器学习推理服务系统 SGX 可信计算隐私保护 machine learning inference serving system SGX trusted computing privacy-preserving

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1谭作文,张连福.机器学习隐私保护研究综述[J].软件学报,2020,31(7):2127-2156. 被引量：65
2董春涛,沈晴霓,罗武,吴鹏飞,吴中海.SGX 应用支持技术研究进展[J].软件学报,2021,32(1):137-166. 被引量：12
3王鹃,樊成阳,程越强,赵波,韦韬,严飞,张焕国,马婧.SGX技术的分析和研究[J].软件学报,2018,29(9):2778-2798. 被引量：28

二级参考文献11

1沈昌祥,张焕国,王怀民,王戟,赵波,严飞,余发江,张立强,徐明迪.可信计算的研究与发展[J].中国科学：信息科学,2010,40(2):139-166. 被引量：254
2周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：221
3沈晴霓.虚拟可信平台技术现状与发展趋势[J].信息网络安全,2010(4):34-36. 被引量：3
4杨波,冯登国,秦宇,张倩颖,奚瓅,郑昌文.基于可信移动平台的直接匿名证明方案研究[J].计算机研究与发展,2014,51(7):1436-1445. 被引量：8
5张英骏,冯登国,秦宇,杨波.基于Trustzone的强安全需求环境下可信代码执行方案[J].计算机研究与发展,2015,52(10):2224-2238. 被引量：22
6范伟,孔斌,张珠君,王婷婷,张杰,黄伟庆.KVM虚拟化动态迁移技术的安全防护模型[J].软件学报,2016,27(6):1402-1416. 被引量：14
7王进文,江勇,李琦,杨芫.SGX技术应用研究综述[J].网络新媒体技术,2017,6(5):3-9. 被引量：11
8李宗育,桂小林,顾迎捷,李雪松,戴慧珺,张学军.同态加密技术及其在云计算隐私保护中的应用[J].软件学报,2018,29(7):1830-1851. 被引量：41
9叶青青,孟小峰,朱敏杰,霍峥.本地化差分隐私研究综述[J].软件学报,2018,29(7):1981-2005. 被引量：74
10王鹃,樊成阳,程越强,赵波,韦韬,严飞,张焕国,马婧.SGX技术的分析和研究[J].软件学报,2018,29(9):2778-2798. 被引量：28

共引文献96

1高万祥.在向教育学习的过程中提高管理水平：校长工作手记[J].中学教育,2000(8):11-13.
2贾春福,哈冠雄,李瑞琪.密文去重系统中的数据访问控制策略[J].通信学报,2020,41(5):72-83. 被引量：15
3丁毅,沈薇,李洁,程子敬,靳军,孙伽宁.卫星通信全代理同态可信传输机制研究[J].中国空间科学技术,2020,40(4):84-96. 被引量：8
4魏立斐,陈聪聪,张蕾,李梦思,陈玉娇,王勤.机器学习的安全问题及隐私保护[J].计算机研究与发展,2020,57(10):2066-2085. 被引量：27
5张亚晖,赵敏,韩欢.针对SGX的攻击与防御综述[J].计算机技术与发展,2020,30(11):104-110. 被引量：1
6朱扬勇,熊贇.数据的经济活动及其所需要的权利[J].大数据,2020,6(6):140-150. 被引量：13
7董春涛,沈晴霓,罗武,吴鹏飞,吴中海.SGX 应用支持技术研究进展[J].软件学报,2021,32(1):137-166. 被引量：12
8贾春福,李瑞琪,王雅飞.基于同态加密的DBSCAN聚类隐私保护方案[J].通信学报,2021,42(2):1-11. 被引量：13
9杨光远,杨大利,张羽,马利民,张伟.基于可信硬件的隐私数据可搜索加密加速方法研究[J].信息安全研究,2021,7(4):319-327. 被引量：4
10刘文炎,沈楚云,王祥丰,金博,卢兴见,王晓玲,查宏远,何积丰.可信机器学习的公平性综述[J].软件学报,2021,32(5):1404-1426. 被引量：24

同被引文献4

1许春根,薛少康,徐磊,张盼.基于安全两方计算的高效神经网络推理协议[J].信息网络安全,2023(7):22-30. 被引量：3
2陆星缘,陈经纬,冯勇,吴文渊.基于同态加密的隐私保护数据分类协议[J].计算机科学,2023,50(8):321-332. 被引量：5
3杨蕴力.决策树隐私计算研究[J].网络安全技术与应用,2023(10):36-38. 被引量：1
4孙永奇,宋泽文,朱卫国,赵思聪.基于安全多方计算的图像分类方法[J].信息网络安全,2023(11):27-37. 被引量：2

引证文献1

1左大义,韩春玲,程丁丁.基于变分自编码器的隐私保护机器学习模型预测算法[J].网络安全技术与应用,2024(7):37-41.

1卢啸.细究学习过程,实现“思”“能”同发展[J].小学教学参考,2022(17):94-95.
2李莅.健康医疗数据安全治理体系构建与场景实践[J].中国信息安全,2022(7):59-61. 被引量：7
3曹宇,卑施源.红色旅游智慧导览平台构建研究--以“极智旅游Lite”小程序为例[J].无线互联科技,2022,19(13):57-59. 被引量：1
4龙诗科,蒋奇航,包友南,王建琦.基于Jetson Nano视觉应用平台设计[J].传感器与微系统,2022,41(9):99-101. 被引量：5
5李骏峰,杨小军,张凯望.基于YOLOX-L算法的安全帽佩戴检测方法[J].计算机技术与发展,2022,32(9):100-106. 被引量：3
6贵重,何鹏,何瑛,刘畅,李云翔,杜鹃,杜雅端.网信安全政策动态[J].电信工程技术与标准化,2022,35(8):11-13.
7胡罡,沈大斌,张宁军,陆兴海,王晓.保险业运维数据治理研究与实践[J].中国金融电脑,2022(8):85-89.
8.“陕体杯”冰球派3v3 lite城市挑战赛(西安站 )[J].体育世界,2022(6):112-113.
9张楠,周亮,刁玉.监管导向的数据稽查机制研究:生产要素类比分析视角[J].网络安全与数据治理,2022,41(7):23-29.
10高松,周冠宇,董博.加强健康医疗数据安全保障积极推进医疗数据安全治理[J].中国信息安全,2022(7):40-43. 被引量：5

软件学报

2022年第9期

浏览历史

内容加载中请稍等...

S3ML:一种安全的机器学习推理服务系统被引量：1

参考文献3

二级参考文献11

共引文献96

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

S3ML:一种安全的机器学习推理服务系统 被引量：1

参考文献3

二级参考文献11

共引文献96

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

S3ML:一种安全的机器学习推理服务系统被引量：1