-
题名黑盒机器学习模型的成员推断攻击研究
被引量:1
- 1
-
-
作者
刘高扬
李雨桐
万博睿
王琛
彭凯
-
机构
华中科技大学电子信息与通信学院
华中科技大学智能互联网技术湖北省重点实验室
-
出处
《信息安全学报》
CSCD
2021年第3期1-15,共15页
-
基金
国家自然科学基金(No.61872416,No.62002104,No.52031009,No.62071192)
中央高校基本科研业务费(No.2019kfyXJJS017)
+1 种基金
湖北省自然科学基金(No.2019CFB191)
国家大学生创新训练计划项目(No.2020104870001,No.DX2020041)资助。
-
文摘
近年来,机器学习技术飞速发展,并在自然语言处理、图像识别、搜索推荐等领域得到了广泛的应用。然而,现有大量开放部署的机器学习模型在模型安全与数据隐私方面面临着严峻的挑战。本文重点研究黑盒机器学习模型面临的成员推断攻击问题,即给定一条数据记录以及某个机器学习模型的黑盒预测接口,判断此条数据记录是否属于给定模型的训练数据集。为此,本文设计并实现了一种基于变分自编码器的数据合成算法,用于生成与给定模型的原始训练数据分布相近的合成数据;并在此基础上提出了基于生成对抗网络的模拟模型构建算法,利用合成数据训练得到与给定模型具有相似预测能力的机器学习模型。相较于现有的成员推断攻击工作,本文所提出的推断攻击无需目标模型及其训练数据的先验知识,在仅有目标模型黑盒预测接口的条件下,可获得更加准确的攻击结果。通过本地模型和线上机器学习即服务平台BigML的实验结果证明,所提的数据合成算法可以得到高质量的合成数据,模拟模型构建算法可以在更加严苛的条件下模拟给定模型的预测能力。在没有目标模型及其训练数据的先验知识条件下,本文所提的成员推断攻击在针对多种目标模型进行攻击时,推断准确率最高可达74%,推断精确率可达86%;与现有最佳攻击方法相比,将推断准确率与精确率分别提升10.7%及11.2%。
-
关键词
机器学习
黑盒模型
成员推断攻击
变分自编码器
生成对抗网络
-
Keywords
machine learning
black-box model
membership inference attack
variational autoencoder
generative adversarial network
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP309
[自动化与计算机技术—计算机系统结构]
-