基于采样和加权损失函数的模型窃取攻击方法

Model stealing attack based on sampling and weighting

导出

摘要模型窃取攻击旨在获得一个和目标受害模型功能相似的替代模型.现有的方法主要采用数据生成或数据选择方法和交叉熵损失函数去获得一个较好的攻击效果.据此,本文着重研究了攻击过程中这两个极为重要的模块:数据采样和损失函数.同时,本文提出了一个新颖的模型窃取攻击方法S&W,其包含了一种新的采样策略和一个精心设计的加权损失函数.首先,新的采样策略更加关注于从受害者模型中获得更多信息的重要样本.与此同时,本文通过引入k-Center算法达到选择样本的多样性的目的.其次,受到经典Focal损失函数的启发,本文设计了一种新的加权损失函数.该损失函数主要关注于受害者模型和替代模型对于相同输入所给出的输出之间的差异,从而促使替代模型模拟受害者模型.在4个常用的数据集上,我们通过实验证明了本文提出的方法的有效性.相比于之前最好的方法,本文方法最高有5.03%的性能提升. A model stealing attack aims to create a substitute model that steals the task completion ability of the target victim model.Popular approaches have used data generation/selection and entropy loss to achieve promising attack performance.In this paper,we explore two overlooked yet effective components of the attack,data sampling and weighting.We propose a novel method named S&W that provides a sampling scheme and a softlabel weighted loss function.First,we propose a data selection strategy that pays more attention to important samples for stealing more information from the victim model.Then,we introduce the k-Center algorithm to guarantee the selected subset's diversity,aiming to make the core-set selection tractable.Second,we propose a weighted entropy loss inspired by the focal loss that mainly focuses on the difference in outputs of the victim and the stealing models,allowing the substitute model to better simulate the victim model.Extensive experiments on four widely used datasets consistently show that our proposed method outperforms state-of-the-art methods,with a maximum improvement of 5.03% over the next best method.

作者王熠旭李杰刘弘王言徐明亮吴永坚纪荣嵘 Yixu WANG;Jie LI;Hong LIU;Yan WANG;Mingliang XU;Yongjian WU;Rongrong JI(Department of Artificial Intelligence,Xiamen University,Xiamen 361005,China;National Institute of Informatics,Tokyo 101-8430,Japan;Department of Computer and Artificial Intelligence,Zhengzhou University,Zhengzhou 450001,China;Youtu Laboratory,Tencent,Shanghai 200235,China;Pimtterest Seattle98101 USA)

机构地区厦门大学信息学院 National Institute of Informatics 郑州大学计算机与人工智能学院腾讯优图实验室 Pinterest

出处《中国科学：信息科学》 CSCD 北大核心 2023年第5期931-945,共15页 Scientia Sinica(Informationis)

基金国家杰出青年科学基金(批准号:62025603) 国家自然科学基金(批准号:62176222,62176223,62176226,62072386,62072387,62072389,62002305) 广东省基础与应用基础研究基金(批准号:2019B1515120049) 福建省自然科学基金计划(批准号:2021J01002)资助项目。

关键词计算机视觉模型窃取攻击对抗攻击主动学习知识蒸馏 computer vision model stealing attack adversarial attack active learning knowledge distillation

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1纪守领,杜天宇,李进锋,沈超,李博.机器学习模型安全与隐私研究综述[J].软件学报,2021,32(1):41-67. 被引量：41

共引文献40

1马钰锡,张全新,谭毓安,沈蒙.面向智能攻击的行为预测研究[J].软件学报,2021,32(5):1526-1546. 被引量：4
2杨平林,李泽山,郭改枝.基于改进AdaBoost算法识别包装瓶的设计与实现[J].内蒙古师范大学学报（自然科学版）,2021,50(3):268-274. 被引量：1
3邬友朋,赵金龙,贾中营.一种基于KNN/CNN的供热客服音频分类方法[J].电力大数据,2021,24(7):56-66. 被引量：1
4陈传涛,潘丽敏,罗森林,王子文.基于FGSM样本扩充的模型窃取攻击方法研究[J].信息安全研究,2021,7(11):1023-1030. 被引量：1
5Huanhuan Ni,Yiliang Han,Xiaowei Duan,Guohui Yang.An Improved LeNet-5 Model Based on Encrypted Data[J].国际计算机前沿大会会议论文集,2021(2):166-178.
6纪守领,杜天宇,邓水光,程鹏,时杰,杨珉,李博.深度学习模型鲁棒性研究综述[J].计算机学报,2022,45(1):190-206. 被引量：31
7彭长根.人工智能安全治理挑战与对策[J].信息安全研究,2022,8(4):318-325. 被引量：6
8曹刘娟,匡华峰,刘弘,王言,张宝昌,黄飞跃,吴永坚,纪荣嵘.双标签监督的几何约束对抗训练[J].软件学报,2022,33(4):1218-1230.
9秦宝东,李媛媛,余沛航.云计算辅助的高效决策树隐私保护查询协议[J].西安邮电大学学报,2022,27(1):1-8.
10余正飞,闫巧,周鋆.面向网络空间防御的对抗机器学习研究综述[J].自动化学报,2022,48(7):1625-1649. 被引量：7

1郑凯阳,伍鹏.面向密集行人检测改进YOLOX-S算法[J].信息技术与信息化,2023(5):132-135.
2霍爱清,南思媛,胥静蓉.改进YOLOX的弱光线道路交通标志检测[J].电子测量技术,2023,46(6):62-67.
3冯玮,吴玉芹,孙浩航.SDN与机器学习联合防御DDOS攻击方案研究[J].哈尔滨师范大学自然科学学报,2022,38(6):54-61.
4罗鑫,夏学知.面向图像识别的对抗样本与攻击研究[J].舰船电子工程,2023,43(2):22-29.
5定勤芳.守护少年的你[J].新班主任,2023(6):22-22.
6马诗洋,马雪,师嘉辰.基于采样保持器与模数转换器的逻辑设计[J].电脑编程技巧与维护,2023(5):49-51.
7王东风,邓鉴湧,黄宇,高鹏.基于LSTM的核电站除氧器水位控制系统隐蔽攻击方法研究[J].动力工程学报,2023,43(5):590-597.
8杨盼盼,张信明.基于标签的无数据的成员推理攻击[J].网络安全与数据治理,2023,42(5):44-49.
9王也,曲会晨,林奕森.基于改进策略的鼠群优化算法[J].电脑编程技巧与维护,2023(4):48-50. 被引量：1
10吴连伟,杜金亮,栾建伟,张世军,闫明阳,鞠涛涛.机体总成自动拔销单元的设计及应用[J].设备管理与维修,2023(10):130-131.

中国科学：信息科学

2023年第5期

浏览历史

内容加载中请稍等...

基于采样和加权损失函数的模型窃取攻击方法

参考文献1

共引文献40

相关作者

相关机构

相关主题

浏览历史