期刊文献+

基于采样和加权损失函数的模型窃取攻击方法

Model stealing attack based on sampling and weighting
原文传递
导出
摘要 模型窃取攻击旨在获得一个和目标受害模型功能相似的替代模型.现有的方法主要采用数据生成或数据选择方法和交叉熵损失函数去获得一个较好的攻击效果.据此,本文着重研究了攻击过程中这两个极为重要的模块:数据采样和损失函数.同时,本文提出了一个新颖的模型窃取攻击方法S&W,其包含了一种新的采样策略和一个精心设计的加权损失函数.首先,新的采样策略更加关注于从受害者模型中获得更多信息的重要样本.与此同时,本文通过引入k-Center算法达到选择样本的多样性的目的.其次,受到经典Focal损失函数的启发,本文设计了一种新的加权损失函数.该损失函数主要关注于受害者模型和替代模型对于相同输入所给出的输出之间的差异,从而促使替代模型模拟受害者模型.在4个常用的数据集上,我们通过实验证明了本文提出的方法的有效性.相比于之前最好的方法,本文方法最高有5.03%的性能提升. A model stealing attack aims to create a substitute model that steals the task completion ability of the target victim model.Popular approaches have used data generation/selection and entropy loss to achieve promising attack performance.In this paper,we explore two overlooked yet effective components of the attack,data sampling and weighting.We propose a novel method named S&W that provides a sampling scheme and a softlabel weighted loss function.First,we propose a data selection strategy that pays more attention to important samples for stealing more information from the victim model.Then,we introduce the k-Center algorithm to guarantee the selected subset's diversity,aiming to make the core-set selection tractable.Second,we propose a weighted entropy loss inspired by the focal loss that mainly focuses on the difference in outputs of the victim and the stealing models,allowing the substitute model to better simulate the victim model.Extensive experiments on four widely used datasets consistently show that our proposed method outperforms state-of-the-art methods,with a maximum improvement of 5.03% over the next best method.
作者 王熠旭 李杰 刘弘 王言 徐明亮 吴永坚 纪荣嵘 Yixu WANG;Jie LI;Hong LIU;Yan WANG;Mingliang XU;Yongjian WU;Rongrong JI(Department of Artificial Intelligence,Xiamen University,Xiamen 361005,China;National Institute of Informatics,Tokyo 101-8430,Japan;Department of Computer and Artificial Intelligence,Zhengzhou University,Zhengzhou 450001,China;Youtu Laboratory,Tencent,Shanghai 200235,China;Pimtterest Seattle98101 USA)
出处 《中国科学:信息科学》 CSCD 北大核心 2023年第5期931-945,共15页 Scientia Sinica(Informationis)
基金 国家杰出青年科学基金(批准号:62025603) 国家自然科学基金(批准号:62176222,62176223,62176226,62072386,62072387,62072389,62002305) 广东省基础与应用基础研究基金(批准号:2019B1515120049) 福建省自然科学基金计划(批准号:2021J01002)资助项目。
关键词 计算机视觉 模型窃取攻击 对抗攻击 主动学习 知识蒸馏 computer vision model stealing attack adversarial attack active learning knowledge distillation
  • 相关文献

参考文献1

共引文献40

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部