-
题名面向视觉分类模型的投毒攻击
- 1
-
-
作者
梁捷
郝晓燕
陈永乐
-
机构
太原理工大学信息与计算机学院
-
出处
《计算机应用》
CSCD
北大核心
2023年第2期467-473,共7页
-
基金
山西省重点研发计划项目(201903D121121)。
-
文摘
数据投毒攻击中的后门攻击方式的攻击者通过将带有隐藏触发器的样本插入训练集中来操纵训练数据的分布,从而使测试样本错误分类以达到改变模型行为和降低模型性能的目的。而现有触发器的弊端是样本无关性,即无论采用什么触发模式,不同有毒样本都包含相同触发器。因此将图像隐写技术与深度卷积对抗网络(DCGAN)结合,提出一种基于样本的攻击方法来根据灰度共生矩阵生成图像纹理特征图,利用图像隐写技术将目标标签字符嵌入纹理特征图中作为触发器,并将带有触发器的纹理特征图和干净样本拼接成中毒样本,再通过DCGAN生成大量带有触发器的假图。在训练集样本中将原中毒样本以及DCGAN生成的假图混合起来,最终达到投毒者注入少量的中毒样本后,在拥有较高的攻击率同时,保证触发器的有效性、可持续性和隐藏性的效果。实验结果表明,该方法避免了样本无关性的弊端,并且模型精确度达到93.78%,在30%的中毒样本比例下,数据预处理、剪枝防御以及AUROR防御方法对攻击成功率的影响达到最小,攻击成功率可达到56%左右。
-
关键词
视觉分类模型
投毒攻击
后门攻击
触发器
图像隐写
深度卷积对抗网络
-
Keywords
visual classification model
poisoning attack
backdoor attack
trigger
image steganography
Deep Convolutional Generative Adversarial Network(DCGAN)
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-