基于双曲正切和矩的免疫防御

Immune Defense Based on Hyperbolic Tangent and Moments

下载PDF

导出

摘要对抗样本的发现与研究证实了深度神经网络的脆弱性.如果不对对抗样本的生成加以约束,那么触手可及的图像将不再安全并随时可能对不鲁棒的深度神经网络构成威胁.然而,现有的对抗防御主要旨在防止对抗样本成功攻击深度神经网络,而不是防止对抗样本的生成.因此,本文提出了一种新颖的对抗防御机制,该机制被称为免疫防御.免疫防御通过主动地在原始图像上添加难以察觉的扰动使得攻击者无法针对该图像制作出有效的对抗样本,从而同时保护了图像和深度神经网络.这种良性的扰动被称为免疫扰动,添加了免疫扰动的图像被称为免疫样本.在白盒免疫防御中,本文提出了双曲正切免疫防御(Hyperbolic Tangent Immune Defense,HTID)以制作高分类准确率、高防御性能和高视觉质量的白盒免疫样本;在黑盒免疫防御中,提出了基于矩的免疫防御(Moment-based Immune Defense,MID)以提升免疫样本的可迁移性,从而确保免疫样本对未知对抗攻击的防御性能.此外,本文还提出了免疫率以更加准确地衡量免疫样本的防御性能.在CIFAR-10、MNIST、STL-10和Caltech-256数据集上的大量实验表明,HTID和MID制作的免疫样本具有高分类准确率,在Inception-v3、ResNet-50、LeNet-5和Model C上的准确率均达到了100.0%,比原始准确率平均高出10.5%.制作的免疫样本同时具有高视觉质量,其SSIM最低为0.822,最高为0.900.实验也表明MID有着比HTID更高的可迁移性,MID在四个数据集上针对AdvGAN制作的免疫样本防御其他11种对抗攻击的平均免疫率分别为62.1%、52.1%、56.8%和48.7%,这比HTID高出15.0%、10.8%、17.5%和15.7%. The vulnerability of deep neural networks to adversarial examples has been confirmed.If the generation of adversarial examples is unregulated,images within reach are no longer secure and pose a threat to non-robust DNNs.However,existing adversarial defenses primarily aim at preventing adversarial examples from attacking deep neural networks successfully,rather than preventing their generation.Therefore,we propose a novel adversarial defense mechanism,which is referred to as immune defense.This mechanism applies carefully designed quasi�imperceptible perturbations to the raw images to prevent the generation of adversarial examples for the raw images thereby protecting both images and deep neural networks.Such perturbations are referred to as immune perturbations,and these perturbed images are referred to as immune examples.In the white-box immune defense,we propose Hyperbolic Tangent Immune Defense(HTID)to craft white-box immune examples with high classification accuracy,defensive performance,and visual quality.In the black-box immune defense,we propose Moment-based Immune Defense(MID)to enhance the transferability of immune examples,so as to ensure the defensive performance against unknown adversarial attacks.In addition,we propose immune rate to more accurately measure the defensive performance of immune examples.Extensive experiments on CIFAR-10,MNIST,STL-10,and Caltech-256 show that the immune examples crafted by HTID and MID have high classification accuracy,which reaches 100.0%and is 10.5%higher than the original accuracy on average.The immune examples also have high visual quality with SSIM between 0.822 and 0.900.The experiments also show that MID has higher transferability than HTID.The average immune rates of the immune examples crafted by MID against AdvGAN to defend against other 11 adversarial attacks on the two datasets are 62.1%,52.1%,56.8%and 48.7%,which are 15.0%,10.8%,17.5%and 15.7%higher than HTID,respectively.

作者吴昊王金伟罗向阳马宾 WU Hao;WANG Jin-Wei;LUO Xiang-Yang;MA Bin(School of Computer Science,Nanjing University of Information Science and Technology,Nanjing 210044;Engineering Research Center of Digital Forensics Ministry of Education,Nanjing University of Information Science and Technology,Nanjing 210044;School of Cyber Security,PLA Strategic Support Force Information Engineering University,Zhengzhou 450001;School of Cyber Security,Qilu University of Technology,Jinan 250353)

机构地区南京信息工程大学计算机学院南京信息工程大学数字取证教育部工程研究中心中国人民解放军战略支援部队信息工程大学网络空间安全学院齐鲁工业大学网络空间安全学院

出处《计算机学报》 EI CAS CSCD 北大核心 2024年第8期1786-1812,共27页 Chinese Journal of Computers

基金国家自然科学基金(No.62072250,62172435,U1804263,U20B2065,61872203,71802110,61802212) 中国中原科技创新领军人才项目基金(No.214200510019) 河南省网络空间态势感知重点实验室开放课题基金(No.HNTS2022002)资助。

关键词深度神经网络对抗样本对抗防御免疫防御可迁移性 deep neural network adversarial example adversarial defense immune defense transferability

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1张思思,左信,刘建伟.深度学习中的对抗样本问题[J].计算机学报,2019,42(8):1886-1904. 被引量：60

二级参考文献2

1王培.为何学习程序会被愚弄[J].科技导报,2016,34(7):88-89. 被引量：1
2李盼,赵文涛,刘强,崔建京,殷建平.机器学习安全性问题及其防御技术研究综述[J].计算机科学与探索,2018,12(2):171-184. 被引量：33

共引文献59

1郭书杰.基于快速边界攻击的黑盒对抗样本生成方法[J].计算机系统应用,2020,29(12):216-221. 被引量：2
2张超群,韦川源,梁刚,黑小龙,朱旭东.基于深度学习技术的恶意攻击的分析与识别[J].计算机应用研究,2020,37(S01):283-286. 被引量：6
3苗壮,杨帆,李阳,张睿,王亚鹏.基于假想对象的无目标图像检索对抗攻击方法[J].智能安全,2022,1(2):10-18.
4郭敏,曾颖明,于然,吴朝雄.基于对抗训练和VAE样本修复的对抗攻击防御技术研究[J].信息网络安全,2019(9):66-70. 被引量：3
5王家.基于深度学习的图像识别问题中对抗样本的研究[J].电脑知识与技术,2019,15(10):222-223. 被引量：2
6张嘉楠,赵镇东,宣晶,常晓林.深度学习对抗样本的防御方法综述[J].网络空间安全,2019,10(8):93-101. 被引量：6
7魏薇,牛金行,景慧昀.疫情大考下的人工智能应用和安全思考[J].网络空间安全,2020,11(2):88-91. 被引量：2
8胡永进,郭渊博,马骏,张晗,毛秀青.基于对抗样本的网络欺骗流量生成方法[J].通信学报,2020,41(9):59-70. 被引量：10
9李坤明,顾益军,张培晶.对抗环境下基于集成决策树的恶意PDF文件检测[J].计算机应用与软件,2020,37(10):318-322. 被引量：4
10马巍,蓝海,杜瑞颖,何琨,陈晶.基于迭代对抗生成框架的抗非分割式文本验证码技术[J].广州大学学报（自然科学版）,2020,19(2):1-11. 被引量：1

1李沅锜.清末古陶文的鉴藏、考释与传拓——以陈介祺带动的陶文交游考察[J].书法,2024(6):181-184.
2王正来,关胜晓.基于改进积分梯度的黑盒迁移攻击算法[J].计算机工程与应用,2024,60(9):309-316.
3杨桢,刘易宸,李鑫,许雪飞.基于深度学习的输电线路绝缘子故障检测方法[J].电气工程学报,2024,19(2):325-334.
4包天悦,王永咏,祁祥瑞,赵佳鑫,蔡存.柔性机械爪力控的变步长自适应滤波算法[J].信息技术,2024,48(7):40-45.
5黄建龙,邓国强,郭永祥,张朝阳,张坤,范仲鑫,林源,汪洪冰.2020-2022年湖南省小反刍兽疫春、秋季免疫效果评估[J].畜牧兽医杂志,2024,43(3):124-126.
6李萌,无.时尚造梦者:维罗妮卡·迪廷[J].艺术与设计,2024(6):102-105.
7祝铭.“青藏高原东部研究暨玉树历史遗迹学术论坛”述评[J].藏学学刊,2022(1):249-268.
8刘东东.山西金墓考古新发现与研究述论(2013—2023)[J].文物鉴定与鉴赏,2024(13):174-176.
9王一凡.非表征理论视角下金水桥的图像制作与视觉表征[J].荣宝斋,2024(5):166-171.
10李丽.巩义史前考古发现与研究[J].黄河．黄土．黄种人,2024(14):69-71.

计算机学报

2024年第8期

浏览历史

内容加载中请稍等...

基于双曲正切和矩的免疫防御

参考文献1

二级参考文献2

共引文献59

相关作者

相关机构

相关主题

浏览历史