面向深度学习可解释性的对抗攻击算法被引量：3

Adversarial attack algorithm for deep learning interpretability

下载PDF

导出

摘要针对深度神经网络(DNN)中的可解释性导致模型信息泄露的问题,证明了在白盒环境下利用Grad-CAM解释方法产生对抗样本的可行性,并提出一种无目标的黑盒攻击算法--动态遗传算法。该算法首先根据解释区域与扰动像素位置的变化关系改进适应度函数,然后通过多轮的遗传算法在不断减少扰动值的同时递增扰动像素的数量,而且每一轮的结果坐标集会在下一轮的迭代中保留使用,直到在未超过扰动边界的情况下扰动像素集合使预测标签发生翻转。在实验部分,所提算法在AlexNet、VGG-19、ResNet-50和SqueezeNet模型下的攻击成功率平均为92.88%,与One pixel算法相比,虽然增加了8%的运行时间,但成功率提高了16.53个百分点。此外,该算法能够在更短的运行时间内,使成功率高于Ada-FGSM算法3.18个百分点,高于PPBA算法8.63个百分点,并且与Boundary-attack算法的成功率相差不大。结果表明基于解释方法的动态遗传算法能有效进行对抗攻击。 Aiming at the problem of model information leakage caused by interpretability in Deep Neural Network(DNN),the feasibility of using the Gradient-weighted Class Activation Mapping(Grad-CAM)interpretation method to generate adversarial samples in a white-box environment was proved,moreover,an untargeted black-box attack algorithm named dynamic genetic algorithm was proposed.In the algorithm,first,the fitness function was improved according to the changing relationship between the interpretation area and the positions of the disturbed pixels.Then,through multiple rounds of genetic algorithm,the disturbance value was continuously reduced while increasing the number of the disturbed pixels,and the set of result coordinates of each round would be maintained and used in the next round of iteration until the perturbed pixel set caused the predicted label to be flipped without exceeding the perturbation boundary.In the experiment part,the average attack success rate under the AlexNet,VGG-19,ResNet-50 and SqueezeNet models of the proposed algorithm was 92.88%,which was increased by 16.53 percentage points compared with that of One pixel algorithm,although with the running time increased by 8%compared with that of One pixel algorithm.In addition,in a shorter running time,the proposed algorithm had the success rate higher than the Adaptive Fast Gradient Sign Method(Ada-FGSM)algorithm by 3.18 percentage points,higher than the Projection&Probability-driven Black-box Attack(PPBA)algorithm by 8.63 percentage points,and not much different from Boundary-attack algorithm.The results show that the dynamic genetic algorithm based on the interpretation method can effectively execute the adversarial attack.

作者陈权李莉陈永乐段跃兴 CHEN Quan;LI Li;CHEN Yongle;DUAN Yuexing(College of Information and Computer,Taiyuan University of Technology,Jinzhong Shanxi 030600,China)

机构地区太原理工大学信息与计算机学院

出处《计算机应用》 CSCD 北大核心 2022年第2期510-518,共9页 journal of Computer Applications

基金山西省重点研发计划项目(201903D121121)。

关键词深度神经网络解释方法显著图对抗攻击遗传算法 Deep Neural Network(DNN) interpretation method saliency map adversarial attack genetic algorithm

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1吴飞,廖彬兵,韩亚洪.深度学习的可解释性[J].航空兵器,2019,26(1):39-46. 被引量：37

二级参考文献1

1Quan-shi ZHANG,Song-chun ZHU.Visual interpretability for deep learning：a survey[J].Frontiers of Information Technology & Electronic Engineering,2018,19(1):27-39. 被引量：50

共引文献36

1李艳红,姚元庆,姚兵,黄威权,杨梦庚.原癌基因c-myc产物在小鼠早期胚胎中的表达[J].第四军医大学学报,2000,21(2):253-254. 被引量：1
2张林超,张欣海.可信任的人工智能系统及安全框架浅析[J].中国电子科学研究院学报,2019,14(12):1253-1258. 被引量：3
3王亚珅,张龙.2019年国外人工智能技术的发展及应用[J].飞航导弹,2020(1):46-50. 被引量：3
4徐龙飞,郁进明.不同优化器在高斯噪声下对LR性能影响的研究[J].计算机技术与发展,2020,30(3):7-12. 被引量：6
5成科扬,王宁,师文喜,詹永照.深度学习可解释性研究进展[J].计算机研究与发展,2020,57(6):1208-1217. 被引量：68
6吴晖,韩海庭,屈秀伟,孙圣力.大数据征信算法的可解释性研究[J].征信,2020(5):44-51. 被引量：6
7郭炜炜,张增辉,郁文贤,孙效华.SAR图像目标识别的可解释性问题探讨[J].雷达学报（中英文）,2020,9(3):462-476. 被引量：23
8化盈盈,张岱墀,葛仕明.深度学习模型可解释性的研究进展[J].信息安全学报,2020,5(3):1-12. 被引量：44
9武江涛.弹载智能雷达导引技术架构及处理方法综述[J].信息技术与信息化,2020(7):136-138. 被引量：2
10刘东亮.技术性正当程序:人工智能时代程序法和算法的双重变奏[J].比较法研究,2020,34(5):64-79. 被引量：136

同被引文献27

1张国栋,应欢,杨寿国,石志强,李霁远.嵌入式固件脆弱哈希函数自动识别与破解方法[J].北京邮电大学学报,2020,43(1):46-53. 被引量：8
2张娟.患者自主权:内涵、困境及突破——以马克思人学交往理论为分析视角[J].福建论坛（人文社会科学版）,2018(3):75-82. 被引量：10
3盛海峰,张真奇,陈竽舟.针对降雨量级预报的串联水库汛限水位动态控制研究[J].中国农村水利水电,2018(5):144-147. 被引量：3
4吕巳奇,王建群,焦钰,应碧茜.基于协同的水库汛限水位控制多目标分析[J].人民黄河,2019,41(5):23-27. 被引量：7
5纪守领,李进锋,杜天宇,李博.机器学习模型可解释性方法、应用与安全研究综述[J].计算机研究与发展,2019,56(10):2071-2096. 被引量：153
6李莉莉,张晓勇,岳伟.移动自组织网中基于贪婪蚁群算法的广播策略[J].系统工程与电子技术,2020,42(4):926-932. 被引量：9
7王西超,高颂,浦乐,曲晓雷.导弹全寿命周期大数据分布式存储系统研究[J].弹箭与制导学报,2020,40(5):5-9. 被引量：7
8陈娟,荆昊,方宇杰.基于多种群协同进化算法的混合交通流信号优化[J].上海大学学报（自然科学版）,2020,26(6):1001-1014. 被引量：5
9张杨,但斌,高华丽.基于改进迭代贪婪算法的产品服务系统订单调度优化[J].计算机集成制造系统,2020,26(12):3435-3446. 被引量：5
10陈园琼,邹北骥,张美华,廖望旻,黄嘉儿,朱承璋.医学影像处理的深度学习可解释性研究进展[J].浙江大学学报（理学版）,2021,48(1):18-29. 被引量：11

引证文献3

1江婧,曹东,鄢来均.可解释人工智能医疗应用的伦理问题[J].中国医学伦理学,2022,35(12):1322-1328. 被引量：4
2赵鲁斌,宋晓丹.结合遗传算法的水库汛限水位动态控制模型研究[J].水利科技与经济,2024,30(1):134-138.
3朱立炫,卢照,卢金清.基于贪婪算法的大数据兼容性云存储方法仿真[J].计算机仿真,2024,41(1):537-540.

二级引证文献4

1李东洋,刘秦民.论ChatGPT在医学领域可能带来的伦理风险与防范路径[J].中国医学伦理学,2023,36(10):1067-1073. 被引量：10
2王陶冶,王欢.人工智能“阴暗面”的成因及广东对策[J].科技创新发展战略研究,2024,8(1):11-18.
3汪琛.医疗人工智能的原则主义审思及治理探析[J].中国医学伦理学,2024,37(9):1052-1060. 被引量：1
4杨丽辉,彭菊红,何胜男,刘国龙,蒲萍.人工智能技术在脑干出血诊疗中的伦理问题[J].中华神经外科疾病研究杂志,2024,18(5):68-71.

1刘子龙.对抗样本的攻防算法研究[J].无线互联科技,2021,18(24):126-129.
2何东健,王鹏,牛童,毛燕茹,赵艳茹.基于改进残差网络的田间葡萄霜霉病病害程度分级模型[J].农业机械学报,2022,53(1):235-243. 被引量：19
3黄磊,陈尔东昊.基于多特征U-Net网络的工程活动图斑快速识别[J].测绘通报,2021(12):75-76. 被引量：2
4周婕,马明栋.基于改进的ResNet网络的人脸表情识别[J].计算机技术与发展,2022,32(1):25-29. 被引量：7
5李建,郭延明,于天元,武与伦,王翔汉,老松杨.基于生成对抗网络的多目标类别对抗样本生成算法[J].计算机科学,2022,49(2):83-91. 被引量：1
6孔德谦,柴韬.新疆AETS水利枢纽岩质高边坡大孔距预裂爆破施工技术[J].四川水利,2021,42(6):102-105. 被引量：1
7卢为君,曾国辉,黄勃,韦钰,杜涛.基于改进灰狼算法的轮毂电机矢量控制[J].制造业自动化,2022,44(1):104-109. 被引量：7
8王泽鹏.基于动态遗传算法的共享配送模式研究[J].运筹与管理,2021,30(12):115-122. 被引量：6
9吕小玲,仇晓兰,俞文明,徐丰.基于无监督域适应的仿真辅助SAR目标分类方法及模型可解释性分析[J].雷达学报（中英文）,2022,11(1):168-182. 被引量：1
10毛世昕,李捍东.改进SSD算法在交通场景中的检测研究[J].微处理机,2022,43(1):26-29. 被引量：1

计算机应用

2022年第2期

浏览历史

内容加载中请稍等...

面向深度学习可解释性的对抗攻击算法被引量：3

参考文献1

二级参考文献1

共引文献36

同被引文献27

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

面向深度学习可解释性的对抗攻击算法 被引量：3

参考文献1

二级参考文献1

共引文献36

同被引文献27

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

面向深度学习可解释性的对抗攻击算法被引量：3