基于生成对抗网络的深度伪造跨模型防御方法

Deepfake Cross-Model Defense Method Based on Generative Adversarial Network

下载PDF

导出

摘要为了降低深度伪造技术滥用带来的社会风险,提出一种基于生成对抗网络的主动防御深度伪造方法,通过在原始图像上增加微弱扰动制作对抗样本,使多个伪造模型输出产生明显失真。提出模型由对抗样本生成模块和对抗样本优化模块组成。对抗样本生成模块包括生成器和鉴别器,生成器在接收原始图像生成扰动后,通过对抗训练约束扰动的空间分布,降低扰动的视觉感知,提高对抗样本的真实性;对抗样本优化模块由基础对抗水印、深度伪造模型和鉴别器等组成,通过模拟黑盒场景攻击多个深度伪造模型,提高对抗样本的攻击性和迁移性。在常用深度伪造数据集CelebA和LFW上进行训练和测试,实验结果表明,相比现有主动防御方法,提出方法在实现跨模型主动防御的基础上,防御成功率达到85%以上,并且对抗样本生成效率比传统算法提高20~30倍。 To reduce social risks caused by the abuse of deepfake technology,an active defense method against deep forgery based on a Generative Adversarial Network(GAN)is proposed.Adversarial samples are created by adding imperceptible perturbation to original images,which significantly distorts the output of multiple forgery models.The proposed model comprises an adversarial sample generation module and an adversarial sample optimization module.The adversarial-sample generation module includes a generator and discriminator.After the generator receives an original image to generate a perturbation,the spatial distribution of the perturbation is constrained through adversarial training.By reducing the visual perception of the perturbation,the authenticity of the adversarial sample is improved.The adversarial sample optimization module comprises basic adversarial watermarking,deep forgery models,and discriminators.This module simulates black-box scenarios to attack multiple deep forgery models,thereby improving the attack and migration of adversarial samples.Training and testing are conducted on commonly used deepfake datasets Celebfaces Attributes(CelebA)and Labeled Faces in the Wild(LFW).Experimental results show that compared with existing active defense methods,the proposed method achieves a defense success rate exceeding 85%based on the cross-model active defense method and generates adversarial samples.Additionally,the method improves efficiency by 20-30 times compared with those of conventional algorithms.

作者戴磊曹林郭亚男张帆杜康宁 DAI Lei;CAO Lin;GUO Yanan;ZHANG Fan;DU Kangning(School of Information Communication Engineering,Beijing Information Science and Technology University,Beijing 100101,China)

机构地区北京信息科技大学信息与通信工程学院

出处《计算机工程》 CAS CSCD 北大核心 2024年第10期100-109,共10页 Computer Engineering

基金国家自然科学基金(U20A20163,62001033,62201066) 北京市教委科研计划(KZ202111232049,KM202111232014)。

关键词深度伪造对抗样本主动防御生成对抗网络迁移性 deepfake adversarial samples active defense Generative Adversarial Network(GAN) generalization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1陈晓楠,胡建敏,张本俊,陈爱玲.基于模型间迁移性的黑盒对抗攻击起点提升方法[J].计算机工程,2021,47(8):162-169. 被引量：10
2耿鹏志,樊红兴,张翌阳,唐云祁.基于篡改伪影的深度伪造检测方法[J].计算机工程,2021,47(12):156-162. 被引量：4

二级参考文献2

1张嘉楠,王逸翔,刘博,常晓林.深度学习的对抗攻击方法综述[J].网络空间安全,2019,10(7):95-104. 被引量：6
2贾瑞明,李阳,李彤,崔家礼,王一丁.多层级特征融合结构的单目图像深度估计网络[J].计算机工程,2020,46(12):207-214. 被引量：6

共引文献12

1赖妍菱,石峻峰,陈继鑫,白汉利,唐晓澜,邓碧颖,郑德生.基于U-Net的对抗样本防御模型[J].计算机工程,2021,47(12):163-170. 被引量：2
2耿鹏志,唐云祁,樊红兴,朱新同.基于CutMix算法和改进Xception网络的深度伪造检测研究[J].激光与光电子学进展,2022,59(16):348-355. 被引量：3
3李哲铭,张恒巍,马军强,王晋东,杨博.基于平移随机变换的对抗样本生成方法[J].计算机工程,2022,48(11):152-160.
4黄帅娜,李玉祥,毛岳恒,班爱莹,张志勇.基于集成advGAN的黑盒迁移对抗攻击[J].吉林大学学报（工学版）,2022,52(10):2391-2398. 被引量：1
5郑德生,陈继鑫,周静,柯武平,陆超,周永,仇钎.基于输入通道拆分的对抗攻击迁移性增强算法[J].计算机工程,2023,49(1):130-137. 被引量：1
6汤家军,王忠.基于FGSM的对抗样本生成算法[J].计算机技术与发展,2023,33(3):105-109. 被引量：1
7李哲铭,王晋东,侯建中,李伟,张世华,张恒巍.基于显著区域优化的对抗样本攻击方法[J].计算机工程,2023,49(9):246-255. 被引量：1
8李倩,向海昀,张玉婷,甘昀,廖浩德.结合高斯滤波与MASK的G-MASK人脸对抗攻击[J].计算机工程,2024,50(2):308-316. 被引量：1
9李文婷,肖蓉,杨肖.通过拉普拉斯平滑梯度提高对抗样本的可迁移性[J].计算机科学,2024,51(S01):926-931.
10张溢文,蔡满春,陈咏豪,朱懿,姚利峰.融合空间特征的多尺度深度伪造检测方法[J].计算机工程,2024,50(7):240-250.

1杨雷,张悦杉,龚尚文,刘刚,韦韩.基于卷积神经网络的混凝土桥梁表观病害识别模型[J].公路交通科技,2023,40(S02):181-186.
2焦远洋,王永平,张晓琳.面向场景文本检测模型的迁移对抗攻击[J].内蒙古科技大学学报,2024,43(1):46-51.
3董丰恺,邹晓强,王佳慧,马利民,杨文元,刘熙尧.基于帧内-帧间自融合的双流泛化人脸伪造检测方法[J].计算机工程,2024,50(10):185-195.
4侯慧,高富,魏瑞增,王磊,何浣,罗颖婷.广东电网遭台风泰利侵袭的输配电设备受损分析及评估[J].全球能源互联网,2024,7(5):499-509.
5王秋萍,潘贤,周勃旸,张瑜,马旭林,成巍.区域集合预报系统的集合变换卡尔曼滤波初始扰动的余弦分析约束方案[J].大气科学,2023,47(6):1731-1745.

计算机工程

2024年第10期

浏览历史

内容加载中请稍等...

基于生成对抗网络的深度伪造跨模型防御方法

参考文献2

二级参考文献2

共引文献12

相关作者

相关机构

相关主题

浏览历史