面向文本分类的类别区分式通用对抗攻击方法被引量：2

Class Discriminative Universal Adversarial Attack for Text Classification

下载PDF

导出

摘要通用对抗攻击只需向任意输入添加一个固定的扰动序列,就可以成功混淆文本分类器,但是其会不加区分地攻击所有类别的文本样本,容易引起防御系统的注意。为了实现攻击的隐蔽性,文中提出了一种简单高效的类别区分式通用对抗攻击方法,突出对目标类别的文本样本有攻击效果,并尽量对非目标类别不产生影响。在白盒攻击的场景下,利用扰动序列在每个批次上的平均梯度搜索得到多个候选扰动序列,选择损失最小的扰动序列进行下一轮迭代,直到没有新的扰动序列产生。在4个公开的中英文数据集以及神经网络模型TextCNN和BiLSTM上进行了大量的实验,以评估所提方法的有效性,实验结果表明,该攻击方法可以实现对目标类别和非目标类别的区分式攻击,而且具有一定的迁移性。 The definition of universal adversarial attack is that the text classifiers can be successfully fooled by a fixed sequence of perturbations appended to any inputs.But textual examples from all classes are indiscriminately attacked by the existing UAA,which is easy to attract the attention of the defense system.For more stealth attack,a simple and efficient class discriminative universal adversarial attack method is proposed,which has an obvious attack effect on textual examples from the targeted classes and limited influence on the non-targeted classes.In the case of white-box attack,multiple candidate perturbation sequences are searched by using the average gradient of the perturbation sequence in each batch.The perturbation sequence with the smallest loss is selected for the next iteration until no new perturbation sequence is generated.Comprehensive experiments are conducted on four public Chinese and English datasets and TextCNN,BiLSTM to evaluate the effectiveness of the proposed method.Experimental results show that the proposed attack method can discriminatively attack the targeted and non-targeted classes,and has certain transferability.

作者郝志荣陈龙黄嘉成 HAO Zhi-rong;CHEN Long;HUANG Jia-cheng(School of Computer Science and Technology,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;School of Cyber Security and Information Law,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

机构地区重庆邮电大学计算机科学与技术学院重庆邮电大学网络空间安全与信息法学院

出处《计算机科学》 CSCD 北大核心 2022年第8期323-329,共7页 Computer Science

基金重庆市教委重点合作项目(HZ2021008)。

关键词通用对抗攻击文本分类类别区分式深度学习神经网络 Universal adversarial attack Text classification Class discriminative Deep learning Neural Networks

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1王文琦,汪润,王丽娜,唐奔宵.面向中文文本倾向性分类的对抗样本生成方法[J].软件学报,2019,30(8):2415-2427. 被引量：25
2仝鑫,王斌君,王润正,潘孝勤.面向自然语言处理的深度学习对抗样本综述[J].计算机科学,2021,48(1):258-267. 被引量：12
3仝鑫,王罗娜,王润正,王靖亚.面向中文文本分类的词级对抗样本生成方法[J].信息网络安全,2020(9):12-16. 被引量：13

二级参考文献4

1卿斯汉.Android安全研究进展[J].软件学报,2016,27(1):45-71. 被引量：107
2王文琦,汪润,王丽娜,唐奔宵.面向中文文本倾向性分类的对抗样本生成方法[J].软件学报,2019,30(8):2415-2427. 被引量：25
3潘文雯,王新宇,宋明黎,陈纯.对抗样本生成技术综述[J].软件学报,2020,31(1):67-81. 被引量：45
4梁瑞刚,吕培卓,赵月,陈鹏,邢豪,张颖君,韩冀中,赫然,赵险峰,李明,陈恺.视听觉深度伪造检测技术研究综述[J].信息安全学报,2020,5(2):1-17. 被引量：27

共引文献38

1郭书杰.基于快速边界攻击的黑盒对抗样本生成方法[J].计算机系统应用,2020,29(12):216-221. 被引量：2
2杜小虎,吴宏明,易子博,李莎莎,马俊,余杰.文本对抗样本攻击与防御技术综述[J].中文信息学报,2021,35(8):1-15. 被引量：6
3宋宇,李治霖,程超.基于CNN-BILSTM的工业控制系统ARP攻击入侵检测方法[J].计算机应用研究,2020,37(S02):242-244. 被引量：13
4李祥坤,杨争峰,曾霞,刘志明.一种面向图像识别的神经网络通用扰动生成算法[J].系统科学与数学,2019,39(12):1944-1963. 被引量：4
5仝鑫,王罗娜,王润正,王靖亚.面向中文文本分类的词级对抗样本生成方法[J].信息网络安全,2020(9):12-16. 被引量：13
6刘小垒,罗宇恒,邵林,张小松,朱清新.对抗样本生成及攻防技术研究[J].计算机应用研究,2020,37(11):3201-3205. 被引量：3
7仝鑫,王斌君,王润正,潘孝勤.面向自然语言处理的深度学习对抗样本综述[J].计算机科学,2021,48(1):258-267. 被引量：12
8刘野,黄贤英,刘文星,朱小飞,李昭平.基于自适应噪声添加的防御对抗样本算法[J].计算机应用研究,2021,38(3):764-769. 被引量：4
9翟正利,李鹏辉,冯舒.图对抗攻击研究综述[J].计算机工程与应用,2021,57(7):14-21. 被引量：2
10郑海斌,陈晋音,章燕,张旭鸿,葛春鹏,刘哲,欧阳亦可,纪守领.面向自然语言处理的对抗攻防与鲁棒性分析综述[J].计算机研究与发展,2021,58(8):1727-1750. 被引量：9

同被引文献7

1刘小垒,罗宇恒,邵林,张小松,朱清新.对抗样本生成及攻防技术研究[J].计算机应用研究,2020,37(11):3201-3205. 被引量：3
2陈晋音,张敦杰,黄国瀚,林翔,鲍亮.面向图神经网络的对抗攻击与防御综述[J].网络与信息安全学报,2021,7(3):1-28. 被引量：10
3王丹妮,陈伟,羊洋,宋爽.基于高斯增强和迭代攻击的对抗训练防御方法[J].计算机科学,2021,48(S01):509-513. 被引量：5
4景慧昀,周川,贺欣.针对人脸检测对抗攻击风险的安全测评方法[J].计算机科学,2021,48(7):17-24. 被引量：2
5王超,魏祥麟,田青,焦翔,魏楠,段强.基于特征梯度的调制识别深度网络对抗攻击方法[J].计算机科学,2021,48(7):25-32. 被引量：11
6魏忠诚,冯浩,张新秋,连彬.基于注意力机制的物理对抗样本检测方法研究[J].计算机应用研究,2022,39(1):254-258. 被引量：5
7范纯龙,李彦达,夏秀峰,乔建忠.基于随机梯度上升和球面投影的通用对抗攻击方法[J].东北大学学报（自然科学版）,2022,43(2):168-175. 被引量：2

引证文献2

1赵子天,詹文翰,段翰聪,吴跃.基于SVD的深度学习模型对抗鲁棒性研究[J].计算机科学,2023,50(10):362-368.
2李炎达,范纯龙,滕一平,于铠博.基于替代模型的批量零阶梯度符号算法[J].计算机科学,2023,50(S02):851-856.

1崔文强.由一则案例谈最高额抵押权的类别区分问题[J].中国房地产,2022(13):38-41.
2蔡军,陈欣欣.OCR技术在城建档案文件级著录信息自动获取与校核中的应用[J].兰台世界,2022(6):95-97. 被引量：6
3王文轶.辽西地区史前玉礼的起源与演进[J].辽宁师范大学学报（社会科学版）,2022,45(3):153-160. 被引量：2
4孙小进,王峙卫,潘廷龙,王守政.一种基于硅转接板的高安全芯片集成技术研究[J].微电子学与计算机,2022,39(7):115-120. 被引量：1
5张宁,范海涛.基于贝叶斯网络的信息安全预警模型[J].微型电脑应用,2022,38(6):135-138. 被引量：4
6高文龙,周天阳,朱俊虎,赵子恒.基于双向蚁群算法的网络攻击路径发现方法[J].计算机科学,2022,49(S01):516-522. 被引量：5
7赵丙风,孙寿浩,谭志强,何健.基于HDL的北斗B1C信号Weil码产生方法[J].电子元器件与信息技术,2022,6(5):21-24.
8田圣琦.地磁数据的不确定度分析[J].中国科技信息,2022(14):109-110.

计算机科学

2022年第8期

浏览历史

内容加载中请稍等...

面向文本分类的类别区分式通用对抗攻击方法被引量：2

参考文献3

二级参考文献4

共引文献38

同被引文献7

引证文献2

相关作者

相关机构

相关主题

浏览历史

面向文本分类的类别区分式通用对抗攻击方法 被引量：2

参考文献3

二级参考文献4

共引文献38

同被引文献7

引证文献2

相关作者

相关机构

相关主题

浏览历史

面向文本分类的类别区分式通用对抗攻击方法被引量：2