基于掩码语言模型的中文BERT攻击方法

Chinese BERT Attack Method Based on Masked Language Model

下载PDF

导出

摘要对抗文本是一种能够使深度学习分类器作出错误判断的恶意样本,敌手通过向原始文本中加入人类难以察觉的微小扰动制作出能欺骗目标模型的对抗文本.研究对抗文本生成方法,能对深度神经网络的鲁棒性进行评价,并助力于模型后续的鲁棒性提升工作.当前针对中文文本设计的对抗文本生成方法中,很少有方法将鲁棒性较强的中文BERT模型作为目标模型进行攻击.面向中文文本分类任务,提出一种针对中文BERT的攻击方法Chinese BERT Tricker.该方法使用一种汉字级词语重要性打分方法——重要汉字定位法;同时基于掩码语言模型设计一种包含两类策略的适用于中文的词语级扰动方法实现对重要词语的替换.实验表明,针对文本分类任务,所提方法在两个真实数据集上均能使中文BERT模型的分类准确率大幅下降至40%以下,且其多种攻击性能明显强于其他基线方法. Adversarial texts are malicious samples that can cause deep learning classifiers to make errors.The adversary creates an adversarial text that can deceive the target model by adding subtle perturbations to the original text that are imperceptible to humans.The study of adversarial text generation methods can evaluate the robustness of deep neural networks and contribute to the subsequent robustness improvement of the model.Among the current adversarial text generation methods designed for Chinese text,few attack the robust Chinese BERT model as the target model.For Chinese text classification tasks,this study proposes an attack method against Chinese BERT,that is Chinese BERT Tricker.This method adopts a character-level word importance scoring method,important Chinese character positioning.Meanwhile,a word-level perturbation method for Chinese based on the masked language model with two types of strategies is designed to achieve the replacement of important words.Experimental results show that for the text classification tasks,the proposed method can significantly reduce the classification accuracy of the Chinese BERT model to less than 40%on two real datasets,and it outperforms other baseline methods in terms of multiple attack performance.

作者张云婷叶麟唐浩林张宏莉李尚 ZHANG Yun-Ting;YE Lin;TANG Hao-Lin;ZHANG Hong-Li;LI Shang(School of Cyberspace Science,Harbin Institute of Technology,Harbin 150001,China)

机构地区哈尔滨工业大学网络空间安全学院

出处《软件学报》 EI CSCD 北大核心 2024年第7期3392-3409,共18页 Journal of Software

基金国家自然科学基金(61872111)。

关键词深度神经网络对抗样本文本对抗攻击中文BERT 掩码语言模型 deep neural network(DNN) adversarial example textual adversarial attack Chinese BERT masked language model(MLM)

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1袁天昊,吉顺慧,张鹏程,蔡涵博,戴启印,叶仕俊,任彬.针对黑盒智能语音软件的对抗样本生成方法[J].软件学报,2022,33(5):1569-1586. 被引量：2
2王文琦,汪润,王丽娜,唐奔宵.面向中文文本倾向性分类的对抗样本生成方法[J].软件学报,2019,30(8):2415-2427. 被引量：25
3仝鑫,王罗娜,王润正,王靖亚.面向中文文本分类的词级对抗样本生成方法[J].信息网络安全,2020(9):12-16. 被引量：13
4邓耀臣,冯志伟.词汇长度与词汇频数关系的计量语言学研究[J].外国语,2013,36(3):29-39. 被引量：20

二级参考文献36

1周绍珩.马丁内的语言功能观和语言经济原则[J].当代语言学,1980(4):4-12. 被引量：87
2Altmann, G. Prolegomena to Menzerath’s Law [ J]. Glottometrika, 1980,(2) : 1 - 10.
3Altmann, G. Zur Funktionalanalyse in der Linguistik [ A]. J. Esser & A. Hilbler. Forms and Functions [ C].Tubingen: Gunter Narr Verlag, 1981. 25 -32.
4Aronoff, M. & K. Fudeman. What is Morphology^ [ M]. Oxford: John Wiley & Sons, Ltd. 2011.
5Best, K. Frequenz und L^nge von Wortem [ A]. Cemivci. Problems of Typological and Quantitative Lexicology :A Collection of Papers [ C]. Chemivtsi : Ruta,2007. 83 -90.
6Coady, J. & T. Huckin. Second Language Vocabulary Acquisition [ C] . Cambridge: Cambridge University Press,1997.
7Flowerdew, J. & M. Mahlberg. Lexical Cohesion and Corpus Linguistics [ C]. Amsterdam: John Benjamins Pub-lishing Company, 2009.
8Grzybek, P. & G. Altmann. Oscillation in the frequency-length relationship [ J] . Glottometrics,2003,(5) : 97-107.
9Guiraud, P. Les Caract^res Statistiques du Vocabulaire. Essai de m^thodologie [M]. Paris: Presses Universitairesde France, 1954.
10Hoey, M. Patterns of Lexis in Text [ M]. Oxford : Oxford University Press, 1996.

共引文献47

1郭书杰.基于快速边界攻击的黑盒对抗样本生成方法[J].计算机系统应用,2020,29(12):216-221. 被引量：2
2丛进,王东海.计量与认知:汉语词汇形式结构的实证研究范式[J].南开语言学刊,2022(1):156-164.
3杜小虎,吴宏明,易子博,李莎莎,马俊,余杰.文本对抗样本攻击与防御技术综述[J].中文信息学报,2021,35(8):1-15. 被引量：6
4宋宇,李治霖,程超.基于CNN-BILSTM的工业控制系统ARP攻击入侵检测方法[J].计算机应用研究,2020,37(S02):242-244. 被引量：14
5刘逸凡.基于计量风格学的杨绛记叙散文风格研究[J].汉字文化,2022(19):139-141.
6张瑛,赵雪.官方微博与门户网站新闻语体的计量对比分析[J].理论与现代化,2014(4):107-111. 被引量：2
7王天剑.基于语料库的英文软件EULA格式与语言分析[J].河北北方学院学报（社会科学版）,2015,31(1):12-16. 被引量：1
8李甜,侯敏.字母词形式特征分析[J].唐山师范学院学报,2015,37(4):39-42.
9戴雪婷,梁怡洲,瞿云华.汉语公式化序列长度和频数关系的协同理论研究[J].浙江外国语学院学报,2016(6):24-31.
10刘艳春,王小帆.小说和传记语体多特征对比分析[J].江汉学术,2018,37(1):120-128. 被引量：5

1詹世忠.“三大法宝”视角下闽赣苏区前后期比较[J].福建党史月刊,2024(6):52-55.
2李胜辉,吕建伟,朱梦艳,赵凯,董殿瑞,刘杨.钱塘江新建大桥钢桁梁加劲弦安装关键技术研究[J].浙江交通职业技术学院学报,2024,25(2):12-16.
3赫磊,解子昂,王培安.基于多准则决策方法的避难场所选址模型研究[J].灾害学,2024,39(3):160-166.
4黄樊晶,吴盘龙,李星秀,赵若涵,何山.考虑执行能力约束的多机协同目标分配AEPSO算法[J].宇航学报,2024,45(6):948-957.
5贺二路,吴向博,刘丽哲,国晓博,杨晓鹏,李皓.基于深度学习的网络基线与加密流量分类技术[J].网络空间安全科学学报,2024,2(2):76-85.

软件学报

2024年第7期

浏览历史

内容加载中请稍等...

基于掩码语言模型的中文BERT攻击方法

参考文献4

二级参考文献36

共引文献47

相关作者

相关机构

相关主题

浏览历史