基于矫正理解的中文文本对抗样本生成方法被引量：1

Method for Generating Chinese Text Adversarial Examples Based on Rectification Understanding

下载PDF

导出

摘要自然语言处理技术在文本分类、文本纠错等任务中表现出强大性能,但容易受到对抗样本的影响,导致深度学习模型的分类准确性下降。防御对抗性攻击是对模型进行对抗性训练,然而对抗性训练需要大量高质量的对抗样本数据。针对目前中文对抗样本相对缺乏的现状,提出一种可探测黑盒的对抗样本生成方法WordIllusion。在数据处理与计算模块中,数据在删除标点符号后输入文本分类模型得到分类置信度,再将分类置信度输入CKSFM计算函数,通过计算比较cksf值选出句子中的关键词。在关键词替换模块中,利用字形嵌入空间和同音字库中的相似词语替换关键词并构建对抗样本候选序列,再将序列重新输入数据处理与计算模块计算cksf值,最终选择cksf值最高的数据作为最终生成的对抗样本。实验结果表明,WordIllusion方法生成的对抗样本在多数深度学习模型上的攻击成功率高于基线方法,在新闻分类场景的DPCNN模型上相比于CWordAttack方法最多高出41.73个百分点,且生成的对抗样本与原始文本相似度很高,具有较强的欺骗性与泛化性。 Natural Language Processing(NLP)technology has shown a strong performance in text classification,text error correction,and other tasks.However,it is vulnerable to the impact of adversarial examples,resulting in the decline of the classification accuracy of deep learning models.An effective approach to defending against adversarial attacks is applying adversarial training on the model.However,adversarial training requires a large number of high-quality adversarial example data.Currently,adversarial examples for the Chinese have not been investigated extensively.This study proposes a detectable black-box method called WordIllusion,which can successfully generate adversarial examples.In the data processing and calculation module,first,the data is input into the text classification model after the punctuation is deleted to achieve classification confidence.Next,the classification confidence is input into the CKSFM calculation function,and the keywords in the sentence are selected by calculating and comparing the cksf value.In the keyword replacement module,the keywords are first replaced with similar words in the font-embedded space and homophone library,and a candidate sequence of adversarial samples is built.Subsequently,the sequence is input into the data processing and calculation module to calculate the cksf value.Finally,the data with the highest cksf value is selected as the final generated adversarial samples.The experimental results show that the Attack Success Rate(ASR)of the adversarial samples generated by the WordIllusion method on most deep learning models is higher than that of the baseline methods.For the Deep Pyramid Convolutional Neural Networks(DPCNN)model in the news classification scenario,the ASR of the WordIllusion method is 41.73 percentage points higher than that of the CWordAttack method at the most.In addition,the generated adversarial samples are similar to the original text,which exhibits strong deception and generalization.

作者王春东孙嘉琪杨文军 WANG Chundong;SUN Jiaqi;YANG Wenjun(School of Computer Science and Engineering,Tianjin University of Technology,Tianjin 300384,China;National Engineering Laboratory for Computer Virus Prevention and Control Technology,Tianjin 300384,China)

机构地区天津理工大学计算机科学与工程学院计算机病毒防治技术国家工程实验室

出处《计算机工程》 CAS CSCD 北大核心 2023年第2期37-45,共9页 Computer Engineering

基金国家自然科学基金联合基金项目(U1536122) 国家重点研发计划“科技助力经济2020”重点专项(SQ2020YFF0413781) 天津市科委重大专项(15ZXDSGX00030) 天津市教委科研计划(2021YJSB252)。

关键词深度神经网络自然语言处理文本分类对抗样本矫正理解 deep neural network Natural Language Processing(NLP) text classification adversarial example rectification understanding

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1司逸晨,管有庆.基于Transformer编码器的中文命名实体识别模型[J].计算机工程,2022,48(7):66-72. 被引量：9
2郭可教,杨奇志.汉字认知的“复脑效应”的实验研究[J].心理学报,1995,27(1):78-83. 被引量：33
3仝鑫,王罗娜,王润正,王靖亚.面向中文文本分类的词级对抗样本生成方法[J].信息网络安全,2020(9):12-16. 被引量：11
4王文琦,汪润,王丽娜,唐奔宵.面向中文文本倾向性分类的对抗样本生成方法[J].软件学报,2019,30(8):2415-2427. 被引量：23
5马云霞.英汉语言表达上“替换与重复”的差异对比[J].海外英语,2012(19):247-249. 被引量：1
6姜妍,张立国.面向深度学习模型的对抗攻击与防御方法综述[J].计算机工程,2021,47(1):1-11. 被引量：19
7郑海斌,陈晋音,章燕,张旭鸿,葛春鹏,刘哲,欧阳亦可,纪守领.面向自然语言处理的对抗攻防与鲁棒性分析综述[J].计算机研究与发展,2021,58(8):1727-1750. 被引量：9

二级参考文献20

1卿斯汉.Android安全研究进展[J].软件学报,2016,27(1):45-71. 被引量：107
2刘方园,王水花,张煜东.支持向量机模型与应用综述[J].计算机系统应用,2018,27(4):1-9. 被引量：70
3李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：106
4王红,史金钏,张志伟.基于注意力机制的LSTM的语义关系抽取[J].计算机应用研究,2018,35(5):1417-1420. 被引量：63
5张应成,杨洋,蒋瑞,全兵,张利君,任晓雷.基于BiLSTM-CRF的商情实体识别模型[J].计算机工程,2019,45(5):308-314. 被引量：35
6王文琦,汪润,王丽娜,唐奔宵.面向中文文本倾向性分类的对抗样本生成方法[J].软件学报,2019,30(8):2415-2427. 被引量：23
7陈宇飞,沈超,王骞,李琦,王聪,纪守领,李康,管晓宏.人工智能系统安全与隐私风险[J].计算机研究与发展,2019,56(10):2135-2150. 被引量：48
8殷章志,李欣子,黄德根,李玖一.融合字词模型的中文命名实体识别研究[J].中文信息学报,2019,33(11):95-100. 被引量：39
9张华伟.基于Word2Vec的神经网络协同推荐模型[J].网络空间安全,2019,10(6):25-28. 被引量：2
10覃延.神经网络模型和多元线性回归预测肾结石CT值的比较[J].影像研究与医学应用,2020,4(6):26-28. 被引量：3

共引文献91

1郭书杰.基于快速边界攻击的黑盒对抗样本生成方法[J].计算机系统应用,2020,29(12):216-221. 被引量：2
2杜小虎,吴宏明,易子博,李莎莎,马俊,余杰.文本对抗样本攻击与防御技术综述[J].中文信息学报,2021,35(8):1-15. 被引量：6
3宋宇,李治霖,程超.基于CNN-BILSTM的工业控制系统ARP攻击入侵检测方法[J].计算机应用研究,2020,37(S02):242-244. 被引量：10
4徐德江.开发脑潜能与婴幼儿科学汉字教育[J].教育研究,1999,20(10):54-58. 被引量：4
5王德强.脑功能不对称性研究及其对素质教育的启示[J].河北师范大学学报（教育科学版）,1999,1(2):24-28. 被引量：2
6易洪川.字音特点及其教学策略[J].语言文字应用,1999(4):29-32. 被引量：9
7唐红波.汉字学习与脑开发[J].华南师范大学学报（社会科学版）,1996(4):15-20.
8刘景钊.论汉字认知在促进儿童大脑两半球均衡发展中的作用[J].教育生物学杂志,2013,1(4):245-250. 被引量：4
9李静.全息汉字教育——促进幼儿发展的有效途径[J].学前教育研究,2004(7):35-37. 被引量：3
10徐德江.开发脑潜能与婴幼儿科学汉字教育[J].汉字文化,2000(1):14-19. 被引量：3

同被引文献13

1康晓光,孙龙祥.基于人工神经网络的云自动检测算法[J].解放军理工大学学报（自然科学版）,2005,6(5):506-510. 被引量：16
2马芳,张强,郭铌,张杰.多通道卫星云图云检测方法的研究[J].大气科学,2007,31(1):119-128. 被引量：39
3秦永,付仲良,周凡,陈一祥.一种利用TM影像自动检测云层的方法[J].武汉大学学报（信息科学版）,2014,39(2):234-238. 被引量：11
4霍娟,吕达仁.全天空数字相机观测云量的初步研究[J].南京气象学院学报,2002,25(2):242-246. 被引量：46
5陶法,胡树贞.地基自动云观测技术对比分析[J].气象水文海洋仪器,2017,34(4):1-8. 被引量：4
6夏旻,申茂阳,王舰锋,王阳光.基于卷积神经网络的卫星云图云量计算[J].系统仿真学报,2018,30(5):1623-1630. 被引量：6
7高军,王恺,田晓宇,陈建.基于BP神经网络的风云四号遥感图像云检测算法[J].红外与毫米波学报,2018,37(4):477-485. 被引量：18
8裴亮,刘阳,谭海,高琳.基于改进的全卷积神经网络的资源三号遥感影像云检测[J].激光与光电子学进展,2019,56(5):218-225. 被引量：19
9陈思成,常建华,刘振兴,周妹,孟园园,王博业.基于聚类分析的双阈值激光雷达云层检测算法[J].中国激光,2022,49(11):148-158. 被引量：2
10李晓龙,蔡洪波,黎华丽,魏建彦.基于模糊聚类的大视场地基光学天文图像薄云识别与分析[J].激光与光电子学进展,2022,59(16):161-167. 被引量：1

引证文献1

1车蕾,李磊磊,刘立勇.基于深度学习的全天空相机成像日间云量计算研究[J].天文学进展,2024,42(2):349-361.

1王佳慧.基于CNN与Bi-LSTM混合模型的中文文本分类方法[J].软件导刊,2023,22(1):158-164. 被引量：7
2付昕阳,李仕钿,徐明振,刘远,孙小齐.分腿俯卧位在经皮肾镜碎石术中的应用研究[J].医学理论与实践,2023,36(1):63-65.
3陈海红,司威,黄凤坡.中文文本分类模型对比研究[J].赤峰学院学报（自然科学版）,2023,39(1):12-15.
4王颖洁,张程烨,白凤波,汪祖民,季长清.中文命名实体识别研究综述[J].计算机科学与探索,2023,17(2):324-341. 被引量：14
5巴燕艳.聚焦真问题引发真思考[J].河北教育（教学版）,2022,60(12):52-52.
6董晓泽,隋伟,高飞飞,郎志军,李迅,张晓利.不同管径、不同材质管道回填施工工艺探析[J].散装水泥,2022(6):185-187.
7阮铁锋.关于岩质边坡计算中的参数选用探讨[J].城市道桥与防洪,2023(1):61-63.
8赵晓静,晁旺,张苗,赵澄,卢洁.3D智能管电流调控技术对不同体质指数患者头颈动脉CTA图像质量及辐射剂量的影响[J].医学影像学杂志,2023,33(1):11-15. 被引量：2
9雷群,宋宜强,杜建军.箔片轴承转子系统的非线性动力学特性研究[J].润滑与密封,2023,48(1):8-13.
10郝喜旺.新绛县信义源铁合金有限公司高压补偿方案的论证与研究[J].电力系统装备,2022(11):52-54.

计算机工程

2023年第2期

浏览历史

内容加载中请稍等...

基于矫正理解的中文文本对抗样本生成方法被引量：1

参考文献7

二级参考文献20

共引文献91

同被引文献13

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于矫正理解的中文文本对抗样本生成方法 被引量：1

参考文献7

二级参考文献20

共引文献91

同被引文献13

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于矫正理解的中文文本对抗样本生成方法被引量：1