-
题名基于矫正理解的中文文本对抗样本生成方法
被引量:1
- 1
-
-
作者
王春东
孙嘉琪
杨文军
-
机构
天津理工大学计算机科学与工程学院
计算机病毒防治技术国家工程实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第2期37-45,共9页
-
基金
国家自然科学基金联合基金项目(U1536122)
国家重点研发计划“科技助力经济2020”重点专项(SQ2020YFF0413781)
+1 种基金
天津市科委重大专项(15ZXDSGX00030)
天津市教委科研计划(2021YJSB252)。
-
文摘
自然语言处理技术在文本分类、文本纠错等任务中表现出强大性能,但容易受到对抗样本的影响,导致深度学习模型的分类准确性下降。防御对抗性攻击是对模型进行对抗性训练,然而对抗性训练需要大量高质量的对抗样本数据。针对目前中文对抗样本相对缺乏的现状,提出一种可探测黑盒的对抗样本生成方法WordIllusion。在数据处理与计算模块中,数据在删除标点符号后输入文本分类模型得到分类置信度,再将分类置信度输入CKSFM计算函数,通过计算比较cksf值选出句子中的关键词。在关键词替换模块中,利用字形嵌入空间和同音字库中的相似词语替换关键词并构建对抗样本候选序列,再将序列重新输入数据处理与计算模块计算cksf值,最终选择cksf值最高的数据作为最终生成的对抗样本。实验结果表明,WordIllusion方法生成的对抗样本在多数深度学习模型上的攻击成功率高于基线方法,在新闻分类场景的DPCNN模型上相比于CWordAttack方法最多高出41.73个百分点,且生成的对抗样本与原始文本相似度很高,具有较强的欺骗性与泛化性。
-
关键词
深度神经网络
自然语言处理
文本分类
对抗样本
矫正理解
-
Keywords
deep neural network
Natural Language Processing(NLP)
text classification
adversarial example
rectification understanding
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-