-
题名基于帧结构的语音对抗样本重点区域扰动分析
- 1
-
-
作者
韩松莘
郭松辉
徐开勇
杨博
于淼
-
机构
战略支援部队信息工程大学
河南省信息安全重点实验室(战略支援部队信息工程大学)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第3期685-700,共16页
-
基金
国家自然科学基金项目(62176265)。
-
文摘
目前针对语音识别模型的对抗攻击主要是在整条语音上添加噪声,扰动范围大且引入了高频噪声.现有研究在一定程度上缩小了扰动范围,但由于语音对抗攻击需要在每帧添加扰动实现对转录结果的控制,限制了扰动范围的进一步降低.针对此问题,从帧结构的角度研究了语音识别系统中的特征提取流程,发现分帧和加窗处理决定了帧结构中重点区域的分布,即帧内各采样点上添加扰动的重要性受采样点所处位置的影响.首先,根据对输入特征的扰动分析结果进行区域划分;然后,为了量化这些采样点对求解对抗样本的重要性,提出了对抗样本空间度量方法和相应的评价指标,并设计了在帧内不同区间上添加扰动的交叉实验,进而确定了扰动添加的重点区域;最后,在多个模型上进行了广泛的实验,表明了在重点区域添加对抗扰动能够缩小扰动范围,为高质量语音对抗样本的生成提出新的角度.
-
关键词
语音识别
对抗攻击
输入特征
扰动分析
对抗样本空间度量
-
Keywords
speech recognition
adversarial attack
input feature
perturbation analysis
adversarial example space metric
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
TP391
[自动化与计算机技术—计算机应用技术]
-