-
题名融合LSTM-GRU网络的语音逻辑访问攻击检测
- 1
-
-
作者
杨海涛
王华朋
牛瑾琳
楚宪腾
林暖辉
-
机构
中国刑事警察学院公安信息技术与情报学院
广州市刑事科学技术研究所
-
出处
《数据采集与处理》
CSCD
北大核心
2022年第2期396-404,共9页
-
基金
国家重点研发计划(2017YFC0821000)
广州市科技计划(2019030004)
+2 种基金
辽宁网络安全执法协同创新中心(WXZX-201807003)
司法部司法鉴定重点实验室(司法鉴定科学研究院)开放基金
中国刑事警察学院研究生创新能力提升项目。
-
文摘
为进一步提高语音欺骗检测的准确率,提出一种融合LSTM-GRU网络的语音逻辑访问攻击(语音转换、语音合成)检测方法。融合LSTM-GRU网络是由长短期记忆网络(Long short-term memory,LSTM)层、门控循环神经单元(Gated recurrent unit,GRU)层、丢弃层、批归一化层和全连接层串联结合的一种混合网络,其中LSTM层可以解决语音序列中的长时依赖问题,GRU层则可降低模型参数量。实验在ASVspoof2019 LA数据集上进行,提取20维的梅尔倒谱系数特征用于模型训练,在测试阶段使用训练好的LSTM-GRU模型对测试集中的语音进行欺骗检测。与GRU网络及LSTM网络的比较结果表明:LSTM-GRU网络在3种网络模型中正确识别率最高,等错误率(Equal error rate,EER)比ASVspoof2019挑战赛所提供基线系统低27.07%,对逻辑访问攻击语音检测的平均准确率达到98.04%,并且融合LSTM-GRU网络具备训练时间短、防止过拟合及稳定性高等优点。结果证明本文方法可有效应用于语音逻辑访问攻击检测任务中。
-
关键词
逻辑访问攻击
梅尔倒谱系数
等错误率
LSTM-GRU网络
-
Keywords
logical access attack
Mel-frequency cepstral coefficients
equal error rate
LSTM-GRU network
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TN912.3
[电子电信—通信与信息系统]
-