-
题名基于特征压缩和残差网络的语音重放检测
- 1
-
-
作者
陈露
周欣
陈洪刚
何小海
王正勇
卿粼波
-
机构
四川大学电子信息学院
中国信息安全测评中心
-
出处
《智能计算机与应用》
2021年第11期54-58,63,共6页
-
基金
四川省科技计划项目(2018HH0143)
四川省教育厅项目(18ZB0355)
-
文摘
目前的语音重放攻击检测系统中,绝大部分性能良好的系统采用的特征和网络模型的数据量都很大,训练速度慢、对设备要求高。因此本文提出了一种基于CQT(Constant Q Transform)变换的时间帧压缩方法,以减小特征尺寸和网络模型参数量,从而加快训练速度、降低设备要求。首先,将语音信号的CQT谱在时间帧维度上压缩,得到一维特征,成百倍地减少特征数据量;其次,对应设计一维小型残差网络模型,以辅助进一步减少数据量;最后,在ASVspoof2019挑战赛的PA数据集上训练并测试网络模型性能。实验结果表明,本文的特征提取算法和网络模型,相比挑战赛的基线系统以及其他特征-模型的性能有明显提升,t-DCF为0.1051,EER为3.74%,并且训练速度快、设备要求低。
-
关键词
CQT变换
语音重放攻击检测
特征提取
时间帧压缩
小型残差网络
-
Keywords
CQT transformation
speech replay attack detection
feature extraction
time frame compression
small residual network
-
分类号
TN912.3
[电子电信—通信与信息系统]
-