-
题名孪生Bi-LSTM模型在语音欺骗检测中的研究
被引量:2
- 1
-
-
作者
甘海林
雷震春
杨印根
-
机构
江西师范大学计算机信息工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第6期1265-1271,共7页
-
基金
国家自然科学基金项目(61662030,62067004)资助
江西省教育厅科学技术研究项目(170205)资助.
-
文摘
在语音欺骗检测中,高斯混合模型(Gaussian Mixture Model,GMM)独立地累计所有语音帧的分数,而忽略了每个高斯分量对最终分数的贡献.本文对每个高斯混合模型分量上的分数进行建模,并基于线性频率倒谱系数(Linear Frequency Cepstral Coefficients,LFCC)构建高斯概率特征(Gaussian Probability Features,GPF);结合能够捕捉语音帧的前后依赖关系的双向LSTM和具有强大分类能力的孪生网络,使用孪生双向LSTM(Siamese Bidirectional Long Short-Term Memory,SBi-LSTM)模型进行语音欺骗检测.SBi-LSTM模型进行语音欺骗检测时,首先在真实和欺骗语音数据集上训练得到两个GMM,然后利用GMM计算每条语音的GPF,最后对输入的GPF进行二分类.实验在ASVspoof 2019数据集上进行,实验结果表明SBi-LSTM模型明显优于GMM,逻辑访问场景下min t-DCF和EER分别比GMM的min t-DCF和EER降低了47.62%和48.35%,物理访问场景下分别降低了31.03%和39.69%.SBi-LSTM模型和GMM得分融合后性能有进一步提高,逻辑访问场景下min t-DCF和EER分别比GMM的min t-DCF和EER降低了71.43%和70.62%,物理访问场景下分别降低了34.48%和45.74%.
-
关键词
反欺骗
语音欺骗检测
高斯概率特征
Bi-LSTM
孪生网络
-
Keywords
anti-spoofing
speech spoofing detection
gaussian probability feature
Bi-LSTM
siamese network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-