期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
孪生Bi-LSTM模型在语音欺骗检测中的研究 被引量:2
1
作者 甘海林 雷震春 杨印根 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1265-1271,共7页
在语音欺骗检测中,高斯混合模型(Gaussian Mixture Model,GMM)独立地累计所有语音帧的分数,而忽略了每个高斯分量对最终分数的贡献.本文对每个高斯混合模型分量上的分数进行建模,并基于线性频率倒谱系数(Linear Frequency Cepstral Coef... 在语音欺骗检测中,高斯混合模型(Gaussian Mixture Model,GMM)独立地累计所有语音帧的分数,而忽略了每个高斯分量对最终分数的贡献.本文对每个高斯混合模型分量上的分数进行建模,并基于线性频率倒谱系数(Linear Frequency Cepstral Coefficients,LFCC)构建高斯概率特征(Gaussian Probability Features,GPF);结合能够捕捉语音帧的前后依赖关系的双向LSTM和具有强大分类能力的孪生网络,使用孪生双向LSTM(Siamese Bidirectional Long Short-Term Memory,SBi-LSTM)模型进行语音欺骗检测.SBi-LSTM模型进行语音欺骗检测时,首先在真实和欺骗语音数据集上训练得到两个GMM,然后利用GMM计算每条语音的GPF,最后对输入的GPF进行二分类.实验在ASVspoof 2019数据集上进行,实验结果表明SBi-LSTM模型明显优于GMM,逻辑访问场景下min t-DCF和EER分别比GMM的min t-DCF和EER降低了47.62%和48.35%,物理访问场景下分别降低了31.03%和39.69%.SBi-LSTM模型和GMM得分融合后性能有进一步提高,逻辑访问场景下min t-DCF和EER分别比GMM的min t-DCF和EER降低了71.43%和70.62%,物理访问场景下分别降低了34.48%和45.74%. 展开更多
关键词 反欺骗 语音欺骗检测 高斯概率特征 Bi-LSTM 孪生网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部