摘要
针对梅尔倒谱系数特征难以满足短语音说话人确认的问题,本文从同样是模仿人耳听觉机理的伽马通滤波器为基础,提出让抗噪性能更佳的伽马通频率倒谱系数作为输入特征。首先,在短语音条件下,提取伽马通频率倒谱系数,采用加减特征分量法计算其不同维数的贡献度大小。其次,选取其中贡献较高的分量作为特征,保留那些最能表征不同说话人之间差异的维数,直接实现了特征参数降维。最后,采用多种特征及其混合,通过i-vector说话人确认系统验证伽马通频率倒谱系数在短语音下的有效性。实验数据表明,不同测试语音长度条件下,相较其他声学及衍生特征,伽马通频率倒谱系数具有较强短语音的表征能力,单独使用或融合其他参数都进一步提升识别等误差率。
作者
瞿于荃
龙华
段荧
Qu Yuquan;Long Hua;Duan Ying