语音变声器及各种手机变声软件的出现,在提供了极其方便且丰富的娱乐交互体验的同时,也给语音通信带来了新的安全问题。由于其产生的电子伪装语音掩盖了语音本身的个性特征,对现有的说话人识别技术来说是一种挑战,且一旦被犯罪分子利用...语音变声器及各种手机变声软件的出现,在提供了极其方便且丰富的娱乐交互体验的同时,也给语音通信带来了新的安全问题。由于其产生的电子伪装语音掩盖了语音本身的个性特征,对现有的说话人识别技术来说是一种挑战,且一旦被犯罪分子利用,后果将十分严重。因此,伪装语音说话人识别的研究成为当下的研究热点。提出一种针对电子伪装语音的说话人识别方法。对于由手机变声软件产生的电子伪装语音,提取该语音的梅尔倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)作为特征参数,通过动态时间规整(Dynamic Time Warping,DTW)模型进行伪装程度鉴定,再利用矢量量化(Vector Quantization,VQ)模型进行说话人识别,从而设计了DTW与VQ相结合的电子伪装语音说话人识别系统。实验结果表明:该系统能够有效解决VQ说话人识别系统对电子伪装语音识别率过低的问题,识别效果得到了明显改善。展开更多
文摘语音变声器及各种手机变声软件的出现,在提供了极其方便且丰富的娱乐交互体验的同时,也给语音通信带来了新的安全问题。由于其产生的电子伪装语音掩盖了语音本身的个性特征,对现有的说话人识别技术来说是一种挑战,且一旦被犯罪分子利用,后果将十分严重。因此,伪装语音说话人识别的研究成为当下的研究热点。提出一种针对电子伪装语音的说话人识别方法。对于由手机变声软件产生的电子伪装语音,提取该语音的梅尔倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)作为特征参数,通过动态时间规整(Dynamic Time Warping,DTW)模型进行伪装程度鉴定,再利用矢量量化(Vector Quantization,VQ)模型进行说话人识别,从而设计了DTW与VQ相结合的电子伪装语音说话人识别系统。实验结果表明:该系统能够有效解决VQ说话人识别系统对电子伪装语音识别率过低的问题,识别效果得到了明显改善。