传统的基于相关峰的广义互相关算法在混响环境下性能急剧下降,尽管一些优先效应模型被提出以改善其性能,但是这些模型计算复杂且对阈值选取很敏感。该文首先通过协方差矩阵的特征值来分别更新语音的相干函数和噪声的相干函数,随后将语...传统的基于相关峰的广义互相关算法在混响环境下性能急剧下降,尽管一些优先效应模型被提出以改善其性能,但是这些模型计算复杂且对阈值选取很敏感。该文首先通过协方差矩阵的特征值来分别更新语音的相干函数和噪声的相干函数,随后将语音的相干函数与理想相干函数匹配,用于时延差估计。估计出的时延差和噪声的相干函数用于相干与散射信号能量比值(coherent-to-diffuse power ratio,CDR)的估计,最后利用实时估计出来的CDR值进行混响抑制。实验结果表明:该方法的定位误差明显低于传统方法,且混响抑制后的主观语音质量评估(perceptual evaluation of speech quality,PESQ)分数高于对比算法。展开更多
文摘传统的基于相关峰的广义互相关算法在混响环境下性能急剧下降,尽管一些优先效应模型被提出以改善其性能,但是这些模型计算复杂且对阈值选取很敏感。该文首先通过协方差矩阵的特征值来分别更新语音的相干函数和噪声的相干函数,随后将语音的相干函数与理想相干函数匹配,用于时延差估计。估计出的时延差和噪声的相干函数用于相干与散射信号能量比值(coherent-to-diffuse power ratio,CDR)的估计,最后利用实时估计出来的CDR值进行混响抑制。实验结果表明:该方法的定位误差明显低于传统方法,且混响抑制后的主观语音质量评估(perceptual evaluation of speech quality,PESQ)分数高于对比算法。