在基于隐马尔可夫模型的语音合成说话人自适应中,通常的最大似然线性回归(Maximum likelihoad linear regression,MLLR)方法在自适应后的音质和相似度等方面与原始语音仍有一定的差距。为了改善说话人自适应的效果,本文从识别的理论出发...在基于隐马尔可夫模型的语音合成说话人自适应中,通常的最大似然线性回归(Maximum likelihoad linear regression,MLLR)方法在自适应后的音质和相似度等方面与原始语音仍有一定的差距。为了改善说话人自适应的效果,本文从识别的理论出发,将结构化最大后验概率准则(Structure maximum aposteriori probability,SMAP)应用到语音合成的说话人自适应中,并将MLLR,MAP,SMAP等方法结合使用。通过一系列对参数、数据选取等实验,本文探讨了在语音合成中如何更好地提高说话人自适应后的音质和相似度。实验表明,在结合使用最大后验概率相关准则后,说话人自适应可以取得比MLLR更好的效果。展开更多
文摘在基于隐马尔可夫模型的语音合成说话人自适应中,通常的最大似然线性回归(Maximum likelihoad linear regression,MLLR)方法在自适应后的音质和相似度等方面与原始语音仍有一定的差距。为了改善说话人自适应的效果,本文从识别的理论出发,将结构化最大后验概率准则(Structure maximum aposteriori probability,SMAP)应用到语音合成的说话人自适应中,并将MLLR,MAP,SMAP等方法结合使用。通过一系列对参数、数据选取等实验,本文探讨了在语音合成中如何更好地提高说话人自适应后的音质和相似度。实验表明,在结合使用最大后验概率相关准则后,说话人自适应可以取得比MLLR更好的效果。