-
题名一种稀少训练数据条件下的语音转换算法
被引量:1
- 1
-
-
作者
徐宁
杨震
-
机构
南京邮电大学通信与信息工程学院
南京邮电大学信号处理与传输研究院
-
出处
《南京邮电大学学报(自然科学版)》
2010年第5期1-7,共7页
-
文摘
提出了一种新的语音说话人转换算法,利用变分贝叶斯方法估计高斯混合模型参数,进而将其应用于语音转换的声道谱参数映射过程,实现说话人身份转换。将变分贝叶斯算法用于模型参数的估计,一方面解决了训练数据量稀少情况下容易使模型产生"过拟合"的问题,另一方面通过将模型参数概率化,使得参数估计问题不再是"点估计",而成为了"全局估计",因此在一定程度上提高了模型的精度。主观和客观实验结果表明:将基于变分贝叶斯估计得到的统计模型用于语音声道谱参数的转换,明显提高了在训练数据稀少的情况下系统的鲁棒性,同时转换后语音的音质和说话人个性特征均优于经典的语音转换系统。
-
关键词
变分贝叶斯估计
高斯混合模型
语音转换
声道谱参数
稀少训练数据
-
Keywords
variational Bayesian
Gaussian mixture model
voice conversion
spectral mapping
sparse data
-
分类号
TN912.34
[电子电信—通信与信息系统]
-