-
题名增强变分自编码器做非平行语料语音转换
被引量:3
- 1
-
-
作者
黄国捷
金慧
俞一彪
-
机构
苏州大学电子信息学院
-
出处
《信号处理》
CSCD
北大核心
2018年第10期1246-1251,共6页
-
文摘
提出一种增强变分自编码器进行非平行语料语音转换的新方法。源语音首先经过编码网络生成一个服从高斯分布的语音编码,解码网络将该语音编码重构为指定的目标语音,最后通过增强网络优化生成的目标语音。增强网络的一个输入对应一个输出的,这使得整体转换系统有较好的去噪能力。此外,本文还引入了循环训练方法以改善转换语音的目标倾向性。实验结果显示,与基准语音转换系统相比,本文提出的增强变分自编码器语音转换系统在跨性别语音转换上的客观评价指标谱失真上下降10. 3%,在主观评价指标相似度与清晰度方面同样有所改善。这一结果表明,本文提出的方法能够使转换语音具有良好目标倾向性,同时有较好的语音转换质量。
-
关键词
语音转换
增强变分自编码器
非平行语料
-
Keywords
voice conversion
enhanced variational auto-encoder
non-parallel corpora
-
分类号
TN912.33
[电子电信—通信与信息系统]
-