期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Style-CycleGAN-VC的非平行语料下的语音转换 被引量:3
1
作者 高俊峰 陈俊国 《计算机应用与软件》 北大核心 2021年第9期133-139,159,共8页
非平行语料下的语音转换(Voice Conversion,VC)是指在非平行语音数据集的情况下改变源语音特征到目标语音特征的映射技术。由于非平行数据的缺陷,所以当前研究多集中于平行语料下的语音转换,而有关非平行语料的研究提出的模型架构存在... 非平行语料下的语音转换(Voice Conversion,VC)是指在非平行语音数据集的情况下改变源语音特征到目标语音特征的映射技术。由于非平行数据的缺陷,所以当前研究多集中于平行语料下的语音转换,而有关非平行语料的研究提出的模型架构存在局限性,在特定说话人下进行训练得到的模型无法适用于任意说话人下的语音转换,且转化效果有待提高。对此,借鉴两种生成式对抗网络(Generative Adversarial Network,GAN)的变体StyleGAN和CycleGAN的结构特点,对生成器网络的层重新设计,添加辅助特征提取神经网络,提出一种称为Style-CycleGAN-VC的新模型,实现了非平行语料下任意说话人之间的任意语音转换。实验表明,与CycleGAN-VC模型相比,该模型对训练的特定说话人的语音转换效果有所提高,对任意说话人的语音转换效果与其相近。 展开更多
关键词 语音转换 非平行语料 生成式对抗网络 style-cyclegan-vc 语音合成
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部