期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于多特征融合的参数再合成语音增强算法 被引量:2
1
作者 郑晨颖 马建芬 张朝霞 《计算机工程与设计》 北大核心 2023年第8期2367-2373,共7页
针对传统参数再合成语音增强算法中使用单一声学特征进行预测以及非神经网络声码器进行语音合成系统增强性能较差的问题,提出一种基于多特征融合的参数再合成语音增强算法。通过结合注意力机制进行多种声学特征融合,采用融合后的综合特... 针对传统参数再合成语音增强算法中使用单一声学特征进行预测以及非神经网络声码器进行语音合成系统增强性能较差的问题,提出一种基于多特征融合的参数再合成语音增强算法。通过结合注意力机制进行多种声学特征融合,采用融合后的综合特征代替单一特征预测干净语音声学特征;在此基础上,使用神经网络声码器WaveNet声码器合成高质量干净语音。在TIMIT和NOISEX-92语料库上进行实验,实验结果表明,该算法较对比方法得到了更好的增强效果,语音质量和语音可懂度都有相应提高。 展开更多
关键词 语音增强 语音合成 参数再合成 特征融合 注意力机制 WaveNet声码器 world声码器
下载PDF
利用说话人自适应实现基于DNN的情感语音合成 被引量:4
2
作者 智鹏鹏 杨鸿武 宋南 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2018年第5期673-679,共7页
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用... 为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。 展开更多
关键词 情感语音合成 深度神经网络 说话人自适应训练 world声码器 隐马尔可夫模型
下载PDF
基于变分自编码的语气语音合成模型
3
作者 王研 吴怡之 《计算机科学与应用》 2020年第12期2159-2167,共9页
语气作为一种重要情感表达信息,对说话人内容的表达起着重要作用。目前语音合成系统缺乏对语气的良好支持,合成语音也表现出乏味、单一的缺点。为了解决上述问题,提高合成语音的自然度,本文将统计参数语音合成(Statistical Parameter Sp... 语气作为一种重要情感表达信息,对说话人内容的表达起着重要作用。目前语音合成系统缺乏对语气的良好支持,合成语音也表现出乏味、单一的缺点。为了解决上述问题,提高合成语音的自然度,本文将统计参数语音合成(Statistical Parameter Speech Synthesis, SSPS)与具有强学习能力的变分自编码(Variational Autoencoder, VAE)模型相结合,以无监督的方式学习说话人潜在的语气信息,再通过加入分类器提高模型语气学习的准确率。我们提出了语气语音合成的系统框架,分为三部分:声学模型、语气模型以及合成模型。待合成的目标文本和语气分别利用声学模型与语气模型重构出的包括基频F0的声学特征。最后,将声学特征输入到WORLD声码器合成出带有目标语气的语音信号。本篇文章使用Blizzard Challenge 2018作为模型训练的语料库,最后通过实验结果表明,所提出的模型具有良好的语气生成性能。 展开更多
关键词 语气 Variational Autoencoders 语音合成 world声码器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部