期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多特征融合的参数再合成语音增强算法
被引量:
2
1
作者
郑晨颖
马建芬
张朝霞
《计算机工程与设计》
北大核心
2023年第8期2367-2373,共7页
针对传统参数再合成语音增强算法中使用单一声学特征进行预测以及非神经网络声码器进行语音合成系统增强性能较差的问题,提出一种基于多特征融合的参数再合成语音增强算法。通过结合注意力机制进行多种声学特征融合,采用融合后的综合特...
针对传统参数再合成语音增强算法中使用单一声学特征进行预测以及非神经网络声码器进行语音合成系统增强性能较差的问题,提出一种基于多特征融合的参数再合成语音增强算法。通过结合注意力机制进行多种声学特征融合,采用融合后的综合特征代替单一特征预测干净语音声学特征;在此基础上,使用神经网络声码器WaveNet声码器合成高质量干净语音。在TIMIT和NOISEX-92语料库上进行实验,实验结果表明,该算法较对比方法得到了更好的增强效果,语音质量和语音可懂度都有相应提高。
展开更多
关键词
语音增强
语音合成
参数再合成
特征融合
注意力机制
WaveNet
声码器
world声码器
下载PDF
职称材料
利用说话人自适应实现基于DNN的情感语音合成
被引量:
4
2
作者
智鹏鹏
杨鸿武
宋南
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2018年第5期673-679,共7页
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用...
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。
展开更多
关键词
情感语音合成
深度神经网络
说话人自适应训练
world声码器
隐马尔可夫模型
下载PDF
职称材料
基于变分自编码的语气语音合成模型
3
作者
王研
吴怡之
《计算机科学与应用》
2020年第12期2159-2167,共9页
语气作为一种重要情感表达信息,对说话人内容的表达起着重要作用。目前语音合成系统缺乏对语气的良好支持,合成语音也表现出乏味、单一的缺点。为了解决上述问题,提高合成语音的自然度,本文将统计参数语音合成(Statistical Parameter Sp...
语气作为一种重要情感表达信息,对说话人内容的表达起着重要作用。目前语音合成系统缺乏对语气的良好支持,合成语音也表现出乏味、单一的缺点。为了解决上述问题,提高合成语音的自然度,本文将统计参数语音合成(Statistical Parameter Speech Synthesis, SSPS)与具有强学习能力的变分自编码(Variational Autoencoder, VAE)模型相结合,以无监督的方式学习说话人潜在的语气信息,再通过加入分类器提高模型语气学习的准确率。我们提出了语气语音合成的系统框架,分为三部分:声学模型、语气模型以及合成模型。待合成的目标文本和语气分别利用声学模型与语气模型重构出的包括基频F0的声学特征。最后,将声学特征输入到WORLD声码器合成出带有目标语气的语音信号。本篇文章使用Blizzard Challenge 2018作为模型训练的语料库,最后通过实验结果表明,所提出的模型具有良好的语气生成性能。
展开更多
关键词
语气
Variational
Autoencoders
语音合成
world声码器
下载PDF
职称材料
题名
基于多特征融合的参数再合成语音增强算法
被引量:
2
1
作者
郑晨颖
马建芬
张朝霞
机构
太原理工大学信息与计算机学院
太原理工大学物理与光电工程学院
出处
《计算机工程与设计》
北大核心
2023年第8期2367-2373,共7页
基金
山西省重点研发计划(高新技术领域)基金项目(201803D121057)
山西省回国留学人员科研基金项目(2017-031)。
文摘
针对传统参数再合成语音增强算法中使用单一声学特征进行预测以及非神经网络声码器进行语音合成系统增强性能较差的问题,提出一种基于多特征融合的参数再合成语音增强算法。通过结合注意力机制进行多种声学特征融合,采用融合后的综合特征代替单一特征预测干净语音声学特征;在此基础上,使用神经网络声码器WaveNet声码器合成高质量干净语音。在TIMIT和NOISEX-92语料库上进行实验,实验结果表明,该算法较对比方法得到了更好的增强效果,语音质量和语音可懂度都有相应提高。
关键词
语音增强
语音合成
参数再合成
特征融合
注意力机制
WaveNet
声码器
world声码器
Keywords
speech enhancement
speech synthesis
parameter resynthesis
feature fusion
attention mechanism
WaveNet vocoder
world
vocoder
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
利用说话人自适应实现基于DNN的情感语音合成
被引量:
4
2
作者
智鹏鹏
杨鸿武
宋南
机构
西北师范大学物理与电子工程学院
出处
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2018年第5期673-679,共7页
基金
国家自然科学基金(11664036
61263036)
甘肃省高等学校科技创新团队项目(2017C-03)~~
文摘
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。
关键词
情感语音合成
深度神经网络
说话人自适应训练
world声码器
隐马尔可夫模型
Keywords
emotional speech synthesis
deep neural network
speak adaptive training
world
vocoder
hidden Markov model
分类号
TN912.33 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于变分自编码的语气语音合成模型
3
作者
王研
吴怡之
机构
东华大学
出处
《计算机科学与应用》
2020年第12期2159-2167,共9页
文摘
语气作为一种重要情感表达信息,对说话人内容的表达起着重要作用。目前语音合成系统缺乏对语气的良好支持,合成语音也表现出乏味、单一的缺点。为了解决上述问题,提高合成语音的自然度,本文将统计参数语音合成(Statistical Parameter Speech Synthesis, SSPS)与具有强学习能力的变分自编码(Variational Autoencoder, VAE)模型相结合,以无监督的方式学习说话人潜在的语气信息,再通过加入分类器提高模型语气学习的准确率。我们提出了语气语音合成的系统框架,分为三部分:声学模型、语气模型以及合成模型。待合成的目标文本和语气分别利用声学模型与语气模型重构出的包括基频F0的声学特征。最后,将声学特征输入到WORLD声码器合成出带有目标语气的语音信号。本篇文章使用Blizzard Challenge 2018作为模型训练的语料库,最后通过实验结果表明,所提出的模型具有良好的语气生成性能。
关键词
语气
Variational
Autoencoders
语音合成
world声码器
分类号
G63 [文化科学—教育学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多特征融合的参数再合成语音增强算法
郑晨颖
马建芬
张朝霞
《计算机工程与设计》
北大核心
2023
2
下载PDF
职称材料
2
利用说话人自适应实现基于DNN的情感语音合成
智鹏鹏
杨鸿武
宋南
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2018
4
下载PDF
职称材料
3
基于变分自编码的语气语音合成模型
王研
吴怡之
《计算机科学与应用》
2020
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部