期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于平均模型和误差削减网络的语声转换系统
1
作者 王媛媛 王新宇 +2 位作者 张明阳 周锋 赵力 《应用声学》 CSCD 北大核心 2023年第3期620-626,共7页
现阶段用于语声转换的深度学习方法多是通过使用大量的训练数据来生成高质量的语声。该文提出了一种基于平均模型和误差削减网络的语声转换框架,可用于有限数量的训练数据。首先,基于CBHG网络的平均模型使用排除源说话人和目标说话人的... 现阶段用于语声转换的深度学习方法多是通过使用大量的训练数据来生成高质量的语声。该文提出了一种基于平均模型和误差削减网络的语声转换框架,可用于有限数量的训练数据。首先,基于CBHG网络的平均模型使用排除源说话人和目标说话人的多说话人语声数据进行训练;然后,在有限数量的目标语声数据下对平均模型执行自适应训练;最后,提出一种误差削减网络,可以进一步改善转换后语声的质量。实验表明,所提出的语声转换框架可以灵活地处理有限的训练数据,并且在客观和主观评估方面均优于传统框架。 展开更多
关键词 语声转换 CBHG 平均模型 误差削减网络
下载PDF
语声转换技术发展及展望 被引量:3
2
作者 简志华 杨震 《南京邮电大学学报(自然科学版)》 2007年第6期88-94,共7页
语声转换通过改变语音信号的声学特征参数来调整语音的个性特征,从而使得转换后的源说话人语音听起来就像是目标说话人的声音一样。系统地介绍了当前语声转换技术的发展状况,在描述语声转换技术的应用场景和系统框架的基础上,着重阐述... 语声转换通过改变语音信号的声学特征参数来调整语音的个性特征,从而使得转换后的源说话人语音听起来就像是目标说话人的声音一样。系统地介绍了当前语声转换技术的发展状况,在描述语声转换技术的应用场景和系统框架的基础上,着重阐述了系统的转换模块,即声道特性的转换和韵律转换,特别是重点介绍了声道特性的转换算法。简要地介绍了系统性能的测试方法,最后对全文进行了总结,并针对当前语声转换技术还存在的一些问题,对未来的发展进行了展望。 展开更多
关键词 语音处理 语声转换 声道特性 韵律信息
下载PDF
基于维特比算法的语声转换 被引量:2
3
作者 简志华 杨震 《电子学报》 EI CAS CSCD 北大核心 2009年第7期1470-1475,共6页
本文提出了一种基于Viterbi搜索的语声转换算法,利用目标语音帧的转移概率矩阵来描述语音帧的时序信息,通过Viterbi搜索算法来寻找每帧语音的最佳GMM分量,它避免了传统的基于GMM的语声转换算法因丢失语音帧的时序信息所造成的频谱帧间... 本文提出了一种基于Viterbi搜索的语声转换算法,利用目标语音帧的转移概率矩阵来描述语音帧的时序信息,通过Viterbi搜索算法来寻找每帧语音的最佳GMM分量,它避免了传统的基于GMM的语声转换算法因丢失语音帧的时序信息所造成的频谱帧间不连续,同时也减少了因加权求平均所带来的语音频谱过于平滑,增强了共振峰.客观评测和主观测试的实验结果都表明,本文算法改善了传统的基于GMM的语声转换算法的性能. 展开更多
关键词 语音处理 语声转换 韵律转换 维特比算法
下载PDF
基于混合线性变换的语声转换算法 被引量:2
4
作者 简志华 杨震 《电子与信息学报》 EI CSCD 北大核心 2007年第7期1700-1702,共3页
针对在没有对称语音库的情况下,该文提出了一种基于混合线性变换的语声转换算法,在最大似然估计准则下,使用EM迭代算法计算变换函数的参量。为了减小线性加权对语音谱包络的平滑作用,使用线性调频Z变换来调节语音信号的LPC系数。客观评... 针对在没有对称语音库的情况下,该文提出了一种基于混合线性变换的语声转换算法,在最大似然估计准则下,使用EM迭代算法计算变换函数的参量。为了减小线性加权对语音谱包络的平滑作用,使用线性调频Z变换来调节语音信号的LPC系数。客观评测和主观感受的实验结果都表明,基于混合线性变换的语声转换算法也可以取得与传统语声转换技术相当的转换效果,解除了传统语声转换技术需要对称语音库的要求。 展开更多
关键词 语声转换 混合线性变换 最大期望算法 线性调频Z变换
下载PDF
基于音素分类的汉语语声转换算法 被引量:1
5
作者 李燕萍 张玲华 丁辉 《南京邮电大学学报(自然科学版)》 2011年第1期10-15,38,共7页
提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段... 提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。 展开更多
关键词 语声转换 音素分类 汉语元音映射 高斯混合模型
下载PDF
一种用于语声转换系统的LPC残差信号生成算法 被引量:1
6
作者 简志华 杨震 《信号处理》 CSCD 北大核心 2008年第5期762-765,共4页
残差信号中的基音信息对语音的说话人个性特征有着重要的影响。本文首先通过转换后的语音谱包络特征参数(LSP)来预测相应的目标基音周期,再利用预测的目标基音周期来修改源语音的残差信号,从而生成所需要的目标语音残差信号。客观评测... 残差信号中的基音信息对语音的说话人个性特征有着重要的影响。本文首先通过转换后的语音谱包络特征参数(LSP)来预测相应的目标基音周期,再利用预测的目标基音周期来修改源语音的残差信号,从而生成所需要的目标语音残差信号。客观评测和主观听觉测试都表明,本文的残差信号生成算法(PP+DCT,Pitch Prediction+Discrete Cosine Trans- form)性能要好于以往的残差预测法。 展开更多
关键词 语音处理 语声转换 残差信号 基音预测 离散余弦变换
下载PDF
改进的GMM模型语声转换系统 被引量:2
7
作者 申毅 简志华 杨震 《南京邮电大学学报(自然科学版)》 2007年第5期11-15,21,共6页
传统的基于GMM模型线性语音转换系统在语音转换阶段,由于转换函数的概率加权组合使合成语音共振峰带宽变宽,谱包络过于平滑。文中提出依据后验概率大小和前后语音的相关性,选择部分转换分量函数进行语音转换。实验表明不仅简化了语音转... 传统的基于GMM模型线性语音转换系统在语音转换阶段,由于转换函数的概率加权组合使合成语音共振峰带宽变宽,谱包络过于平滑。文中提出依据后验概率大小和前后语音的相关性,选择部分转换分量函数进行语音转换。实验表明不仅简化了语音转换,而且经过转换的语音质量也有一定的提高,对语音的实时转换有重要的意义。 展开更多
关键词 语音处理 语声转换 韵律转换 高斯混合模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部