-
题名基于平均模型和误差削减网络的语声转换系统
- 1
-
-
作者
王媛媛
王新宇
张明阳
周锋
赵力
-
机构
盐城工学院信息工程学院
新加坡国立大学电子与计算机工程系
东南大学信息科学与工程学院
-
出处
《应用声学》
CSCD
北大核心
2023年第3期620-626,共7页
-
基金
国家自然科学基金项目(61673108,62076215)
江苏省高等学校自然科学研究重大项目(19KJA110002)。
-
文摘
现阶段用于语声转换的深度学习方法多是通过使用大量的训练数据来生成高质量的语声。该文提出了一种基于平均模型和误差削减网络的语声转换框架,可用于有限数量的训练数据。首先,基于CBHG网络的平均模型使用排除源说话人和目标说话人的多说话人语声数据进行训练;然后,在有限数量的目标语声数据下对平均模型执行自适应训练;最后,提出一种误差削减网络,可以进一步改善转换后语声的质量。实验表明,所提出的语声转换框架可以灵活地处理有限的训练数据,并且在客观和主观评估方面均优于传统框架。
-
关键词
语声转换
CBHG
平均模型
误差削减网络
-
Keywords
Voice conversion
CBHG
Average model
Error reduction network
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名语声转换技术发展及展望
被引量:3
- 2
-
-
作者
简志华
杨震
-
机构
南京邮电大学信号处理与传输研究院
-
出处
《南京邮电大学学报(自然科学版)》
2007年第6期88-94,共7页
-
基金
江苏省青蓝工程(QL003YZ)资助项目
-
文摘
语声转换通过改变语音信号的声学特征参数来调整语音的个性特征,从而使得转换后的源说话人语音听起来就像是目标说话人的声音一样。系统地介绍了当前语声转换技术的发展状况,在描述语声转换技术的应用场景和系统框架的基础上,着重阐述了系统的转换模块,即声道特性的转换和韵律转换,特别是重点介绍了声道特性的转换算法。简要地介绍了系统性能的测试方法,最后对全文进行了总结,并针对当前语声转换技术还存在的一些问题,对未来的发展进行了展望。
-
关键词
语音处理
语声转换
声道特性
韵律信息
-
Keywords
Speech processing
Voice conversion
Vocal tract characteristic
Prosody information
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于维特比算法的语声转换
被引量:2
- 3
-
-
作者
简志华
杨震
-
机构
杭州电子科技大学通信工程学院
南京邮电大学通信与信息工程学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2009年第7期1470-1475,共6页
-
基金
国家863高技术研究发展计划重点项目(No.2006AA010102)
-
文摘
本文提出了一种基于Viterbi搜索的语声转换算法,利用目标语音帧的转移概率矩阵来描述语音帧的时序信息,通过Viterbi搜索算法来寻找每帧语音的最佳GMM分量,它避免了传统的基于GMM的语声转换算法因丢失语音帧的时序信息所造成的频谱帧间不连续,同时也减少了因加权求平均所带来的语音频谱过于平滑,增强了共振峰.客观评测和主观测试的实验结果都表明,本文算法改善了传统的基于GMM的语声转换算法的性能.
-
关键词
语音处理
语声转换
韵律转换
维特比算法
-
Keywords
speech processing
voice conversion
prosody transfonnation
Viterbi algorithm
-
分类号
TN911.23
[电子电信—通信与信息系统]
-
-
题名基于混合线性变换的语声转换算法
被引量:2
- 4
-
-
作者
简志华
杨震
-
机构
南京邮电大学信号与信息处理研究所
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2007年第7期1700-1702,共3页
-
基金
江苏省青蓝工程项目(QL003YZ)资助课题
-
文摘
针对在没有对称语音库的情况下,该文提出了一种基于混合线性变换的语声转换算法,在最大似然估计准则下,使用EM迭代算法计算变换函数的参量。为了减小线性加权对语音谱包络的平滑作用,使用线性调频Z变换来调节语音信号的LPC系数。客观评测和主观感受的实验结果都表明,基于混合线性变换的语声转换算法也可以取得与传统语声转换技术相当的转换效果,解除了传统语声转换技术需要对称语音库的要求。
-
关键词
语声转换
混合线性变换
最大期望算法
线性调频Z变换
-
Keywords
Voice conversion
Ms-LT
EM algorithm
Chirp Z-transform
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于音素分类的汉语语声转换算法
被引量:1
- 5
-
-
作者
李燕萍
张玲华
丁辉
-
机构
南京邮电大学通信与信息工程学院
嘉兴学院数学与信息工程学院
-
出处
《南京邮电大学学报(自然科学版)》
2011年第1期10-15,38,共7页
-
基金
国家自然科学基金(60872105)
南京邮电大学引进人才基金(NY209004)
浙江省自然科学基金(Y1090649)资助项目
-
文摘
提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。
-
关键词
语声转换
音素分类
汉语元音映射
高斯混合模型
-
Keywords
voice conversion
phoneme classification
chinese vowel mapping
gaussian mixture model
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名一种用于语声转换系统的LPC残差信号生成算法
被引量:1
- 6
-
-
作者
简志华
杨震
-
机构
南京邮电大学信号处理与传输研究院
-
出处
《信号处理》
CSCD
北大核心
2008年第5期762-765,共4页
-
基金
江苏省青蓝工程项目资助
编号QL003YZ
-
文摘
残差信号中的基音信息对语音的说话人个性特征有着重要的影响。本文首先通过转换后的语音谱包络特征参数(LSP)来预测相应的目标基音周期,再利用预测的目标基音周期来修改源语音的残差信号,从而生成所需要的目标语音残差信号。客观评测和主观听觉测试都表明,本文的残差信号生成算法(PP+DCT,Pitch Prediction+Discrete Cosine Trans- form)性能要好于以往的残差预测法。
-
关键词
语音处理
语声转换
残差信号
基音预测
离散余弦变换
-
Keywords
Speech processing
Voice conversion
Residual signal
Pitch prediction
DCT
-
分类号
TN713
[电子电信—电路与系统]
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的GMM模型语声转换系统
被引量:2
- 7
-
-
作者
申毅
简志华
杨震
-
机构
南京邮电大学信号处理与传输研究院
-
出处
《南京邮电大学学报(自然科学版)》
2007年第5期11-15,21,共6页
-
基金
江苏省"青蓝工程"基金(QL003YZ)资助项目
-
文摘
传统的基于GMM模型线性语音转换系统在语音转换阶段,由于转换函数的概率加权组合使合成语音共振峰带宽变宽,谱包络过于平滑。文中提出依据后验概率大小和前后语音的相关性,选择部分转换分量函数进行语音转换。实验表明不仅简化了语音转换,而且经过转换的语音质量也有一定的提高,对语音的实时转换有重要的意义。
-
关键词
语音处理
语声转换
韵律转换
高斯混合模型
-
Keywords
Speech processing
Voice conversion
Prosody modification
Gaussian mixture model
-
分类号
TN912.3
[电子电信—通信与信息系统]
-