基于STRAIGHT模型的语音转换系统研究

Research on Speech Conversion System Based on STRAIGHT Model

下载PDF

导出

摘要语音转换是将源说话人的个性特征转换为目标说话人个性特征的过程。主要研究了基于STRAIGHT模型的语音转换系统原理及实现过程。通过STRAIGHT模型提取目标语音和源语音的基本频率以及平滑的声道频谱作为特征参数,并将声道频谱转换为LSF参数,进行时间对齐和GMM训练。从实验结果数据分析可以看出:由STRAIGHT模型提取的参数很好地避免了声道谱过平滑的现象,合成后的目标语音与源语音的相似度较高。 Speech conversion is the process of transforming the personality characteristics of the source speaker into the personality characteristics of the target speaker.This paper mainly studies the principle and implementation process of speech conversion system based on STRAIGHT model.The STRAIGHT model is used to extract the basic frequency and smooth channel spectrum of target and source speech as feature parameters,and the channel spectrum is converted into LSF parameters for time alignment and GMM training.The data analysis of the experimental results shows that the parameters extracted by the STRAIGHT model can avoid the phenomenon of too smooth channel spectrum,and the synthesized target speech has a high similarity with the source speech.

作者祝琼珂王光艳江淇罗雨章 ZHU Qiongke;WANG Guangyan;JIANG Qi;LUO Yuzhang

机构地区天津商业大学信息工程学院通信工程系天津商业大学信息工程学院

出处《山西科技》 2020年第5期60-66,共7页 Shanxi Science and Technology

基金国家级大学生创新创业训练计划项目(项目编号:201810069005)。

关键词语音转换 STRAIGHT模型 GMM LSF参数 speech conversion STRAIGHT model GMM LSF parameter

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1王民,苏利博,王稚慧,要趁红.采用STRAIGHT模型和深度信念网络的语音转换方法[J].计算机工程与科学,2016,38(9):1950-1954. 被引量：4
2马一男,李沛东,陈群,严秋,万永菁.基于矢量量化算法的语音转换关键技术研究[J].中国科技纵横,2016,0(15):29-31. 被引量：2
3俞一彪,曾道建,姜莹.采用独立说话人模型的语音转换[J].声学学报,2012,37(3):346-352. 被引量：8
4宋鹏,王浩,赵力.采用模型自适应的语音转换方法[J].信号处理,2013,29(10):1294-1299. 被引量：2

二级参考文献27

1Abe M, Nakamura S, Shikano K, et al. Voice conversionthrough vector quantization [ C ]. In: Acoustics, Speechand Signal Processing ( ICASSP),1988 IEEE Interna-tional Conference on. 1988 : 655-658.
2Stylianou Y, Cappe 0,Moulines E. Continuous probabi-listic transform for voice conversion [ J]. IEEE Transac-tions on Speech and Audio Processing, 1998, 6(2) :131-142.
3Kain A, Macon M W. Spectral voice conversion for text- to-speech synthesis [ C ]. In: Acoustics, Speech and Sig- nal Processing (ICASSP), 1998 IEEE International Con- ference on. 1998 : 285-288.
4Toda T, Saruwatari H, Shikano K. Voice conversion al-gorithm based on Gaussian mixture model with dynamicfrequency warping of STRAIGHT spectrum [ C] . In: A-coustics, Speech and Signal Processing ( ICASSP) , 2001IEEE International Conference on. 2001 : 841-844.
5Godoy E, Rosec 0,Chonavel T. Voice conversion usingdynamic frequency warping with amplitude scaling, forparallel or nonparallel corpora [ J]. Audio, Speech,andLanguage Processing, IEEE Transactions on, 2012: 20(4):1313-1323.
6Qiao Y, Saito D, Minematsu N. HMM-based sequence-to-frame mapping for voice conversion [ C] . In: Acous-tics, Speech and Signal Processing ( ICASSP) , 2010IEEE International Conference on. 2010. 4830-4833.
7Desai S, Black A, Yegnanarayana B, et al. Spectralmapping using artificial neural networks for voice conver-sion [J], Audio, Speech, and Language Processing,IEEE Transactions on, 2010, 18(5) :954-964.
8Mouchtaris A, Van der Spiegel J, Mueller P. Nonparalleltraining for voice conversion based on a parameter adapta-tion approach [ J ] . Audio,Speech,and Language Pro-cessing, IEEE Transactions on, 2006, 14(3) :952-963.
9Popa V,Silen H, Nurminen J, et al. Local linear trans-formation for voice conversion [ C ]. In: Acoustics,Speech and Signal Processing ( ICASSP),2012 IEEE In-ternational Conference on. 2012 ; 4517-4520.
10徐小峰,俞一彪.基于说话人独立建模的语音转换系统研究[J].信号处理,2009, 25(8A) :171-174.

共引文献12

1潘梦鹞,吕小勇,陈少伟,郇锐铁,王锋.基于AI智能语音技术线上教学的创新与实践[J].创新创业理论研究与实践,2022(24):170-173. 被引量：1
2简志华,王向文.采用压缩感知的改进的语音转换算法[J].声学学报,2014,39(3):400-406. 被引量：5
3JIAN Zhihua,WANG Xiangwen.A modified voice conversion algorithm using compressed sensing[J].Chinese Journal of Acoustics,2014,33(3):323-333. 被引量：8
4李阳春,俞一彪.倒谱本征空间结构化高斯混合模型语音转换方法[J].声学学报,2015,40(1):12-19. 被引量：9
5李娜,曾向阳,乔宇,李志锋.采用动态核特征及贝叶斯最大后验估计的语音转换方法[J].声学学报,2015,40(3):455-461. 被引量：2
6LI Yangchun,YU Yibiao.Voice conversion using structured Gaussian mixture model in cepstrum eigenspace[J].Chinese Journal of Acoustics,2015,34(3):325-336. 被引量：2
7车滢霞,俞一彪.约束条件下的结构化高斯混合模型及非平行语料语音转换[J].电子学报,2016,44(9):2282-2288. 被引量：3
8周健,窦云峰,刘荣敏,王华彬,陶亮.采用低维特征映射的耳语音向正常音转换[J].声学学报,2018,43(5):855-863. 被引量：2
9黄国捷,金慧,俞一彪.增强变分自编码器做非平行语料语音转换[J].信号处理,2018,34(10):1246-1251. 被引量：3
10张筱,张巍,王文浩,万永菁.基于多谱特征生成对抗网络的语音转换算法[J].计算机工程与科学,2020,42(5):893-901. 被引量：4

1刘晗,刘安宁,李玉宏.XPLANE技术评价经皮介入封堵房间隔缺损前后右心室功能[J].中国医学影像技术,2020,36(6):844-848. 被引量：2
2赵普志,李洪渊.基于物联网的GOE高压套管多元状态监测研究[J].自动化与仪表,2020,35(7):63-67.
3张石磊,简志华,孙闽红,钟华,刘二小.采用联合字典优化的噪声鲁棒性语音转换算法[J].声学学报,2019,44(6):1074-1082. 被引量：1
4刘焕淋,杜理想,陈勇,胡会霞.串扰感知的空分弹性光网络频谱转换器稀疏配置和资源分配方法[J].电子与信息学报,2020,42(7):1718-1725. 被引量：12
5全列,张广辉.某双轴燃气轮机动力透平异常振动诊断[J].燃气轮机技术,2020,33(2):54-58. 被引量：2
6肖诗颖,汪梦甫.基于频响函数的高阻尼混凝土悬臂梁试验分析[J].地震工程与工程振动,2020,40(3):158-165. 被引量：1

山西科技

2020年第5期

浏览历史

内容加载中请稍等...

基于STRAIGHT模型的语音转换系统研究

参考文献4

二级参考文献27

共引文献12

相关作者

相关机构

相关主题

浏览历史