语声转换技术发展及展望被引量：3

An Overview of Voice Conversion

下载PDF

导出

摘要语声转换通过改变语音信号的声学特征参数来调整语音的个性特征,从而使得转换后的源说话人语音听起来就像是目标说话人的声音一样。系统地介绍了当前语声转换技术的发展状况,在描述语声转换技术的应用场景和系统框架的基础上,着重阐述了系统的转换模块,即声道特性的转换和韵律转换,特别是重点介绍了声道特性的转换算法。简要地介绍了系统性能的测试方法,最后对全文进行了总结,并针对当前语声转换技术还存在的一些问题,对未来的发展进行了展望。 Voice conversion attempts to transform the personal characteristics of speech through adapting the acoustic parameters. The object is to make the speech uttered by a particular source speaker sound as if spoken by a designed target speaker. This paper introduces the development of voice conversion techniques in details. Firstly, the application of voice conversion and its system framework are described. Then, current conversion algorithms for the characteristics of vocal tract and prosody are presented, which is the core process of voice conversion. After that, the system performance evaluation methods, including subjective and objective measure, are introduced. Finally, the summary is given with a discussion of some existing problems in the current proposed algorithms.

作者简志华杨震

机构地区南京邮电大学信号处理与传输研究院

出处《南京邮电大学学报（自然科学版）》 2007年第6期88-94,共7页 Journal of Nanjing University of Posts and Telecommunications：Natural Science Edition

基金江苏省青蓝工程(QL003YZ)资助项目

关键词语音处理语声转换声道特性韵律信息 Speech processing Voice conversion Vocal tract characteristic Prosody information

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献41

1GHILDERS D G,WU K,HICKS D M,et al. Voice conversion[ J]. Speech Communication, 1989,8 : 147 - 158.
2KUWABARA H,SAGISAKA Y. Acoustic characteristics of speaker individuality : control and conversion [ J ]. Speech Communication, 1995,16 : 165 - 173.
3QUATIERI T F,MCAULAY R J. Speech transformation based on a sinusoidal representation[ J]. IEEE Trans on Acoustics, Speech, and Signal Processing, 1986,34 ( 6 ) : 1449 - 1464.
4GEORGE E B,SMITH M J T. Speech analysis/synthesis and modification using an analysis-by-synthesis/overlap-add sinusoidal model [ J ]. IEEE Trans on Speech and Audio Processing, 1997,5(5) :389 -406.
5MACON M W,CLEMENTS M A. Sinusoidal modeling and modification of unvoiced speech[J]. IEEE Trans on Speech and Audio Processing, 1997,5(6) :557 - 560.
6SHIKANO K, NAKAMURA S, ABE M. Speaker adaptation and voice conversion by codebook mapping [ C ]// ICASSP. Toronto, Canada, May 14 - 17,1991,1:594 - 597.
7MOUCHTARIS A, NARAYANAN S S, KYRIAKAKIS C. Multichannel audio synthesis by subband-based spectral conversion and parameter adaptation [ J ]. IEEE Trans on Speech and Audio Processing, 2005,13 (2) :263 - 274.
8KAIN A,MACON M W. Spectral voice conversion for text-to-speech synthesis [ C ]// IEEE ICASSP. Seattle, USA, 1998:285 - 288.
9NIELSEN A S, BROCK D P. Speaker recognizability testing for voice coders[ C ]// IEEE ICASSP. Atlanta, 1996,2 : 1149 - 1152.
10LEE C L, CHANG W W, CHIANG Y C. Spectral and prosodic transformations of hearing-impaired Mandarin speech[J]. Speech Communication, 2006,48:207 - 219.

同被引文献18

1简志华,杨震.基于混合线性变换的语声转换算法[J].电子与信息学报,2007,29(7):1700-1702. 被引量：2
2孙卓,岳振军,宋巍.基于LPC及其残差激励模型的汉语语音变换技术[J].军事通信技术,2007,28(2):1-4. 被引量：1
3申毅,简志华,杨震.改进的GMM模型语声转换系统[J].南京邮电大学学报（自然科学版）,2007,27(5):11-15. 被引量：2
4双志伟,Raimo Bakis,秦勇.IBM Voice Conversion Systems for 2007 TC-STAR Evaluation[J].Tsinghua Science and Technology,2008,13(4):510-514. 被引量：2
5孙新建,张雄伟,杨吉斌,曹铁勇,孙健.基于隐变量模型的语音转换方法研究[J].信号处理,2012,28(3):344-351. 被引量：2
6简志华,王向文.一种用于语音转换的区域最近邻迭代训练算法[J].电子与信息学报,2012,34(9):2091-2096. 被引量：1
7孙健,张雄伟,曹铁勇,杨吉斌,孙新建.基于卷积非负矩阵分解的语音转换方法[J].数据采集与处理,2013,28(2):141-148. 被引量：12
8马振,张雄伟,杨吉斌.基于语音个人特征信息分离的语音转换方法研究[J].信号处理,2013,29(4):513-519. 被引量：3
9宋鹏,王浩,赵力.基于混合Gauss归一化的语音转换方法[J].清华大学学报（自然科学版）,2013,53(6):757-761. 被引量：3
10郭通,兰巨龙,李玉峰,江逸茗.基于量子自适应粒子群优化径向基函数神经网络的网络流量预测[J].电子与信息学报,2013,35(9):2220-2226. 被引量：33

引证文献3

1刘廷廷,李珊珊,包堃,乔瑞娟.语音转换特征参数的研究[J].无线互联科技,2014,11(1):154-157.
2董添辉,张玲华.粒子群优化径向基函数网络的语音转换[J].计算机技术与发展,2017,27(5):64-68. 被引量：1
3张雄伟,苗晓孔,曾歆,孙蒙,曹铁勇.语音转换技术研究现状及展望[J].数据采集与处理,2019,34(5):753-770. 被引量：9

二级引证文献10

1潘梦鹞,吕小勇,陈少伟,郇锐铁,王锋.基于AI智能语音技术线上教学的创新与实践[J].创新创业理论研究与实践,2022(24):170-173. 被引量：1
2肖斌,刘洋,翟国富.基于径向基函数神经网络的接触器性能快速算法[J].电器与能效管理技术,2020,0(1):40-45. 被引量：6
3鲍薇,温正棋.声音伪造与防伪检测技术研究[J].信息技术与标准化,2020(1):54-58. 被引量：1
4李智诚,张云翔.面向电力行业的智能会议录音回溯系统[J].现代计算机,2020,26(21):37-39. 被引量：1
5张雄伟,李嘉康,孙蒙,郑琳琳.语音欺骗检测方法的研究现状及展望[J].数据采集与处理,2020,35(5):807-823. 被引量：10
6郑琳琳,张雄伟,孙蒙,李嘉康,张星昱.基于i⁃vector的电子伪装语音鲁棒还原方法研究[J].数据采集与处理,2020,35(5):880-891. 被引量：1
7张雄伟,张星昱,孙蒙,邹霞.说话人验证系统攻击方法的研究现状及展望[J].数据采集与处理,2021,36(5):831-849. 被引量：3
8杨帅,乔凯,陈健,王林元,闫镔.语音合成及伪造、鉴伪技术综述[J].计算机系统应用,2022,31(7):12-22. 被引量：8
9吕汝金,苏庚辰,徐永博.一种智能分类垃圾桶的设计研究[J].机械设计与制造,2022(7):232-234. 被引量：5
10孙丽丽,翟启,张延童,翟洪婷,张庆锐.基于声纹识别的电网调度认证系统设计[J].山东电力技术,2023,50(10):58-65.

1简志华,杨震.基于维特比算法的语声转换[J].电子学报,2009,37(7):1470-1475. 被引量：2
2申毅,简志华,杨震.改进的GMM模型语声转换系统[J].南京邮电大学学报（自然科学版）,2007,27(5):11-15. 被引量：2
3吴建军.一点对多点农村无线通信的发展及展望[J].南京邮电学院学报,1990,10(4):17-20.
4董国梁.移动通信的发展及展望[J].零八一科技,1991(3):43-56.
5孙汉.CDMA技术的发展及展望[J].北京电子,1998(6):29-31.
6谷爱昱,王春茹.DSP在电机控制领域的应用展望[J].微电机,2001,34(2):35-36. 被引量：5
7陈华山,江英.电力电子技术发展及展望[J].电世界,1991,32(6):9-11.
8郝锋钢.电信技术讲座第十二讲宽带IP城域网技术的发展及展望[J].中国有线电视,2001(3):39-44.
9郭伟.光纤放大器的发展及展望[J].电力系统通信,2000,21(4):33-36. 被引量：1
10数字电视发展及展望[J].北京质量与市场,2003(9):18-19.

南京邮电大学学报（自然科学版）

2007年第6期

浏览历史

内容加载中请稍等...

语声转换技术发展及展望被引量：3

参考文献41

同被引文献18

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

语声转换技术发展及展望 被引量：3

参考文献41

同被引文献18

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

语声转换技术发展及展望被引量：3