改进的GMM模型语声转换系统被引量：2

A Modified Method for Voice Conversion Based on GMM

下载PDF

导出

摘要传统的基于GMM模型线性语音转换系统在语音转换阶段,由于转换函数的概率加权组合使合成语音共振峰带宽变宽,谱包络过于平滑。文中提出依据后验概率大小和前后语音的相关性,选择部分转换分量函数进行语音转换。实验表明不仅简化了语音转换,而且经过转换的语音质量也有一定的提高,对语音的实时转换有重要的意义。　For the traditional GMM-based linear voice conversion system,due to the probability weighted combination of conversion function,the resonant peak width of composite voice is broaden and the spectral envolop is flat.The autors propose to convert voice using partral conversion component function according to posterior probability and correlation of adjacent voice signals.The experiments have prove that the voice conversion is simplified and the converted voice quality is improved.It is important for real-time conversion of voice.

作者申毅简志华杨震

机构地区南京邮电大学信号处理与传输研究院

出处《南京邮电大学学报（自然科学版）》 2007年第5期11-15,21,共6页 Journal of Nanjing University of Posts and Telecommunications：Natural Science Edition

基金江苏省"青蓝工程"基金(QL003YZ)资助项目

关键词语音处理语声转换韵律转换高斯混合模型 Speech processing Voice conversion Prosody modification Gaussian mixture model

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献11

1ABE M, NAKAMURA S, SHIKANO K, et al. Voice Conversion through Vector Quantization [ C ]//IEEE Proceedings of ICASSP. New York, 1988:565 - 568.
2VALBRET H, MOULINES E, TUBACH J P. Voice transformation using PSOLA technique [ J ]. Speech Communication, 1992,11 (6) : 175 - 187.
3NARENDRANNATH M, MURTHY H, RAJENDRAN S. Transformation of formants for voice conversion using artificial neural networks [J]. Speech Communication, 1995, 16(2): 207- 216.
4STYLIANOU Y, CAPPE O, MOULINES E. Continuous Probabilistic Transform for Voice Conversion [ J ]. IEEE Trans on Speech and Audio Processing, 1998,6 (2) : 131 - 142.
5YE H, YOUNG S. High quality voice morphing [ C ]//ICASSP. 2004 :I9 - I12.
6REYNOLDS D A, ROSE R C. Robust text-independent speaker identification using Gaussian mixture speaker models [ J ]. IEEE Trans on Speech Audio Process, 1995,3 ( 1 ) :72 - 83.
7ARSLAN L M. Speaker Transformation Algorithm using Segmental Codebooks [ J ]. Speech Communication, 1999,28 (3) :211 - 226.
8KAIN A, MACON M W. Spectral voice conversion for text - tospeech synthesis [ C ]//ICASSP. Seattle, Wa, 1998:285 - 289.
9ATHANASIOS M, SHRIKANTH S. Narayanan K. Multichannel audio Synthesis by Subband-Based Spectral Conversion and Parameter Adaptation [ J ]. IEEE Trans on Speech and Audio Processing, 2005,13 (2) :263 - 274.
10RabinerL JuangBH.Fundamentals of speech recognition[M].北京：清华大学出版社,1999.200-240.

共引文献4

1丁志中,蒋建国,夏娜.部分国外电子信息类教材编写特点[J].合肥工业大学学报（社会科学版）,2007,21(4):56-59. 被引量：1
2靳月英.语音识别ASIC中端点检测算法研究与实现[J].计算机与现代化,2011(12):57-59. 被引量：2
3刘顺兰,窦园园,应娜.噪声背景下语音识别特征参数选择研究[J].杭州电子科技大学学报（自然科学版）,2011,31(4):73-76. 被引量：3
4汤霖,蔡莲红.训练方法对汉语数字串识别率影响的研究[J].湘潭大学自然科学学报,2003,25(3):16-20.

同被引文献20

1左国玉,刘文举,阮晓钢.声音转换技术的研究与进展[J].电子学报,2004,32(7):1165-1172. 被引量：32
2孙俊,戴蓓蒨,张剑.基于GMM和概率修正码本的源-目标说话人声门波转换[J].数据采集与处理,2007,22(1):19-24. 被引量：2
3简志华,杨震.基于混合线性变换的语声转换算法[J].电子与信息学报,2007,29(7):1700-1702. 被引量：2
4Matsumoto H, Hiki S, Sone T,et al.Multi dimensional representation of personal quality of vowels and its acoustical correlates[J]. IEEE Trans Audio and Electroacoustics,1973,21(5):428-436.
5Qin Long, Chen Gao-peng, Ling Zhen-hua, et al.An improved spectral and prosodic transformation method in STRAIGHT-based voice conversion[C]//ICASSP, 2005 : 21-24.
6简志华,杨震.语声转换技术发展及展望[J].南京邮电大学学报（自然科学版）,2007,27(6):88-94. 被引量：3
7李邵梅,刘力雄,陈鸿昶.实时说话人辨识系统中改进的DTW算法[J].计算机工程,2008,34(4):218-219. 被引量：20
8王茂林,林茂灿,李爱军.汉语自然对话音高研究[J].声学学报,2008,33(2):97-101. 被引量：9
9双志伟,Raimo Bakis,秦勇.IBM Voice Conversion Systems for 2007 TC-STAR Evaluation[J].Tsinghua Science and Technology,2008,13(4):510-514. 被引量：2
10孙新建,张雄伟,杨吉斌,曹铁勇,孙健.基于隐变量模型的语音转换方法研究[J].信号处理,2012,28(3):344-351. 被引量：2

引证文献2

1康广玉,郭世泽,孙圣和.变滑动窗的话者转换算法[J].计算机工程与应用,2010,46(30):125-127.
2张雄伟,苗晓孔,曾歆,孙蒙,曹铁勇.语音转换技术研究现状及展望[J].数据采集与处理,2019,34(5):753-770. 被引量：9

二级引证文献9

1潘梦鹞,吕小勇,陈少伟,郇锐铁,王锋.基于AI智能语音技术线上教学的创新与实践[J].创新创业理论研究与实践,2022(24):170-173. 被引量：1
2鲍薇,温正棋.声音伪造与防伪检测技术研究[J].信息技术与标准化,2020(1):54-58. 被引量：1
3李智诚,张云翔.面向电力行业的智能会议录音回溯系统[J].现代计算机,2020,26(21):37-39. 被引量：1
4张雄伟,李嘉康,孙蒙,郑琳琳.语音欺骗检测方法的研究现状及展望[J].数据采集与处理,2020,35(5):807-823. 被引量：8
5郑琳琳,张雄伟,孙蒙,李嘉康,张星昱.基于i⁃vector的电子伪装语音鲁棒还原方法研究[J].数据采集与处理,2020,35(5):880-891. 被引量：1
6张雄伟,张星昱,孙蒙,邹霞.说话人验证系统攻击方法的研究现状及展望[J].数据采集与处理,2021,36(5):831-849. 被引量：1
7杨帅,乔凯,陈健,王林元,闫镔.语音合成及伪造、鉴伪技术综述[J].计算机系统应用,2022,31(7):12-22. 被引量：5
8吕汝金,苏庚辰,徐永博.一种智能分类垃圾桶的设计研究[J].机械设计与制造,2022(7):232-234. 被引量：5
9孙丽丽,翟启,张延童,翟洪婷,张庆锐.基于声纹识别的电网调度认证系统设计[J].山东电力技术,2023,50(10):58-65.

1简志华,杨震.基于维特比算法的语声转换[J].电子学报,2009,37(7):1470-1475. 被引量：2
2简志华,杨震.语声转换技术发展及展望[J].南京邮电大学学报（自然科学版）,2007,27(6):88-94. 被引量：3
3包盛,段保通,邵锋军.三网融合下基于云计算的实时转码技术的研究和应用[J].电视工程,2011(2):5-7. 被引量：4
4张炳,俞一彪.基于改进GMM和韵律联合短时谱的说话人转换[J].信号处理,2009,25(4):548-552. 被引量：2
5潘渊.声音转换及相关技术的研究[J].今日科苑,2010(22):113-113. 被引量：1
6刘星成,王康.自适应量化测试序列数的分组Turbo码译码算法[J].电子与信息学报,2009,31(12):3006-3009.
7工信部部长苗圩鼓励TD－LTE走出去[J].互联网天地,2012(5):8-8.
8简志华,杨震.一种用于语声转换系统的LPC残差信号生成算法[J].信号处理,2008,24(5):762-765. 被引量：1
9简志华,杨震.基于混合线性变换的语声转换算法[J].电子与信息学报,2007,29(7):1700-1702. 被引量：2
10谢霞,李宏,郑俊.基于GMM的说话人辨认系统及其改进[J].电脑与信息技术,2006,14(2):48-51. 被引量：6

南京邮电大学学报（自然科学版）

2007年第5期

浏览历史

内容加载中请稍等...

改进的GMM模型语声转换系统被引量：2

参考文献11

共引文献4

同被引文献20

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

改进的GMM模型语声转换系统 被引量：2

参考文献11

共引文献4

同被引文献20

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

改进的GMM模型语声转换系统被引量：2