声码器清浊音判决算法优化被引量：6

Improvement of voiced-unvoiced classification in vocoders

导出

摘要为了解决低速声码器合成语音的偶发性嘶哑或变调问题,对参数提取进行改善,采用有监督学习的Fisher判决法,利用多个特征值组成的特征向量为判据;基音周期平滑的准确度在利用了更准确的清浊音信息后大有提高。测试结果表明:该算法能够大大降低清浊音误判率,减少严重基音周期错误数;应用该算法的SELP(sinuous excitationlinear prediction)2.4 kb/s的PESQ-MOS分优于2.4 kb/s的MELPe(mixed excitation linear prediction)和AMBE+(advanced multi-band excitation)算法,DRT(diagnosticrhythm test)分数达95%,具有良好的可懂度和自然度。 Many kinds of 2. 4 kb/s low bit rate vocoders have occasionally hoarseness or out-of-tone speech. Hence voiced-unvoiced classification method is improved using several parameters based on Fisher method. The pitch track precision is then improved by more precise voiced-unvoiced information. Tests results show that the Fisher classification method greatly reduces the voiced-unvoiced classification error rate and number of severe half or double pitch errors. The improved 2.4 kb/s SELP （sinuous excitation linear prediction） vocoder then get a higher PESQ- MOS score, even outperforming the US government＇s MELPe and DVSI＇s AMBE ＋ algorithm at the same rate. Additionally, the improved 2. 4 kb/s SELP vocoder has diagnostic rhythm test （DRT） scores of up to 95%, which produces excellent natural and intelligible speech.

作者党晓妍魏旋崔慧娟唐昆

机构地区清华大学电子工程系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2008年第7期1119-1122,共4页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金资助项目(60572081)

关键词语音编码清浊音判决 MELPe算法 AMBE+算法 speech coding voiced-unvoiced classification MELPe （mixed excitation linear prediction） algorithm AMBE ＋（advanced multi-band excitation plus） algorithm

分类号 TN912.32 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1李军林.[D].北京:清华大学电子工程系,2001.
2Meuse P C. A 2400 bps multi-band excitation vocoder [C]//ICASSP. Albuquerque, USA: IEEE Press, 1990: 9- 12.
3Supplee L M, Cohn R P, Collura J S, et al. Melp: The new federal standard at 2400 bps [C]//ICASSP. Munich, Germany: IEEE Press, 1997:21 - 24.
4Kondoz A M. Digital Speech Coding for Low Bit Rate Communication Systems [M]. Chichester, UK: Wiley, 2004.
5Gibson J D. Speech coding methods, standards, and applications [J]. Circuits and Systems Magazine, IEEE, 2005, 5(4): 30-49.
6Plante F, Meyer G F. A pitch extraction reference database [C]//European Conf on Speech Communication and Technology. Madrid, 1995:837- 840.

共引文献2

1党晓妍,唐昆,崔慧娟,李军林.多级矢量量化中的码本共享[J].清华大学学报（自然科学版）,2006,46(1):25-27. 被引量：2
2党晓妍,唐昆.低速率声码器激励参数的DCT-M模型[J].清华大学学报（自然科学版）,2007,47(4):578-580. 被引量：1

同被引文献50

1张运凯,王方伟,戴敬书,黄文艳,陈艳红.基于模糊聚类和信息熵的综合评价算法[J].吉林大学学报（信息科学版）,2004,22(6):643-647. 被引量：15
2张利彪,周春光,马铭,刘小华,孙彩堂.基于粒子群优化算法的模糊C-均值聚类[J].吉林大学学报（理学版）,2006,44(2):217-222. 被引量：27
3齐峰岩,鲍长春.一种基于支持向量机的含噪语音的清/浊/静音分类的新方法[J].电子学报,2006,34(4):605-611. 被引量：12
4刘建,郑方,邓菁,吴文虎.基于混合幅度差函数的基音提取算法[J].电子学报,2006,34(10):1925-1928. 被引量：16
5闫润强,朱贻盛.基于定量递归分析的清浊音判决[J].电子与信息学报,2007,29(7):1703-1706. 被引量：10
6Ovens M J, Ponting K M, Turner, M E. Ultra low bit rate voice coding [C] // Speech Coding for Algorithms :for Radio Channels, IEE Seminar, London, UK, 2000: 97- 111.
7Wei X, Dang X, Cui H, et al. Voiced/unvoiced classification recovery in the speech decoder based on GMM [C]//ICSP, IEEE, 2008: 546-548.
8McCree V, Barnwell T. A mixed excitation LPC vocoder model for low bit rate speech coding [J]. IEEE Trans on Speech Audio Processing, 1995, 3(4) : 242 - 250.
9Deng H, O'Shaughnessy D. Voiced-unvoiced-silence speech sound classification based on unsupervised learning [C] // International Conf on Multimedia Expo. Beijing: IEEE, 2007: 176-179.
10Theodoridis S, Koutroumbas K. Pattern Recognition (Third Edition) [M]. Beijing: China Machine Press, 2006.

引证文献6

1魏旋,党晓妍,崔慧娟,唐昆.基于Gauss混合模型的清浊音解码端恢复算法[J].清华大学学报（自然科学版）,2010,50(1):79-82. 被引量：4
2姜占才,姚刚.一种无门限U/V判决和基音检测算法[J].计算机工程与应用,2011,47(25):140-142. 被引量：3
3姜占才,杨林.语音模糊特征提取及码本训练算法[J].吉林大学学报（信息科学版）,2012,30(3):279-284. 被引量：5
4孙燕,姜占才,王蕴杰.浊音隶属度参数及F-LBG算法[J].计算机工程与应用,2014,50(2):204-207.
5李克靖,孙凤梅,石乔林.一种基于SVM的多特征参数清浊音判决算法[J].电子设计工程,2016,24(5):184-186. 被引量：3
6张扬,赵晓群,王缔罡.基于时频二维能量特征的汉语音节切分方法[J].计算机应用,2016,36(11):3222-3228. 被引量：5

二级引证文献20

1徐敬德,常亮,计哲,崔慧娟,唐昆.基于码字特征的多模式多级矢量量化算法[J].清华大学学报（自然科学版）,2011,51(2):172-175. 被引量：2
2计哲,徐敬德,常亮,崔慧娟,唐昆.基于Gauss混合模型的清浊音恢复改进算法[J].清华大学学报（自然科学版）,2011,51(11):1751-1755. 被引量：1
3石锐,叶亮亮,何庆华.基于音频波形极值的基音检测方法[J].计算机工程与应用,2012,48(32):107-112.
4常亮,徐敬德,崔慧娟,唐昆.基于SELP的150b／s语音压缩编码算法[J].清华大学学报（自然科学版）,2013,53(7):967-971. 被引量：2
5胡倩,姜占才,王琛.基于二级矢量量化的LPC声码器算法[J].青海师范大学学报（自然科学版）,2014,30(3):34-38.
6田春环,姜占才.改进的LBG算法及浊音隶属度码本的训练[J].电脑开发与应用,2015,28(3):61-63. 被引量：1
7王琛,姜占才.基于线性预测技术的语音基音检测[J].电脑开发与应用,2015,28(3):74-76. 被引量：1
8田春环,姜占才,李小航.一种新的子带声音强度参数及提取算法[J].电子设计工程,2016,24(20):171-173. 被引量：1
9徐静云,赵晓群,蔡志端,王培良.基于胞腔均匀度的清浊模式码书设计算法[J].计算机应用,2016,36(12):3374-3377. 被引量：1
10钟卫,赵晓群.基于Linux平台的DSP编程性能优化[J].燕山大学学报,2016,40(5):431-437. 被引量：1

1朱益厅,李永明,陈弘毅.一种多带清浊音判决方法[J].微电子学与计算机,1999,16(5):1-4. 被引量：3
2李克靖,孙凤梅,石乔林.一种基于SVM的多特征参数清浊音判决算法[J].电子设计工程,2016,24(5):184-186. 被引量：3
3计哲,李晔,崔慧娟,唐昆.SELP 2.4kb/s语音编码算法跳跃帧判决及处理[J].清华大学学报（自然科学版）,2009(8):1152-1155. 被引量：1
4周志杰,胡光锐.采用非线性网络实现清浊音判决[J].南京航空航天大学学报,1998,30(1):47-51. 被引量：4
5李振国,李鑫,牛占冀.一种基于AMBE-2000芯片的低速声码器设计[J].无线电工程,2008,38(1):55-57.
6周志杰,胡光锐,林晓彤.采用 Fisher 分类法实现清浊音判决[J].上海交通大学学报,1997,31(5):30-32. 被引量：7
7毛六平,唐艳,王耀南.基于模糊MLP网络的清浊音判决[J].湖南师范大学自然科学学报,2003,26(4):27-30. 被引量：2
8王志成,杜栓义.基于AMBE-2000的低速声码器设计[J].电声技术,2008,32(4):69-71.
9马金全,高世海,张连海.基于MELP改进算法的低速率声码器设计与实现[J].电子科技,2009,22(1):31-34. 被引量：1
10范志华.海信TC2595／TC2598D型彩电伴音特殊故障检修[J].家电维修,2009(6):10-10.

清华大学学报（自然科学版）

2008年第7期

浏览历史

内容加载中请稍等...

声码器清浊音判决算法优化被引量：6

参考文献6

共引文献2

同被引文献50

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

声码器清浊音判决算法优化 被引量：6

参考文献6

共引文献2

同被引文献50

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

声码器清浊音判决算法优化被引量：6