一种甚低码率声码器的设计被引量：1

Design of an ultra-low bit rate vocoder

下载PDF

导出

摘要在混合激励线性预测(mixed excitation linear prediction,MELP)模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器。为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantization based on Gauss mixture model,GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率。采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试。测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度。 Based on the mixed excitation linear prediction(MELP)model,this paper designs a vocoder with a bit rate of600bit/s.It adopts a multi-frame joint coding technique with the super frame,and then through the divided model to realize joint quantification for the speech feature parameters of sub frames in the super frame.To deal with the problem that the performance of the existing vector quantization is non-optimal,a predictive switched split vector quantization based on Gauss mixture model(GMM-PSSVQ)is adopted.It quantizes the line spectrum frequency of some sub frames and uses the inter prediction and linear interpolation method to improve the coding efficiency.The performance of the designed vector quantization is evaluated by spectral distortion and it is compared with the multistage vector quantization and predictive splitting vector quantization.The performance of the vocoder is tested by the perceptual evaluation of speech quality and Diagnostic Rhymer Test.Experimental results show that the proposed algorithm has the lowest average spectral distortion,and the speech synthesized by the vocoder proposed in this thesis has high clarity and intelligibility.

作者李强张玲朱兰明艳 LI Qiang;ZHANG Ling;ZHU Lan;MING Yan(Chongqing Key Laboratory of Signal and Information Processing, Chongqing University of Posts and Telecommunications,Chongqing 400065, P. R. China)

机构地区重庆邮电大学信号与信息处理重庆市重点实验室

出处《重庆邮电大学学报（自然科学版）》 CSCD 北大核心 2018年第6期776-782,共7页 Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition)

基金国家高技术研究发展计划("863"计划)(2012AA01A508)~~

关键词混合激励线性预测(MELP) 多帧联合量化矢量量化器性能测试 mixed excitation linear prediction(MELP) multi-frame joint quantization vector quantization performance test

分类号 TP919.81 [自动化与计算机技术] TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1田春环,姜占才.改进的LBG算法及浊音隶属度码本的训练[J].电脑开发与应用,2015,28(3):61-63. 被引量：1
2毛启容,赵小蕾,白李娟,王治锋,詹永照.结合过完备字典与PCA的小样本语音情感识别方法[J].江苏大学学报（自然科学版）,2013,34(1):60-65. 被引量：5
3李强,舒勤军,谢虹恩,明艳.一种基于混合MELP/CELP的4 kbit/s声码器[J].重庆邮电大学学报（自然科学版）,2017,29(2):143-148. 被引量：4

二级参考文献17

1张学工.模式识别[M].北京:清华大学出版社,2010.
2鲍长春.数字语音编码原理[M].西安:西安电子科技大学出版社,2007.
3Bryt O, Elad M. Compression of facial images using the K-SVD algorithm [ J ]. Journal of Visual Communication and Image Representation, 2008,19 (4) : 270 - 282.
4Aharon M, Elad M, Bruckstein A. K-SVD: an algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54( 11 ) :4311 -4322.
5Protter M,Elad M. Image sequence denoising via sparse and redundant representations [ J ]. IEEE Transactions on Image Processing, 2009, 18 ( 1 ) : 27 - 35.
6Yang A Y, Wright J, Ma Y, et al. Feature selection in face recognition: a sparse representation perspective[R]. UC Berkeley Technical Report UCB/EECS - 2007 - 99, 2007.
7Rubinstein R, Zibulevsky M, Elad M. Efficient implementation of the K-SVD algorithm using batch orthogonal matching pursuit[R]. CS Technical Report, Technion, Israel Institute of Technology, 2008.
8Pati Y C, Rezaiifar R, Krishnaprasad P S. Orthogonal matching pursuit: recursive function approximation with applications to wavelet decomposition [ C ]//Proceedings of the 27th Asilomar Conference on Signals, Systems & Computers. CA : IEEE, 1993:40 - 44.
9张新鹏,王朔中.基于稀疏表示的密写编码[J].电子学报,2007,35(10):1892-1896. 被引量：9
10Daniel W Griffin, Jae S Lira. Multi-Band Excitation Vocoder[J]. IEEE Transactions on ASSP, 1988,36:1223-1235.

共引文献7

1赵小蕾,毛启容,詹永照.融合功能性副语言的语音情感识别新方法[J].计算机科学与探索,2014,8(2):186-199. 被引量：5
2吕宗磊,陈国明.基于观察学习的概率分布预测模型研究[J].计算机与数字工程,2016,44(9):1635-1640.
3田媛.基于Linux平台上线性预测语音编码器性能分析[J].重庆大学学报（自然科学版）,2018,41(1):108-114.
4孙凤梅,薛颜,李克靖.基于TMS320F28335的声码器设计与实现[J].电子设计工程,2018,26(20):183-187. 被引量：2
5曹维祥.语音情感分析与仿真[J].宿州学院学报,2018,33(4):107-111.
6敖振,李凤,马嫱,何贵青.基于北斗导航星座的语音与定位同传通信系统[J].西北工业大学学报,2020,38(5):1010-1017. 被引量：5
7王莲子,李钟晓,陈倩倩,庄晓东.基于信号子空间低维表征的快速字典学习算法[J].传感器与微系统,2022,41(8):144-147. 被引量：1

同被引文献6

1王海涛.应急通信发展现状和技术手段分析[J].电力系统通信,2011,32(2):1-6. 被引量：49
2石乔林,韦凯,吴辉.一种基于MELP模型600bps声码器的设计[J].电子与封装,2012,12(10):28-30. 被引量：1
3刘可文,彭文振,熊红霞,谭爱国.线性预测（LPC）技术及其实现方法[J].凉山大学学报,2001,3(1):5-8. 被引量：2
4李强,舒勤军,谢虹恩,明艳.一种基于混合MELP/CELP的4 kbit/s声码器[J].重庆邮电大学学报（自然科学版）,2017,29(2):143-148. 被引量：4
5孙凤梅,薛颜,李克靖.基于TMS320F28335的声码器设计与实现[J].电子设计工程,2018,26(20):183-187. 被引量：2
6吕雪锋.北斗卫星导航系统与防灾减灾救灾[J].中国减灾,2018,0(12):14-17. 被引量：3

引证文献1

1敖振,李凤,马嫱,何贵青.基于北斗导航星座的语音与定位同传通信系统[J].西北工业大学学报,2020,38(5):1010-1017. 被引量：5

二级引证文献5

1徐睿,魏斌,王博,孙榕,孙术发.森林消防车无网络通信定位及参数采集系统设计[J].消防科学与技术,2021,40(4):530-533. 被引量：7
2郭浩,高扬,吴强,张军伟,张帅毅.北斗三号终端软件关键技术研究及应用[J].计算机测量与控制,2022,30(5):150-155.
3郗昱.基于北斗三号系统的特种车应急管理系统[J].通讯世界,2022,29(3):70-72.
4王燕.基于BDS和时空数据的嵌入式系统精准定位[J].信息技术,2022,46(10):102-107.
5张振权,彭颖,黄昊,马丽娜·叶尔江,宋建.面向浆板运动的安全定位器开发[J].微型电脑应用,2023,39(12):171-174.

1李惠云,李亚改,罗兴敏.细节护理联合量化评估策略对腹股沟疝老年患者手术的影响[J].实用中西医结合临床,2018,18(7):161-162. 被引量：3
2张丽娟,李东明,杨进华,邱欢,刘颖,刘欢.基于帧选择和极大似然估计的自适应光学图像多帧联合去卷积算法[J].吉林大学学报（理学版）,2017,55(5):1199-1206. 被引量：3
3蒙元耀,梁生.壮语-aw韵字研究[J].广西民族研究,2018(5):137-145. 被引量：1
4崔晓.最优阈值系数和经验模式分解的语音增强[J].电子设计工程,2017,25(24):20-24.
5何冲,王冬霞,王旭东,蒋茂松.一种基于正交非负矩阵分解的多通道线性预测语音去混响方法[J].声学技术,2018,37(5):468-474. 被引量：2
6丁治民,汪亮娟.《永乐大典韵总》《永乐大典目录》二者关系考——兼论《永乐大典》“用韵以统字”的“字”数[J].阅江学刊,2018,10(6):63-74.
7蔡文彬,魏云龙,徐海华,潘林.混合单元选择语音合成系统的目标代价构建[J].计算机工程与应用,2018,54(24):20-25. 被引量：1
8白海莉.情感语音合成技术或对声纹鉴定准确性产生影响[J].科技创新与应用,2018,8(36):24-24. 被引量：6
9周鹏,陈金海,林乾锋,梅强,黄鹏飞.基于AIS的轨迹插值方法[J].集美大学学报（自然科学版）,2018,23(6):443-447. 被引量：7
10唐铭,何岩萍,尹恒,刘奇,何凌.基于声道特性的腭裂语音高鼻音等级自动识别[J].计算机工程与应用,2018,54(21):141-147. 被引量：2

重庆邮电大学学报（自然科学版）

2018年第6期

浏览历史

内容加载中请稍等...

一种甚低码率声码器的设计被引量：1

参考文献3

二级参考文献17

共引文献7

同被引文献6

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种甚低码率声码器的设计 被引量：1

参考文献3

二级参考文献17

共引文献7

同被引文献6

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种甚低码率声码器的设计被引量：1