基于二阶隐马尔可夫模型的清浊音恢复算法被引量：1

Voiced/Unvoiced Parameters Recovery Based on Second-Order Hidden Markov Model

下载PDF

导出

摘要为了解决低速率语音编码中比特受限的问题,提出了一种基于二阶隐马尔可夫模型的清浊音参数恢复算法。该算法采用二阶隐马尔可夫模型,通过归一化的能量参数和LPC倒谱系数估计出序列中的全带清浊音判决和各个子带的清浊音度。解码器实现该算法后,编码器就无需对清浊音参数进行量化传输,从而节约了比特数。实验结果表明,该算法比基于GMM模型的算法能更好地恢复出清浊音信息,全带清浊音误判率减少了5%～20%,合成语音的MOS分比用5 bit的矢量量化(VQ)算法提高了0.03左右,达到了在节约比特数的同时也提高了语音质量的效果。 In order to solve the problem of limited number of bits in low bit rate speech coding, an algorithm using second - order Hidden Markov ModeI（HMM2） to recover the voiced/unvoiced parameters is proposed in this paper. The algorithm uses the normalized energy and linear prediction coding（LPC） coefficients to estimate the full-band V/U classification and the sub-band BPVC value. The algorithm can be implemented in the decoder, saving the bits originally used by V/U parameters and reducing the bit rate of speech coding. Experimental re- suits show that the algorithm proposed can reduce the V/U classification error rate by 5 % - 20 % compared with the GMM algorithm, and improve the mean opinion score（MOS） of the synthesized speech signal by about 0.03 compared with the 5bit vector quantization（VQ）, thereby greatly improves the estimation performance of the V/ U parameters.

作者何洪华徐敬德计哲崔慧娟唐昆

机构地区清华大学电子工程系清华信息科学与技术国家实验室

出处《电讯技术》北大核心 2011年第6期56-60,共5页 Telecommunication Engineering

基金国家自然科学基金资助项目(60572081)~~

关键词低速率语音编码二阶隐马尔可夫模型全带V/U判决 BPVC恢复 low-bit rate speech coding second-order HMM V/U classification BPVC recovery

分类号 TN912.32 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1李哗.低速率语音编码技术与算法研究[D].北京:清华大学,2009.
2Wei X, Dang X, Cui H, et al. Voiced/Unvoiced Classifica- tion Recovery in the Speech Decoder Based on GMM[ C]// Proceedings of ICSP. Beijing: IEEE,2008: 546 - 548.
3McCree V, Barnwell T. A mixed excitation LPC vocoder model for low bit rate speech coding[J]. IEEE Transactions on Speech Audio Processing, 1995, 3(4):242- 250.
4Rabiner L, Juang B H. Fundamentals of Speech Recognition [M]. New Jersey: Prentice- Hall, 1993:321 - 386.
5Ismail Shahin. Using Second- Order Hidden Markov Model to Improve Speaker Identification Recognition Performance under Neutral Condition[C]//Proceedings of the 10th IEEE ICECS. Sharjah, United Arab Emirates : IEEE, 2003 : 124 - 127.
6Jean- Francois Mari, Jean- Paul Haton, Abdelaziz kriouile. Automatic wordrecognition based on second- order hidden Markov models[J]. IEEE Transactions on Speech and Audio Processing, 1997(5) :22 - 25.
7李晔,洪侃,王童,崔慧娟,唐昆.正弦激励线性预测声码器子带清浊音模糊判决[J].清华大学学报（自然科学版）,2008,48(7):1101-1103. 被引量：4

二级参考文献6

1MvAulay R J, Quatieri T F. Speech analysis/synthesis- based on a sinusoidal representation[J]. IEEE Trans Acoustic, Speech, Signal Processing, 1986, ASSP-34 : 744 - 754.
2Griffin D W, Lim J S. Multi-band excitation vocoder [J]. IEEE Trans Acoustic, Speech, Signal Processing, 1988, ASSP-36:1223 - 1235.
3Kleijn W B. Encoding speech using prototype waveforms [J]. IEEE Transactions on Speech and Audio Processing, 1993, 1(4): 386-399.
4McCree A, Truong K, George E B, et al. 2.4 kb/s MELP coder candidate for the new U.S. federal standard [C]// Proceedings of ICASSP, IEEE. Atlanta, Georgia: IEEE, 1996: 200- 203.
5李军林.低速率语音编码算法研究[D].北京:清华大学,2004.
6张建伟,贺天宏,李军林,崔慧娟,唐昆.高质量的0.6kb/s声码器算法[J].清华大学学报（自然科学版）,2003,43(4):449-452. 被引量：23

共引文献4

1姜占才,杨林.语音模糊特征提取及码本训练算法[J].吉林大学学报（信息科学版）,2012,30(3):279-284. 被引量：5
2常亮,徐敬德,崔慧娟,唐昆.基于SELP的150b／s语音压缩编码算法[J].清华大学学报（自然科学版）,2013,53(7):967-971. 被引量：2
3孙燕,姜占才,王蕴杰.浊音隶属度参数及F-LBG算法[J].计算机工程与应用,2014,50(2):204-207.
4田春环,姜占才.改进的LBG算法及浊音隶属度码本的训练[J].电脑开发与应用,2015,28(3):61-63. 被引量：1

同被引文献10

1许鑫,章成志.互联网舆情分析及应用研究[J].情报科学,2008,26(8):1194-1200. 被引量：62
2夏火松,陶敏,王一,魏翔.停用词表对基于SVM的中文文本情感分类的影响[J].情报学报,2011,30(4):347-352. 被引量：6
3殷俊,何芳.微博在我国的传播现状及传播特征分析[J].河南大学学报（社会科学版）,2011,51(3):124-129. 被引量：53
4唐晓波,宋承伟.基于复杂网络的微博舆情分析[J].情报学报,2012,31(11):1153-1162. 被引量：39
5吴建军.网络舆情的云计算监测模式分析与实现[J].电讯技术,2013,53(4):476-481. 被引量：4
6李岩,韩斌,赵剑.基于短文本及情感分析的微博舆情分析[J].计算机应用与软件,2013,30(12):240-243. 被引量：22
7周俊,郑中华,张炜.基于改进最大匹配算法的中文分词粗分方法[J].计算机工程与应用,2014,50(2):124-128. 被引量：18
8曾振东.基于灰色支持向量机的网络舆情预测模型[J].计算机应用与软件,2014,31(2):300-302. 被引量：22
9王旭仁,李娜,何发镁,王彦丽,宋蓓.基于改进聚类算法的网络舆情分析系统研究[J].情报学报,2014,33(5):530-537. 被引量：14
10王松,吴亚东,李秋生,蒋宏宇,邹勇刚.基于时空分析的微博演化可视化[J].西南科技大学学报,2014,29(3):68-75. 被引量：6

引证文献1

1彭浩,周杰,周豪,赵丹丹.微博网络中基于主题发现的舆情分析[J].电讯技术,2015,55(6):611-617. 被引量：4

二级引证文献4

1李慧芳.无线局域网技术在校园网中的安全能力提高措施研究[J].软件,2017,38(4):95-98. 被引量：2
2徐明磊,赵博文,诸葛福民.高校网络舆情获取方法研究[J].软件导刊,2018,17(10):48-50. 被引量：1
3盛成成,朱勇,刘涛.基于微博社交平台的舆情分析[J].智能计算机与应用,2019,9(1):57-59. 被引量：5
4谢婷,罗清.基于机器学习的新型冠状肺炎的舆情分析[J].数据挖掘,2022,12(2):114-122.

1科布林.耳朵里的音乐会[J].科技新时代,2008(5):100-100.
2朱益厅,李永明,陈弘毅.一种多带清浊音判决方法[J].微电子学与计算机,1999,16(5):1-4. 被引量：3
3史笑兴,王太君,何振亚.二阶隐马尔可夫模型的学习算法及其与一阶隐马尔可夫模型的关系[J].应用科学学报,2001,19(1):29-32. 被引量：16
4陈亮1,陈亮2,郑静华,张翼鹏,庞亮.改进的语音子带清浊音参数量化算法[J].军事通信技术,2013(4):49-53.
5张玲华,杨震,郑宝玉.一种修正的倒谱公式及其在说话人识别中的应用[J].信号处理,2003,19(z1):121-124.
6周志杰,胡光锐.采用非线性网络实现清浊音判决[J].南京航空航天大学学报,1998,30(1):47-51. 被引量：4
7杨澄宇,赵文,杨鉴.基于高斯混合模型的说话人确认系统[J].计算机应用,2001,21(4):7-8. 被引量：5
8周志杰,胡光锐,林晓彤.采用 Fisher 分类法实现清浊音判决[J].上海交通大学学报,1997,31(5):30-32. 被引量：7
9产业点击[J].电子测试（新电子）,2006(10):103-106.
10毛六平,唐艳,王耀南.基于模糊MLP网络的清浊音判决[J].湖南师范大学自然科学学报,2003,26(4):27-30. 被引量：2

电讯技术

2011年第6期

浏览历史

内容加载中请稍等...

基于二阶隐马尔可夫模型的清浊音恢复算法被引量：1

参考文献7

二级参考文献6

共引文献4

同被引文献10

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于二阶隐马尔可夫模型的清浊音恢复算法 被引量：1

参考文献7

二级参考文献6

共引文献4

同被引文献10

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于二阶隐马尔可夫模型的清浊音恢复算法被引量：1