一种引入帧间相关信息的HMM语音识别方法被引量：2

A METHOD OF HMM SPEECH RECOGNITION INTRODUCED INTER-FRAME CORRELATION

下载PDF

导出

摘要该文提出了一种基于复数帧段输入HMM的语音识别方法,它采用相继的复数帧组成的特征参数向量作为语音识别HMM的输入,能有效地在语音识别HMM中引入帧间相关信息。为了进一步改善复数帧段输入HMM的输出概率分布函数,作者还提出了用MGDF和RBF函数作为复数帧段输入HMM的输出概率分布函数的方法。通过对非特定人汉语孤立数字和连续数字语音识别试验,证实了该文提出的引入帧间相关信息方法的有效性。 This paper applies segmental unit into HMM for speech recognition. In this model, several successive frames are combined and treated as an input vector. It expects that segmental unit input HMM would be effective to describe the inter-frame correlation information and has also proposed the MGDF and RBF to further improve output probability function. By comparing them with the traditional HMMs based on their speech recognition performance rates through the experiments of speaker-independent spoken digit (isolated/connected) recognition, the validity of the proposed appraoch could be verified.

作者赵力邹采荣吴镇扬

机构地区东南大学无线电工程系

出处《电子与信息学报》 EI CSCD 北大核心 2001年第4期327-331,共5页 Journal of Electronics & Information Technology

关键词语音识别隐马尔可夫模型帧间相关信息复数帧段输入 Speech recognition, Hidden Markov modei, Inter-frame correlation information, Segmental unit input

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1[1]V.N. Gupta, M. Lennig, P. Mermelstein, Integration of acoustic information in a large vocabulary word recognizer, ICASSP-87, Dallas, USA, 1987.2, 697-700.
2[3]L. Deng, M. Aksmanoric, X. Sun, C. F. J. Wu, Speech recognition using hidden Markov models with polynomial regression functions as stationary states, IEEE Trans. on Speech & Audio Processing, 1994, (4), 507-520.
3[4]C.J. Wellekens, Explicit correlation in hidden Maarkov model with optimized inter-frame dependence, ICASSP-95, Detroit, USA, 1995.1,209-212.
4[7]M. Ostendorf, S. Roukos, A stochastic segment model for phoneme-based continuous speech recognition, IEEE Trans. on Acoust., Speech & Signal Processing, 1989, ASSP-37(12), 1857-1869.
5[8]T. Wakabayashi, S. Tsuruokaet, ed al., On the size and variable transformation of feature vector for handwritten character, IEICE, J76-D- Ⅱ (12), 2495-2503.
6[9]L. Zhao, H. Suzuki, S. Nakagawa, A comparison study of probability functions in HMMs through spoken digit recognition, IEICE, TRANS.INF and SYST., 1995, E78-D(6), 669-675.
7[10]S. Nakagawa, Estimation of probability density function and a posteriori probability and evaluation by vowel recognition, IEICE, Technical Report, 1992, SP92-24, 61-72.

同被引文献15

1陈群,彭作祥.非平稳弱相依高斯序列次最大值的位置和高度的联合分布[J].西南师范大学学报（自然科学版）,2005,30(6):987-991. 被引量：2
2邬书跃,田新广.基于隐马尔可夫模型的用户行为异常检测新方法[J].通信学报,2007,28(4):38-43. 被引量：20
3陈明义,周昆湘,曾理文.基于VQ的与文本无关的说话人确认系统[J].信息技术,2007,31(3):97-98. 被引量：1
4陈永彬．语音信号处理[M]．上海：上海交通大学出版社,1991．138-143．
5Xia Lin Li, Marc Parizeau, Rejean Plamondon. Training Hidden Markov Models with Multiple Observation A Combinatorial Method [J]. IEEE Transaction on Pattern Analysis and Machine Intelligence, 2000, 22(4) : 371 - 377.
6Rabiner L R. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition [J]. Proc IEEE,1989, 77(2):257-286.
7Jean-Francois Mari, Jean-Paul Haton, Abdelaziz Kriouile. Automatic Word Recognition Based on Second-order Hidden Markov Models [J]. IEEE Transactions on Speech and Audio Processing, 1997, 5(1) : 22 - 25.
8梁涛,张国杰,张效军.基于FPGA的说话人识别算法的实现[J].通信技术,2008,41(2):66-69. 被引量：4
9曹华,李伟,谭艳梅.线性预测及其Matlab实现[J].现代电子技术,2009,32(7):133-135. 被引量：5
10王娜,郑德忠,张淑清.基于混沌振子的低信噪比语音端点检测新方法[J].仪器仪表学报,2009,30(7):1432-1435. 被引量：15

引证文献2

1杜世平,陈涛.与观测信息相关的二阶隐马尔可夫模型的参数估计[J].西南师范大学学报（自然科学版）,2006,31(3):24-27. 被引量：4
2陈瑞.一种基于SOPC的语音-文本转换技术[J].西安邮电学院学报,2011,16(1):70-71.

二级引证文献4

1杜世平.HMM2小波变换的参数估计[J].辽宁师范大学学报（自然科学版）,2007,30(4):407-409.
2刘亮亮,敖军,高世泽.基于灰色马尔可夫链模型的中国能源消费预测研究[J].重庆师范大学学报（自然科学版）,2008,25(4):47-49. 被引量：5
3杜世平.二阶隐Markov模型的一种简化算法及参数估计[J].山西大学学报（自然科学版）,2009,32(3):358-362. 被引量：1
4刘博,杜建强,聂斌,刘蕾,张鑫,郝竹林.基于二阶HMM的中医诊断古文词性标注[J].计算机工程,2017,34(7):211-216. 被引量：6

1杨浩荣,王作英,陆大紟.语音识别HMM中引入帧间相关信息的一种参数化模型[J].电子学报,1998,26(10):50-54. 被引量：3
2戴加宁.语音帧间相关信息对基于HMM系统识别精度的影响[J].电子学报,1997,25(7):75-77.
3荆嘉敏,刘加,刘润生.基于HMM的语音识别技术在嵌入式系统中的应用[J].电子技术应用,2003,29(10):12-14. 被引量：11
4冷建华.双通格型FIR QMF 滤波器的计算机优化设计[J].信息工程学院学报,1992,11(2):8-16.
5赵力,邹采荣,吴镇扬.基于PCANN/HMM混合结构的语音识别方法[J].信号处理,2001,17(5):473-476. 被引量：2
6徐华.连续数字语音识别中的端点检测研究[J].江苏教育学院学报（自然科学版）,2004(1):77-79.
7车志宇,关成斌,孙保良.基于LabVIEW的DSO存储波形处理与分析[J].现代电子技术,2013,36(3):78-80. 被引量：5
8杨春玲,欧伟枫.CVS中基于多参考帧的最优多假设预测算法[J].华南理工大学学报（自然科学版）,2016,44(1):1-8. 被引量：15
9简志华,王向文.考虑帧间信息的语音转换算法[J].杭州电子科技大学学报（自然科学版）,2012,32(4):33-36.
10胡光锐,林昱弘.一种改进的混合型语音识别方法[J].上海交通大学学报,1994,28(6):77-83. 被引量：2

电子与信息学报

2001年第4期

浏览历史

内容加载中请稍等...

一种引入帧间相关信息的HMM语音识别方法被引量：2

参考文献7

同被引文献15

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种引入帧间相关信息的HMM语音识别方法 被引量：2

参考文献7

同被引文献15

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种引入帧间相关信息的HMM语音识别方法被引量：2