语音识别HMM中引入帧间相关信息的一种参数化模型被引量：3

A Parametric Model of Introducing Inter-Frame Correlation Information into Hidden Markov Model for Speech Recognition

下载PDF

导出

摘要虽然隐马尔可夫模型（HMM）是当前最为流行的语音识别模型，但由于一般都采用了状态输出独立假设，因此存在着不能描述语音现象中时间相关性的固有缺陷.本文提出的新模型对语音状态输出特征矢量序列的静态和动态特性信息分别进行参数化建模，然后将它们结合在一起，由此在基于段长分布的HMM（DDBHMM）中引入了帧间相关信息.这种引入帧间相关信息的HMM能够更为精确地描述真实的语音现象.本文在给出新模型的框架后，推导了模型参数的估值公式，并给出了模型的训练和识别算法.汉语非特定人孤立音节的识别实验表明，引入帧间相关信息使HMM的识别性能得到了明显的改善. Although Hidden Markov Model (HMM) is the most popular model for speech recognition, there has ho an intrinsic defect that, commonly assuming the output observations of a state are independent and identically-distributed(IID),it is unable to describe the time-correlation properties of the speech phenomena. The new model proposed in this paper introduces the inter-frame correlation information into Duration-Distribution-Based HMM (DDBHMM ) by modeling separately the static and dynamic charactedstics of output observation vector sequences of speech states using parametric models and combining them into an nitegrated model. This new HMM including the inter-frame correlation information can characterize the real speech phenomena more presisely. After introducing the structure of the new model, we give the estimation formulas for the parameters of the new model and the algorithms for training and recognition.The experiment for speaker-independent recognition of all Chinese syllables shows that including the inter-frame correlation information improves the perfomance of HMM distinctively.

作者杨浩荣王作英陆大紟

机构地区清华大学电子工程系

出处《电子学报》 EI CAS CSCD 北大核心 1998年第10期50-54,8,共6页 Acta Electronica Sinica

基金国家863高科技计划 "211"工程支持项目

关键词语音识别隐马尔可夫模型帧间相关 Speech recognition, Hidden Markov model(HMM), Inter-frame correlation

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1战普明,王作英,陆大.语音识别隐马尔可夫模型的改进[J].电子学报,1994,22(1):9-15. 被引量：9
2戴加宁，第二届中国计算机智能接口与智能应用学术会议论文集，1995年，89页
3王作英，第二届全国汉字语音识别会议，1989年

二级参考文献4

1战普明，1992年
2战普明，博士学位论文，1992年
3Gu Hungyan，IEEE Trans ASSP，1991年，39卷，8期
4王作英，1989年

共引文献8

1李四信,韦岗.隐马尔可夫模型(HMM)参数迭代与语音识别[J].池州学院学报,1997,17(3):1-7.
2艾长胜,王宝光,董全成,樊宁,赵洪华.基于语音识别技术的刀具工况在线监测的研究[J].组合机床与自动化加工技术,2005(12):59-61. 被引量：1
3马明,张杰,王建宇,黄志同.语音识别中隐马尔可夫模型初值的估计[J].数据采集与处理,1997,12(2):96-100. 被引量：3
4马钧,许嘉璐.基于中国消费者使用习惯的车载语音控制技术发展研究[J].上海汽车,2010(6):43-46.
5田斌,田红心,刘丹亭,易克初.用于语音识别拒识的隐马尔可夫模型状态及状态驻留相关的声学置信量度[J].计算机研究与发展,1999,36(11):1398-1401. 被引量：2
6贾宾,朱小燕,罗予频,胡东成.基于状态驻留时间的汉语语音分段概率模型[J].清华大学学报（自然科学版）,2000,40(1):87-90. 被引量：4
7薛佳,栗觅,马理旺,吕胜富,钟宁.基于视觉行为的网上用户识别[J].计算机技术与发展,2017,27(2):11-14. 被引量：1
8胡石,章毅,陈芳,陈心怡.基于HMM模型语音识别系统中声学模型的建立[J].通讯世界,2017,23(8):233-234. 被引量：6

同被引文献6

1贺前华韦岗.基于模型距离的HMM训练方法[J].计算机工程,1996,22(6):471-476.
2贺前华，计算机工程，1996年，22卷，6期，471页
3Biing Hwang Juang，IEEE Trans Speech Audio Processing，1997年，5卷，3期，257页
4Gong F，IEEE Transon Speechand Audioprocessing，1997年，5卷，1期，33页
5贺前华，计算机工程，1996年，22卷，6期，471页
6Juang H，AT&T Technical J，1985年，64卷，2期，391页

引证文献3

1贺前华,韦岗,金连文.基于遗传算法的HMM最小错识率训练方法[J].电路与系统学报,1999,4(4):46-50. 被引量：2
2贺前华,陆以勤,韦岗.自适应帧长特征提取对语音识别系统性能的影响[J].计算机工程,2000,26(1):82-83.
3贺前华,陆以勤,韦岗.一种新的HMM训练方法[J].电子学报,2000,28(9):56-58. 被引量：2

二级引证文献4

1邱政权,尹俊勋.基于说话人识别的GMM/GA算法[J].电声技术,2006,30(8):43-45. 被引量：1
2乔晓艳,李刚,林凌.基于随机松弛的离散HMM参数估计和信号恢复[J].中国生物医学工程学报,2007,26(4):517-522. 被引量：3
3董明忠.IEEE802.11DCF机制的三维Markov模型分析与仿真[J].计算机技术与发展,2009,19(7):152-155.
4汪丹丹.一种基于遗传算法的语法网络搜索方法[J].电子世界,2014(9):175-176.

1欧智坚,王作英.连续语音识别中利用帧间相关性的研究[J].计算机工程与应用,2001,37(15):25-27. 被引量：1
2赵力,邹采荣,吴镇扬.一种引入帧间相关信息的HMM语音识别方法[J].电子与信息学报,2001,23(4):327-331. 被引量：2
3戴加宁.语音帧间相关信息对基于HMM系统识别精度的影响[J].电子学报,1997,25(7):75-77.
4王作英,肖熙.基于段长分布的HMM语音识别模型[J].电子学报,2004,32(1):46-49. 被引量：42
5杨浩荣,刘加,王作英,陆大.GMD-SDDBHMM语音识别模型和分类训练方法[J].通信学报,1998,19(4):35-42. 被引量：3
6朱文涛,苏涛,杨涛,郑纪彬,朱凯然.低信噪比下线性调频连续波信号的参数估计[J].电波科学学报,2013,28(6):1158-1164. 被引量：3
7高集成度线性LED驱动器[J].今日电子,2011(7):67-67.
8韩疆,尹宝林.基于多时间尺度特征的语音识别模型[J].北京航空航天大学学报,2000,26(2):201-205.
9吾守尔.斯拉木,刘俊,王飞飞.基于DDBHMM的维吾尔语语音声学层识别系统研究[J].新疆大学学报（自然科学版）,2010,27(4):381-386. 被引量：2
10朱文涛,苏涛,杨涛,郑纪彬,张龙.线性调频连续波信号检测与参数估计算法[J].电子与信息学报,2014,36(3):552-558. 被引量：16

电子学报

1998年第10期

浏览历史

内容加载中请稍等...

语音识别HMM中引入帧间相关信息的一种参数化模型被引量：3

参考文献3

二级参考文献4

共引文献8

同被引文献6

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

语音识别HMM中引入帧间相关信息的一种参数化模型 被引量：3

参考文献3

二级参考文献4

共引文献8

同被引文献6

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

语音识别HMM中引入帧间相关信息的一种参数化模型被引量：3