基于后验概率解码段模型的汉语语音数字串识别被引量：12

Mandarin Digit String Recognition Based on Segment Model Using Posterior Probability Decoding

下载PDF

导出

摘要通过对语音解码的分析指出了基于似然概率解码的连续语音识别的局限性,并给出了三种基于后验概率段模型(Segment Model,SM)的语音解码方法.这三种方法成功地运用于随机段模型(Stochastic Segment Model,SSM),使误识率比基线系统下降了11%;与此同时还给出了段模型的快速算法,使算法的计算复杂度降到了与隐马尔可夫模型(Hidden Markov Model,HMM)相同的数量级,满足了实用要求. The decoding algorithms of most continuous speech recognition systems are based on the likelihood score now. However, the likelihood score is only an approximate of the posterior probability and will lead to a suboptimal solution in continuous speech recognition task. In this paper, three Segment Model（SM） decoding methods based on posterior probability are introduced and successfully implemented on a Stochastic Segment Model（SSM） based system. SSM is one kind of segment models. The new decoding methods achieve 11% error rate reduction compared with the baseline system. In the meantime, a fast algorithm for SM is also proposed, which can reduce the computation complexity of the above algorithms to the same level as that of HMM and meet the requirement of real-time applications.

作者唐赟刘文举徐波

机构地区中国科学院自动化研究所模式识别国家重点实验室

出处《计算机学报》 EI CSCD 北大核心 2006年第4期635-641,共7页 Chinese Journal of Computers

基金国家自然科学基金(60172055 60121302) 北京市自然科学基金(4042025) 国家"九七三"重点基础研究发展规划项目基金(2004CB318105)资助

关键词后验概率段模型汉语数字串语音识别模式识别 posterior probability segment model mandarin digit string speech recognition pattern recognition

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献17

1Huang X.D,Acero A,Hon H.W..Spoken Language Processing:A Guide to Theory,Algorithm and System Development.New Jersey:Prentice Hall,2001
2Juang B,Furi S..Automatic recognition and understanding of spoken language-A first step toward natural human-machine communication.Proceedings of the IEEE,2000,88(8):1142～1165
3Rabiner L,Juang B.H..Fundamentals of Speech Recognition.New Jersey:Prentice Hail,1993
4Ostendorf M,Digalakis V.V,Kimball O.A..From HMM's to segment models:A unified view of stochastic modeling for speech recognition.IEEE Transactions on Speech Audio Processing,1996,4(5):360～378
5Gong Y..Stochastic trajectory modeling and sentence searching for continuous speech recognition.IEEE Transactions on Speech Audio Processing,1997,5(1):33～44
6Dugakakis V.V,Ostendorf M,Rohlicek J.R..Fast algorithms for phone classification and recognition using segment-based models.IEEE Transactions Speech Audio Processing,1992,40(12):2885～2896
7Lee C,Glass R..Real-time probabilistic segmentation for segment-based speech recognition.In:Proceedings of the International Conference on Spoken Language Processing,Sydney,Australia,1998,1803～1806
8Ostendorf M,Roukos S..A stochastic segment model for phoneme based continuous speech recognition.IEEE Transactions on Acoustics,Speech and Signal Processing,1989,37(12):1857～ 1869
9Gish H,Ng K,Rohlicek R..Secondary processing using speech segments for an HMM word spotting system.In:Proceedings of the International Conference on Spoken Language Processing,Alberta,Canada,1992,1:17～20
10Rueber B..Obtaining confidence measures from sentence probabilities.In:Proceedings of the 5th European Conference on Speech Communication and Technology,Rhodes,Greece,2001,739～742

二级参考文献3

1李虎生,杨明杰,刘润生.汉语数码语音识别自适应算法[J].电路与系统学报,1999,4(2):1-6. 被引量：4
2李虎生,刘加,刘润生.高性能汉语数码语音识别算法[J].清华大学学报（自然科学版）,2000,40(1):32-34. 被引量：20
3赵庆卫,肖熙,王作英.段长信息在连续语音识别中的应用研究[J].声学学报,2000,25(2):175-181. 被引量：5

共引文献8

1丁昊,姚天任.基于mel标度频谱和音素分割的汉语语音单词端点检测方法[J].计算机与数字工程,2005,33(3):57-59. 被引量：3
2毕文军,高健.语音人机界面标引系统的实现[J].微计算机信息,2005,21(4):232-233. 被引量：9
3张培玲,王福忠,刘群坡.连续数码串语音识别系统的MATLAB实现[J].河南理工大学学报（自然科学版）,2009,28(2):211-216.
4汤霖,蔡莲红.基于层级策略的连续数字串识别的研究[J].计算机工程与应用,2003,39(21):83-86.
5邓伟,赵翊兰.一种基于HMM的动态语音模式时间归一化方法[J].数据采集与处理,2003,18(3):277-281. 被引量：2
6汤霖,蔡莲红.训练方法对汉语数字串识别率影响的研究[J].湘潭大学自然科学学报,2003,25(3):16-20.
7张翼燕,刘文举,徐波.分段模型在解码假设检验中的应用[J].中文信息学报,2004,18(1):70-77.
8黄秋安,姜波,汪秉文.基于有限状态机的汉语数字语音端点检测[J].湖北大学学报（自然科学版）,2004,26(1):35-38. 被引量：4

同被引文献144

1彭荻,刘刚,郭军.语音识别系统中上下文相关声学模型建模优化[J].北京邮电大学学报,2006,29(z2):188-191. 被引量：2
2李健,王作英.HMM转移概率的新的重估算法[J].电子学报,2001,29(z1):1833-1835. 被引量：5
3罗骏,欧智坚,王作英.基于相关子空间本征音分析的MAP快速自适应[J].清华大学学报（自然科学版）,2004,44(6):829-832. 被引量：2
4林贤明,李堂秋,史晓东.基于模板的机器翻译系统中模板库的自动构建技术[J].计算机应用,2004,24(9):127-128. 被引量：4
5于胜民,张树武,徐波.汉英双语混合声学建模方法研究[J].中文信息学报,2004,18(5):78-84. 被引量：4
6秦兵,刘挺,李生.基于局部主题判定与抽取的多文档文摘技术[J].自动化学报,2004,30(6):905-910. 被引量：10
7梅立军,周强,臧路,陈祖舜.知网与同义词词林的信息融合研究[J].中文信息学报,2005,19(1):63-70. 被引量：28
8刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量：7
9张春祥,赵铁军,杨沐昀,李生,时晓升.机器翻译系统跨领域移植方法的研究[J].计算机工程与应用,2005,41(3):10-11. 被引量：1
10李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33

引证文献12

1李生,赵铁军.Chinese Information Processing and Its Prospects[J].Journal of Computer Science & Technology,2006,21(5):838-846. 被引量：1
2袁里驰.基于改进的隐马尔科夫模型的语音识别方法[J].中南大学学报（自然科学版）,2008,39(6):1303-1308. 被引量：19
3袁里驰.Improved hidden Markov model for speech recognition and POS tagging[J].Journal of Central South University,2012,19(2):511-516. 被引量：4
4晁浩,杨占磊,刘文举.汉语语音识别中基于音节的声学模型改进算法[J].计算机应用,2013,33(6):1742-1745. 被引量：1
5晁浩,杨占磊,刘文举.汉语语音识别中声学界标点引导的随机段模型解码算法[J].计算机科学,2013,40(10):208-212. 被引量：1
6晁浩,杨占磊,刘文举.基于最大似然线性回归的随机段模型说话人自适应研究[J].计算机工程与科学,2014,36(8):1604-1608.
7晁浩,杨占磊,刘文举.汉语语音识别中融合发音信息的随机段模型研究[J].计算机应用研究,2014,31(11):3365-3368. 被引量：1
8晁浩,宋成,刘志中.语音识别中基于发音特征的声调集成算法[J].计算机工程与应用,2014,50(23):21-25. 被引量：2
9晁浩,刘志中,薛霄.汉语语音识别中融合发音信息的随机段模型研究[J].计算机应用研究,2015,32(4):1087-1090. 被引量：1
10晁浩.融合音素串编辑距离的随机段模型解码算法[J].计算机工程与应用,2015,51(6):208-211.

二级引证文献34

1袁里驰.基于依存关系的句法分析统计模型[J].中南大学学报（自然科学版）,2009,40(6):1630-1635. 被引量：11
2林春丽,齐欣,王克成.SVM-KNN分类器在异常行为检测中的应用[J].辽宁科技大学学报,2010,33(5):449-452. 被引量：3
3李青,邓月明,王赟,莫崇晟,刘斌,贺洪平,李慧玲.基于声纹识别的智能小区认证系统设计[J].网络安全技术与应用,2011(4):36-38. 被引量：3
4袁里驰.基于词聚类的依存句法分析[J].中南大学学报（自然科学版）,2011,42(7):2023-2027. 被引量：10
5樊启高,李威,王禹桥,范孟豹,杨雪锋.一种采用灰色马尔科夫组合模型的采煤机记忆截割算法[J].中南大学学报（自然科学版）,2011,42(10):3054-3058. 被引量：31
6袁里驰.基于改进的隐马尔科夫模型的词性标注方法[J].中南大学学报（自然科学版）,2012,43(8):3053-3057. 被引量：14
7王凯.免疫粒子群改进LBG的孤立词语音识别算法研究[J].数字技术与应用,2013,31(1):111-113. 被引量：1
8宗中.中文信息检索中词典机制分词算法的研究[J].计算机技术与发展,2014,24(4):118-121. 被引量：6
9李华栋,贾真,尹红风,杨燕.基于规则的汉语兼类词标注方法[J].计算机应用,2014,34(8):2197-2201. 被引量：2
10晁浩,宋成,刘志中.语音识别中基于发音特征的声调集成算法[J].计算机工程与应用,2014,50(23):21-25. 被引量：2

1汤霖,蔡莲红.训练方法对汉语数字串识别率影响的研究[J].湘潭大学自然科学学报,2003,25(3):16-20.
2王欢良,钱瑶,F.K.Soong,韩纪庆.基于声调建模的带噪汉语数字串语音识别[J].声学学报,2007,32(5):454-460. 被引量：2
3张剑,屈丹,李真.基于循环神经网络语言模型的N-best重打分算法[J].数据采集与处理,2016,31(2):347-354. 被引量：3
4刘坤,李晖晖.基于Contourlet域HMT似然概率的图像融合方法[J].光电子．激光,2013,24(10):2031-2037. 被引量：2
5肖敏,刘宇红.SD卡硬件加密在工业MP3中的实现[J].通信技术,2012,45(11):34-36. 被引量：1
6宋婉娟.基于支持向量机的手写数字串识别[J].湖北第二师范学院学报,2010,27(2):84-86. 被引量：1
7姚文冰,姚天任,韩涛.语音编/解码仿真中S函数的设计与应用[J].华中科技大学学报（自然科学版）,2001,29(5):83-85. 被引量：4
8项要杰,杨俊安,李晋徽,杨瑞国.关联小波神经网络与高斯混合模型说话人识别[J].探测与控制学报,2013,35(6):65-70. 被引量：1
9商娟叶.基于数据融合的Bayes估计算法研究[J].自动化与仪器仪表,2016(2):118-120. 被引量：6
10雷曙光.基于HMM的CPU行为模型及其在系统主动防御中的应用[J].中小企业管理与科技,2011(31):301-302.

计算机学报

2006年第4期

浏览历史

内容加载中请稍等...

基于后验概率解码段模型的汉语语音数字串识别被引量：12

参考文献17

二级参考文献3

共引文献8

同被引文献144

引证文献12

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于后验概率解码段模型的汉语语音数字串识别 被引量：12

参考文献17

二级参考文献3

共引文献8

同被引文献144

引证文献12

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于后验概率解码段模型的汉语语音数字串识别被引量：12