基于连续高斯混合密度HMM的汉语全音节语音识别研究被引量：11

A study of speech recognition of complete Chinese syllables based on continuous Gaussian Mixture HMM

导出

摘要本文在大量语音分析实验的基础上，对ＨＭＭ用于汉语全音节语音识别进行了较为深入的探讨，建立了一个连续高斯混合密度ＨＭＭ的汉语全音节语音识别系统．该系统在训练算法上撇开了传统的Ｂａｕｍ－Ｗｅｌｃｈ算法，代之以计算复杂度小、存储量小、迭代次数少且具有自动分割效应的分段Ｋ平均算法。对于ＨＭＭ的模型单元的选择，单元的结构以及模型参数的选取，充分考虑了汉语语音的特点；并在语音特征上做了深入的实验分析工作，采用了符合人耳听觉特性的Ｍｅｌ－Ｓｃａｌｅｄ参数，用ＦＦＴ倒谱代替了ＬＰＣ倒谱，同时利用了语音的动态谱特征和能量特征。另外，本文还针对汉语声母的特点，独特地提出了变帧移分析策略。整个识别系统的首选正识率为９１．１％． Based on a large amount of speech study and experiments,this paper gives a deep study on how HMM is applied to the Chinese speech recognition,and establishal a speech recognition system of complete Chinese syllables using the continuous Gaussian Mixture HMM. The systems does not adopt the traditional Baum-Welch Algorithm, but uses segmental K-Means Training.which needs much smaller memory,calculation and iteration times,and can give automatic segmentation of Speech.On the choise of HMM unit,unit structure,and unit parameters,the poper gives a thorough consideration for the properties of Chinese speech.The paper also gives a deep study on speech features,and employed Mel-Scaled FFT-CEP (instead of LPC-CEP) and its regression coefficients,normalized log-energy and its regression coefficients.In addition,the paper proposes the Variant Frame Shift Analysis Algorithm considering characteristics of consonants.The system recognition rate is 91.1 %.

作者国立新莫福源李昌立

机构地区中国科学院声学研究所

出处《声学学报》 EI CSCD 北大核心 1995年第5期321-329,共9页 Acta Acustica

关键词 HMM 语音识别汉语全音节

分类号 TN912.34 [电子电信—通信与信息系统] O423 [理学—声学]

引文网络
相关文献

参考文献8

1国立新，硕士学位论文，1994年
2陈韬，第六届全国语音图象通迅信号处理学术会议，1993年
3Lee Yumin，Computer Speech Lang，1993年，7卷，247页
4陈韬，声学学报，1993年，18卷，161页
5Lee Linshan，Computer Speech Lang，1991年，5卷，181页
6蔡元龙，模式识别，1990年
7Huang X D，Hidden Markov models for speech recognition，1989年
8齐士钤，声学学报，1982年，7卷，1期，8页

同被引文献82

1印欣运,何永勇,彭志科,褚福磊.小波熵及其在状态趋势分析中的应用[J].振动工程学报,2004,17(2):165-169. 被引量：49
2鄢田云,云霞,靳蕃,朱庆军.RBF神经网络及其在基于输出的客观音质评价中的应用[J].电子学报,2004,32(8):1282-1285. 被引量：7
3赵鹤鸣,周旭东.基于知识的汉语连续语音识别研究[J].计算机研究与发展,1993,30(6):44-48. 被引量：2
4徐士林,樊懋.基于知识的汉语语音识别系统[J].模式识别与人工智能,1993,6(1):49-54. 被引量：1
5战普明,王作英,陆大.语音识别隐马尔可夫模型的改进[J].电子学报,1994,22(1):9-15. 被引量：9
6徐士林,应勇.汉语声调的多特征模糊识别方法[J].模式识别与人工智能,1994,7(1):60-65. 被引量：4
7关存太,陈永彬,吴伯修.全音节汉语语音识别系统的声学模型研究[J].声学学报,1994,19(5):321-330. 被引量：4
8傅晓,林道发,杨家沅.全音节连续汉语语音识别的研究[J].信号处理,1994,10(3):161-167. 被引量：5
9林茂灿.北京话声调分布区的知觉研究[J].声学学报,1995,20(6):437-445. 被引量：38
10周俏峰,蔡莲红.音节数据库基音自动标注工具的研究[J].小型微型计算机系统,1995,16(10):12-17. 被引量：2

引证文献11

1刘海滨,吴镇扬,赵力,曾毓敏.噪声环境下基于最大后验非线性变换的隐马尔可夫模型自适应算法[J].声学学报,2004,29(5):467-471. 被引量：4
2戚建宇,赵鹤鸣,何松.基于HMM的普通话单字发音准确度评价方法研究[J].计算机工程与应用,2007,43(7):224-226. 被引量：3
3马明,张杰,王建宇,黄志同.语音识别中隐马尔可夫模型初值的估计[J].数据采集与处理,1997,12(2):96-100. 被引量：3
4潘奇明,程咏梅.基于隐马尔可夫模型的运动目标轨迹识别[J].计算机应用研究,2008,25(7):1988-1991. 被引量：10
5李林.基于HMM的触点轨迹识别[J].工业控制计算机,2011,24(4):89-91.
6李战明,宋丙菊.基于隐马尔可夫模型的ATM机用户异常行为识别[J].兰州理工大学学报,2012,38(5):76-81. 被引量：2
7董帅飞,于凤芹.基于Chirp原子MP分解的汉语声母时频结构分析[J].计算机工程与应用,2014,50(1):200-202. 被引量：1
8钟金宏,杨善林,蒋俊杰.汉语连续语音中声调识别的特殊性研究[J].小型微型计算机系统,2002,23(4):470-473. 被引量：2
9丛华,崔超,刘远宏,冯辅周.基于排列熵和CHMM的齿轮故障诊断[J].失效分析与预防,2015,10(2):72-77. 被引量：1
10胡石,章毅,陈芳,陈心怡.基于HMM模型语音识别系统中声学模型的建立[J].通讯世界,2017,23(8):233-234. 被引量：6

二级引证文献48

1孔庆鹏,宋开臣,陈鹰浙.基于分段最小二乘拟合的瞬时频率估计方法[J].农业机械学报,2006,37(11):204-206. 被引量：7
2贾继德,孔凡让,王建平,刘维来,干方建,龙潜,陈剑,陈兴昭.基于瞬时频率估计的内燃机信号阶比分析[J].内燃机工程,2005,26(3):15-18. 被引量：13
3孔庆鹏,宋开臣,陈鹰.发动机变速阶段振动信号时频分析阶比跟踪研究[J].振动工程学报,2005,18(4):448-452. 被引量：29
4宋雪萍,马辉,毛国豪,闻邦椿.基于CHMM的旋转机械故障诊断技术[J].机械工程学报,2006,42(5):126-130. 被引量：12
5刘彬,宋文健.基于激光多普勒效应的回转机械振动测量方法[J].计量技术,2006(9):11-14. 被引量：3
6李辉,郑海起,唐力伟.瞬时频率估计的齿轮箱升降速信号阶次跟踪[J].振动．测试与诊断,2007,27(2):125-128. 被引量：21
7廖坤鹏,傅俊庆.一种新的谱分析方法——转谱分析[J].长沙理工大学学报（自然科学版）,2007,4(2):54-58. 被引量：1
8王欢良,钱瑶,F.K.Soong,韩纪庆.基于声调建模的带噪汉语数字串语音识别[J].声学学报,2007,32(5):454-460. 被引量：2
9张玉存,刘彬.基于拓扑反变算子动力系统振动频率检测方法的研究[J].计量学报,2007,28(1):56-60.
10刘彬,蒋金水,宋文健.激光测量回转机械振动的新方法[J].计量学报,2008,29(2):145-148. 被引量：3

1王强,李笑歌.基于K平均算法的自由空间光信号检测方案[J].光通信研究,2016(4):63-66. 被引量：1
2陆汝华,樊晓平,杨胜跃,周芳芳.基于音频信号的轴承故障诊断方法[J].电子技术应用,2008,34(9):112-114. 被引量：4
3唐朝京,吴自强,王跃科,张南,周代英,王成友.一种基于改进的SEVQ匹配算法的汉语全音节语音识别系统[J].国防科技大学学报,1997,19(3):39-43. 被引量：1
4张焱,姜惠春,黄志同.隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究[J].声学学报,1998,23(6):555-563. 被引量：8
5李飞,徐思均,管叙涛.用于汉语全音节识别的新特征参数——频变参数[J].南京邮电学院学报,1990,10(3):1-4.
6黄秋情,杨秀芝,郑明魁,苏凯雄.一种高清帧内预测单元快速选择算法[J].福州大学学报（自然科学版）,2016,44(1):57-63.
7李志鹏,陈善广,薛亮.解决Baum-Welch算法下溢问题的参数重估公式中存在的问题及其更正[J].声学学报,2001,26(5):468-475. 被引量：1
8邢文龙,张伯虎.HMM语音识别系统中Baum-Welch算法的优化[J].江苏科技信息,2013(19):58-59.
9王国刚,朱秀昌.与观测信息相关的n阶隐马尔可夫模型的参数估计[J].南京邮电大学学报（自然科学版）,2013,33(6):48-53. 被引量：1
10贾宾,朱小燕,罗予频,tsinghua.edu.cn,胡东成.消除溢出问题的精确Baum-Welch算法[J].软件学报,2000,11(5):707-710. 被引量：7

声学学报

1995年第5期

浏览历史

内容加载中请稍等...

基于连续高斯混合密度HMM的汉语全音节语音识别研究被引量：11

参考文献8

同被引文献82

引证文献11

二级引证文献48

相关作者

相关机构

相关主题

浏览历史

基于连续高斯混合密度HMM的汉语全音节语音识别研究 被引量：11

参考文献8

同被引文献82

引证文献11

二级引证文献48

相关作者

相关机构

相关主题

浏览历史

基于连续高斯混合密度HMM的汉语全音节语音识别研究被引量：11