隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究被引量：8

A study on speech recognition with whole Chinese syllables in unified frame of HMM and DTW

下载PDF

导出

摘要提出了广义模型，将动态时间规正（DTW,DynamicTimeWarping）技术和隐马尔可夫模型（HMM，HiddenMarkovModel）统一到一个语音声学模型的框架内．分析表明，广义模型更接近语音实际情况并具有很小的存储量．还利用广义模型构造了汉语全音节语音识别器，和离散HMM及DTW的对比实验结果显示：对于特定人识别，广义模型的识别性能和DTW相当而高于离散HMM；对于非特定人识别，广义模型的识别性能高于DTW和离散HMM。 In this paper, the Generalized Model (GM) is defined, which unifles Dynamic Time Warping (DTW) and Hidden Markov Model (HMM) illto a frame of acoustical model. Analysis indicates that GMdescribes speech signal more exactly and needs less storage cost. The GM is employed as the recognizer of a speech recognition system of whole Chinese syllables, and the comparative experiment results of GM, Discrete HMM (DHMM) and DTW show that in speaker dependent situation, the performance of GM is equivalent to that of DTW and better than that of DHMM, and in speaker independent situation,is better than that of both DHMM and DTW.

作者张焱姜惠春黄志同

机构地区南京理工大学自控系

出处《声学学报》 EI CSCD 北大核心 1998年第6期555-563,共9页 Acta Acustica

关键词 DTW HMM 汉语全音节语音识别

分类号 TN912.34 [电子电信—通信与信息系统] TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1马明，数据采集与处理，1997年，12卷，96页
2杨行峻，语音信号数字处理，1995年

同被引文献72

1左国玉,刘文举,阮晓钢.声音转换技术的研究与进展[J].电子学报,2004,32(7):1165-1172. 被引量：32
2吴晓平,崔光照,路康.基于DTW算法的语音识别系统实现[J].电子工程师,2004,30(7):17-19. 被引量：18
3谷志新,王述洋,田仲富.声纹识别技术中特征语音参数选取的相关问题[J].林业劳动安全,2005,18(2):27-30. 被引量：2
4杜利民,侯自强.汉语语音识别研究面临的一些科学问题[J].电子学报,1995,23(10):110-116. 被引量：21
5张保轩,邵献之.基于ANN的汉语数字语音识别[J].山东电子,1995(1):20-22. 被引量：1
6国立新,莫福源,李昌立.基于连续高斯混合密度HMM的汉语全音节语音识别研究[J].声学学报,1995,20(5):321-329. 被引量：11
7许开宇,张曙.基于小波分析的汉语语音识别[J].哈尔滨工程大学学报,1996,17(4):20-26. 被引量：5
8康永国,双志伟,陶建华,张维.基于混合映射模型的语音转换算法研究[J].声学学报,2006,31(6):555-562. 被引量：13
9科恩L.时－频分析：理论与应用[M].西安:西安交通大学出版社,1998..
10刘国亭,赵瑞云.隐马尔柯夫模型在信号检测中的应用[J].上海交通大学学报,1997,31(4):114-117. 被引量：2

引证文献8

1连海伦,周健,胡雨婷,郑文明.利用深度卷积神经网络将耳语转换为正常语音[J].声学学报,2020,45(1):137-144. 被引量：8
2张宜.汉语语音识别技术的研究与发展[J].广西广播电视大学学报,2003,14(4):18-22. 被引量：3
3康永国,双志伟,陶建华,张维.基于混合映射模型的语音转换算法研究[J].声学学报,2006,31(6):555-562. 被引量：13
4张钢,朱铮涛,何淑贤.应用DTW的语音(声纹)鉴别技术研究[J].中国测试技术,2007,33(2):120-123. 被引量：3
5张杰,余志刚,黄志同.语音识别中广义模型及其算法收敛性分析[J].计算机工程与应用,2000,36(2):60-62.
6解伟超,张玲华.基于自组织聚类和改进粒子群算法的语音转换方法[J].声学学报,2014,39(1):130-136. 被引量：1
7周健,窦云峰,刘荣敏,王华彬,陶亮.采用低维特征映射的耳语音向正常音转换[J].声学学报,2018,43(5):855-863. 被引量：2
8梁玉前,秦树人,郭瑜.旋转机械升降速信号的瞬时频率估计[J].机械工程学报,2003,39(9):75-80. 被引量：16

二级引证文献46

1孔庆鹏,宋开臣,陈鹰浙.基于分段最小二乘拟合的瞬时频率估计方法[J].农业机械学报,2006,37(11):204-206. 被引量：7
2贾继德,孔凡让,王建平,刘维来,干方建,龙潜,陈剑,陈兴昭.基于瞬时频率估计的内燃机信号阶比分析[J].内燃机工程,2005,26(3):15-18. 被引量：13
3孔庆鹏,宋开臣,陈鹰.发动机变速阶段振动信号时频分析阶比跟踪研究[J].振动工程学报,2005,18(4):448-452. 被引量：29
4陆永兵,吕晓妍.图书借阅证语音挂失的设计与实现[J].情报理论与实践,2006,29(2):243-245. 被引量：1
5宋雪萍,马辉,毛国豪,闻邦椿.基于CHMM的旋转机械故障诊断技术[J].机械工程学报,2006,42(5):126-130. 被引量：12
6刘彬,宋文健.基于激光多普勒效应的回转机械振动测量方法[J].计量技术,2006(9):11-14. 被引量：3
7李辉,郑海起,唐力伟.瞬时频率估计的齿轮箱升降速信号阶次跟踪[J].振动．测试与诊断,2007,27(2):125-128. 被引量：21
8廖坤鹏,傅俊庆.一种新的谱分析方法——转谱分析[J].长沙理工大学学报（自然科学版）,2007,4(2):54-58. 被引量：1
9张玉存,刘彬.基于拓扑反变算子动力系统振动频率检测方法的研究[J].计量学报,2007,28(1):56-60.
10刘彬,蒋金水,宋文健.激光测量回转机械振动的新方法[J].计量学报,2008,29(2):145-148. 被引量：3

1田光见,赵荣椿.步态识别综述[J].计算机应用研究,2005,22(5):20-22. 被引量：16
2刘琼.C8051F040单片机在语音识别系统中的应用[J].世界电子元器件,2012(8):38-40. 被引量：1
3刘其洪,李仲阳,徐孟龙.基于语音识别的智能家居系统研究[J].信息化纵横,2009(14):80-83. 被引量：3
4马明,张元,王建宇,黄志同.语音识别中的动态时间规正和隐马尔可夫模型等价性研究[J].郑州大学学报（自然科学版）,1996,28(2):34-39. 被引量：2
5田光见,赵荣椿.基于傅立叶描绘子的步态识别[J].计算机应用,2004,24(11):124-125. 被引量：4
6陈韬,李昌立,莫福源.汉语孤立字全音节实时识别系统[J].声学学报,1993,18(3):161-171. 被引量：4
7Harold Mouchere,李锦鹏,Christian Viard-Gaudin,陈肇欣.多笔画联机手写字符识别的动态时间规正算法(英文)[J].华南理工大学学报（自然科学版）,2013,41(7):107-113. 被引量：1
8栾方军,李开,徐慧红.基于特殊点的DTW在线手写签名认证算法[J].现代计算机,2008,14(11):12-14.
9张培玲,成凌飞.基于MATLAB的汉语数字语音识别系统[J].机械管理开发,2011,26(4):205-207. 被引量：1
10刘敬伟,徐美芝,郑忠国,程乾生.基于DTW的语音识别和说话人识别的特征选择[J].模式识别与人工智能,2005,18(1):50-54. 被引量：13

声学学报

1998年第6期

浏览历史

内容加载中请稍等...

隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究被引量：8

参考文献2

同被引文献72

引证文献8

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究 被引量：8

参考文献2

同被引文献72

引证文献8

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

隐马尔可夫模型和动态时间现正统一框架下的汉语全音节语音识别研究被引量：8