一种改进的线性区分分析方法及其在汉语数码语音识别上的应用被引量：2

An Improved Linear Discriminant Analysis for Mandarin Digit Speech Recognition

下载PDF

导出

摘要尽管汉语数码语音识别只涉及十个数字 ,但由于不同数字的发音存在相同或相似的声母或韵母 ,造成汉语数码语音之间的混淆性很大 .采用通常的隐含马尔科夫模型 (HMM)作为汉语数码语音识别模型难以得到很高的识别率 .为了解决汉语数码之间的混淆问题 ,提高汉语数码语音识别性能 ,本文在隐含马尔科夫模型的状态层次上采用线性区分分析方法 ,将不同状态之间容易混淆的特征样本构成混淆模式类 ,针对混淆模式类进行线性区分分析 .通过线性区分变换 ,在变换特征空间中仅保留那些能够有效区分该混淆类别的特征参数 .这种基于状态的线性区分分析有效地提高了模型对混淆数码的区分能力 .实验表明即使采用状态数很少的粗糙识别模型 ,也能很大幅度提高模型的识别性能 ;经过线性区分变换优化后的汉语数码识别模型 ,孤立汉语数码语音识别率可以达到 99 32 % . It is found that the phonetic similarities in the Mandarin digits are the main reasons for the difficulty of Mandarin digit recognition.In this paper,an improved linear discriminant analysis (LDA) based on the states of hidden Markov models (HMM) is presented.The recognition model discriminability is greatly improved by gathering the confusion data to the given states and then using the state-specific discriminative transformation.The experiments show that it increases the recognition rate greatly even if the simple models with insufficient states are used.The recognition accuracy of isolated Mandarin digits is over 99.32% after using optimal linear discriminative transformation.

作者史媛媛刘加刘润生

机构地区清华大学电子工程系

出处《电子学报》 EI CAS CSCD 北大核心 2002年第7期959-963,共5页 Acta Electronica Sinica

基金国家自然科学基金 (No 699750 0 7) 国家 863项目 (No 863 30 6ZD1 3 0 4 6)

关键词线性区分分析 LDA 汉语数码语音识别区分变换隐含马尔科夫模型 HMM LDA Mandarin digit speech recognition discriminative transformation

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献14

1[1]K Fukunaga.Introduction to Statistical Pattern Recognition [M].NY:Academic Press,1990.
2[2]M J Junt,C Lefebvre.Speaker dependent and independent speech recognition experiments with an auditory model [A].Proc.ICASSP [C].USA:ICASSP,1988.215-218.
3[3]M J Hunt,C Lefebvre.A comparison of several acoustic representation for speech recognition with degraded and undegraded speech [A].Proc.ICASSP [C].USA:ICASSP,1989.262-265.
4[4]C J Leggetter.Improved acoustic modelling for HMMs using linear transformations [D].UK:Cambridge,1995
5[5]R Haeb-umbach,H Ney.Linear discriminant analysis for improved large vocabulary continuous speech recognition [A].Proc.ICASSP [C].USA:ICASSP,1992:13-16.
6[6]E S Parris,M J Carey.Estimating linear discriminant parameters for ccintinuous density hidden Markov models [A].Proc.ICSLP [C].USA:ICASSP,1994.215-218.
7[7]P C Woodland,D R Cole.Optimising hidden Markov models using discriminative output distributions [A].Proc.ICASSP [C].USA:ICASSP,1991.
8[8]Duda Richard O,Hart Peter E.Pattern Classification and Scene Analysis [M].New York:John Wiley & Sons,Inc.,1973.
9[9]E L Bocchieri,G R Doddington.Frame specific statistical features for speaker independent speech recognition [J].IEEE trans.ASSP,1986,34(4):755-764.
10[10]G R Doddington.Phonetically sensitive discriminants for improved speech recognition [A].Proc.ICASSP [C].USA:ICASSP,1989.556-559.

同被引文献12

1吕丹桔,B.Hoffmeister.汉语语音声学特征复合的研究[J].云南大学学报（自然科学版）,2010,32(S1):368-371. 被引量：3
2卢绪刚,陈道文.基于时间机理与部位机理整合的鲁棒性语音信号表达[J].生物物理学报,1999,15(3):523-529. 被引量：2
3刘加.汉语大词汇量连续语音识别系统研究进展[J].电子学报,2000,28(1):85-91. 被引量：50
4王一,杨俊安,刘辉,柳林.基于层次稀疏DBN的瓶颈特征提取方法[J].模式识别与人工智能,2015,28(2):173-180. 被引量：10
5田垚,蔡猛,何亮,刘加.基于深度神经网络和Bottleneck特征的说话人识别系统[J].清华大学学报（自然科学版）,2016,56(11):1143-1148. 被引量：13
6李婉玲,张秋菊.基于HMM/SVM的抗噪语音特征提取及优化[J].传感器与微系统,2019,38(4):55-58. 被引量：9
7周楠,赵悦,李要嫱,徐晓娜,才旺拉姆,吴立成.基于瓶颈特征的藏语拉萨话连续语音识别研究[J].北京大学学报（自然科学版）,2018,54(2):249-254. 被引量：9
8张玉来,李良荣.一种改进的DNN瓶颈特征提取方法[J].通信技术,2019,52(3):587-591. 被引量：3
9李云红,梁思程,贾凯莉,张秋铭,宋鹏,何琛,王刚毅,李禹萱.一种改进的DNN-HMM的语音识别方法[J].应用声学,2019,38(3):371-377. 被引量：17
10王一鸣,陈恳.基于稀疏DBN和双向LSTM的视觉语音识别算法[J].数据通信,2019,0(3):9-15. 被引量：4

引证文献2

1张涛,郜彦华.汉语数码语音识别中一种新的抗噪声特征参数[J].河南科技大学学报（自然科学版）,2005,26(3):46-48. 被引量：2
2郑文秀,连晓飞,张旭东,黄琼丹.基于稀疏DNN的声学复合特征构造方法[J].传感器与微系统,2021,40(12):69-72. 被引量：1

二级引证文献3

1张松灿,梁云朋,曹哲.基于OMAP5912和RSC364的语音识别系统实现[J].河南科技大学学报（自然科学版）,2008,29(5):40-42.
2龚赟,曾庆山.独立分量分析法改进商图像[J].河南科技大学学报（自然科学版）,2011,32(3):30-33.
3王常晶,范希营,刘欣,李春晓,王德炤.基于DNNNSGA-Ⅱ策略的注塑结构及工艺参数多目标优化[J].塑料,2023,52(2):181-186.

1张涛,郜彦华.汉语数码语音识别中一种新的抗噪声特征参数[J].河南科技大学学报（自然科学版）,2005,26(3):46-48. 被引量：2
2朴兴哲.语音合成库的建立与汉语数码语音识别途径[J].石油化工高等学校学报,1997,10(1):45-48.
3钟明辉,曹乃文,黄汉明,郑建华,陈芽玲.基于连续HMM的汉语数码语音识别系统[J].广西物理,2007,28(4):24-26. 被引量：4
4刘媛,方景林,翁松怡,曹继华.基于DSP技术的汉语数码语音识别系统[J].仪器仪表学报,2003,24(z1):537-539.
5顾良,刘润生.利用声调判别提高汉语数码语音识别性能[J].清华大学学报（自然科学版）,1998,38(9):36-39. 被引量：7
6韦忠善,王力虎,李廷会.基于双神经网络的模拟电路故障诊断[J].低压电器,2008(3):17-19. 被引量：1
7史媛媛,刘加,刘润生.基于二次多项式后验概率估计的汉语数码语音识别[J].电路与系统学报,1999,4(4):36-41.
8高清伦,谭月辉,王嘉祯.基于离散隐马尔科夫模型的语音识别技术[J].河北省科学院学报,2007,24(2):8-11. 被引量：3
9顾良,刘润生.汉语数码语音识别:发展现状、难点分析与方法比较[J].电路与系统学报,1997,2(4):32-39. 被引量：12
10王朋,陈树中.基于混合模型HMM/RBF的数字语音识别[J].计算机工程,2002,28(12):136-138. 被引量：7

电子学报

2002年第7期

浏览历史

内容加载中请稍等...

一种改进的线性区分分析方法及其在汉语数码语音识别上的应用被引量：2

参考文献14

同被引文献12

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种改进的线性区分分析方法及其在汉语数码语音识别上的应用 被引量：2

参考文献14

同被引文献12

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种改进的线性区分分析方法及其在汉语数码语音识别上的应用被引量：2