一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用被引量：1

The Inhomogeneous HMM with General Topological Structure and Its Application in Language Identification between Mandarin and English

下载PDF

导出

摘要为了充分利用语音信号中的段长信息,该文提出了一种具有一般拓扑结构的非齐次隐含Markov模型(Hidden Markov Model,HMM),并将其应用于中、英文语种辨识(Language IDentification,LID)系统。非齐次HMM既很好地描述了语音信号的发生过程,又准确地利用了状态的段长信息和语言中的上下文连接结构信息,对于中、英文语种辨识系统,非齐次的HMM系统辨识性能好于齐次的HMM模型。而在非齐次的HMM中,同段长为均匀分布相比,段长分布为正态分布时系统的辨识性能更好,表明段长确实是一种重要的语种区分信息之一,且正态分布较均匀分布更接近于真实的段长分布。 In order to use duration information in Language IDentification （LID） efficiently, the inhomogeneous Hidden Markov Model （HMM） with general topological structure is proposed, and is used to identify the language between Mandarin and English also. Because the inhomogeneous HMM with general topologic structure not only describes the duration of state more accurately than HMM, but also uses the structure information of specific language phonetics more effectively, the LID system based on the inhomogeneous HMM with general topological structure has better performance than the homogeneous HMM. For the LID system based on inhomogeneous HMM with different duration distribution, the norm distribution has better performance than the uniform distribution, it shows that the state duration is an important cue for language identification and the norm distribution can model the duration more accurately than the uniform distribution.

作者王作英孙健

机构地区清华大学电子工程系

出处《电子与信息学报》 EI CSCD 北大核心 2007年第4期867-869,共3页 Journal of Electronics & Information Technology

关键词语种辨识非齐次隐含Markov模型段长分布 Language identifier Inhomogeneous hidden Markov model Duration distribution

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Zissman M A and Berkling K M.Automatic language identification.Speech Communication,2001,35(1-2):115-124.
2Zissman M A.Automatic language identification using Gauss mixture and hidden Markov models,In:1993 IEEE International Conference on Acoustics,Speech,and Signal Processing,ICASSP-93,Minneapolis,Minnesota,USA,1993,2:399-402.
3House A S and Neuburg E P.Toward automatic identification of the language of an utterance.I.Preliminary methodological considerations.J.Acoust.Soc.Amer,1977,62(3):708-713.
4王作英,肖熙.基于段长分布的HMM语音识别模型[J].电子学报,2004,32(1):46-49. 被引量：42
5Wang Z Y and Gao H G.An inhomogeneous HMM speech recognition algorithm.Chinese Journal of Electronics,1998,7(1):73-77.

二级参考文献2

1齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
2王作英.基于段长分布的HMM语音识别模型 [A]..第二届全国汉字汉语识别会议 [C].庐山,1989.9.

共引文献41

1曹剑芬,李爱军,胡方,张利刚.语音学知识在语音识别中的应用:案例分析[J].清华大学学报（自然科学版）,2008,48(S1):748-753. 被引量：3
2李明琴,李涓子,王作英,陆大.语义分析和结构化语言模型[J].软件学报,2005,16(9):1523-1533. 被引量：7
3刘敬伟,王作英,肖熙.基于自回归模型的加性噪声环境稳健语音识别[J].清华大学学报（自然科学版）,2006,46(1):50-53. 被引量：2
4陈立伟,张晔.基于改进的隐马尔可夫和神经网络混合模型的语音识别[J].应用声学,2006,25(2):90-95.
5王宏,郭艳丽,贾新民.基于HMM的孤立字识别[J].昌吉学院学报,2006(1):94-98. 被引量：3
6范斐斐,李振波,陈佳品.基于K均值分段的语音识别在微机器人控制系统中的应用[J].电子技术应用,2006,32(5):4-6. 被引量：2
7赵蕤,王作英.语音识别中信道和噪音的联合补偿[J].声学学报,2006,31(5):466-470. 被引量：11
8贺无名.语音识别技术及其研究进展[J].中国科技信息,2006(18):157-158. 被引量：3
9孙健,王作英.融合段长信息的中、英文语种辨识[J].模式识别与人工智能,2006,19(5):567-571.
10孙健,王作英.集成语种辨识的中英文LVCSR系统[J].计算机工程与设计,2007,28(8):1931-1933.

同被引文献4

1巨同升.机器学习在汉字智能拼音输入中的应用[J].山东理工大学学报（自然科学版）,2005,19(3):86-88. 被引量：1
2于光峰.船载AIS信息采集与解码技术研究[J].电子技术与软件工程,2013(21):91-92. 被引量：3
3赵静.基于统计的汉英机器翻译技术的研究[J].电子设计工程,2016,24(21):69-71. 被引量：5
4刘婉婉,苏依拉,乌尼尔,仁庆道尔吉.基于LSTM的蒙汉机器翻译的研究[J].计算机工程与科学,2018,40(10):1890-1896. 被引量：7

引证文献1

1潘明阳,李琦,盛尊阔,韩斌,李超,李邵喜.AIS拼音船名到汉字的智能翻译技术[J].大连海事大学学报,2020,46(2):41-48. 被引量：1

二级引证文献1

1陈瑞.基于人机交互增强算法的英语机器翻译系统设计[J].自动化与仪器仪表,2022(4):223-226. 被引量：4

1孙健,王作英.集成语种辨识的中英文LVCSR系统[J].计算机工程与设计,2007,28(8):1931-1933.
2孙健,王作英.融合段长信息的中、英文语种辨识[J].模式识别与人工智能,2006,19(5):567-571.
3曾秀花,杨鉴,徐永华.语种辨识的多特征信息应用[J].计算机工程与应用,2010,46(25):146-148. 被引量：2
4成新民.基于帧变换的与文本无关语种辨识系统的实现[J].微电子学与计算机,2004,21(12):131-134. 被引量：1
5吴治国,刘玉宇,王作英.基于段长分布的HMM的资源受限语音识别系统[J].计算机应用,2003,23(z2):316-318.
6缪炜,侯丽敏.基于倒谱距离窗移最小失真分割的语种辨识[J].上海大学学报（自然科学版）,2007,13(2):116-120. 被引量：2
7侯丽敏,缪炜.基于韵律信息的语种辨识系统[J].上海大学学报（自然科学版）,2009,15(5):441-444.
8龚淑娟.图尔克进军RFID市场[J].汽车制造业,2006(13):12-12.
9顾艳林.优化人工蜂群算法的跨域虚拟网络映射算法[J].华侨大学学报（自然科学版）,2016,37(4):507-510.
10周思玲,孙镇.一类鲁棒辨识算法的研究[J].重庆大学学报（自然科学版）,1999,22(2):87-91.

电子与信息学报

2007年第4期

浏览历史

内容加载中请稍等...

一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用被引量：1

参考文献5

二级参考文献2

共引文献41

同被引文献4

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用 被引量：1

参考文献5

二级参考文献2

共引文献41

同被引文献4

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用被引量：1