期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用 被引量:1
1
作者 王作英 孙健 《电子与信息学报》 EI CSCD 北大核心 2007年第4期867-869,共3页
为了充分利用语音信号中的段长信息,该文提出了一种具有一般拓扑结构的非齐次隐含Markov模型(Hidden Markov Model,HMM),并将其应用于中、英文语种辨识(Language IDentification,LID)系统。非齐次HMM既很好地描述了语音信号的发生过程,... 为了充分利用语音信号中的段长信息,该文提出了一种具有一般拓扑结构的非齐次隐含Markov模型(Hidden Markov Model,HMM),并将其应用于中、英文语种辨识(Language IDentification,LID)系统。非齐次HMM既很好地描述了语音信号的发生过程,又准确地利用了状态的段长信息和语言中的上下文连接结构信息,对于中、英文语种辨识系统,非齐次的HMM系统辨识性能好于齐次的HMM模型。而在非齐次的HMM中,同段长为均匀分布相比,段长分布为正态分布时系统的辨识性能更好,表明段长确实是一种重要的语种区分信息之一,且正态分布较均匀分布更接近于真实的段长分布。 展开更多
关键词 语种辨识 非齐次隐含Markov模型 段长分布
下载PDF
分布式语音识别系统的架构分析和具体实现
2
作者 孟建庭 吴及 王作英 《电声技术》 北大核心 2004年第8期51-53,共3页
研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端/服务器架构的分布式语音识别系统。系统采用基于段长分布的隐含马尔可夫模型(DDBHMM)的识别算法,使用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到... 研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端/服务器架构的分布式语音识别系统。系统采用基于段长分布的隐含马尔可夫模型(DDBHMM)的识别算法,使用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到稳定高效的性能。 展开更多
关键词 语音识别 分布式语音识别 段长分布的隐含弥可夫模型
下载PDF
非凸段长分布隐含Markov模型的搜索算法
3
作者 吴及 肖熙 +1 位作者 许琳 王作英 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第7期924-927,共4页
基于段长分布的隐含Markov模型(DDBHMM)可解决经典隐含Markov模型(HMM)的状态段长指数分布的问题,实现了基于凸性假设的搜索。为解决非齐次模型的搜索算法问题,提出采用混合Gauss分布来拟合非凸段长分布,用子状态拆分的方法来实现非凸... 基于段长分布的隐含Markov模型(DDBHMM)可解决经典隐含Markov模型(HMM)的状态段长指数分布的问题,实现了基于凸性假设的搜索。为解决非齐次模型的搜索算法问题,提出采用混合Gauss分布来拟合非凸段长分布,用子状态拆分的方法来实现非凸段长分布DDBHMM识别算法。在音乐信号识别上的实验表明:该方法在召回率提高1.1%的情况下,使准确率提高约10%。该方法实现了非凸段长分布HMM的识别算法,并且对于其他非凸段长信号具有推广价值。 展开更多
关键词 语音识别 隐含马尔可夫模型 非凸性段长分布
原文传递
集成语种辨识的中英文LVCSR系统
4
作者 孙健 王作英 《计算机工程与设计》 CSCD 北大核心 2007年第8期1931-1933,共3页
为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。... 为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。为了在中、英文连续语音识别系统中能够尽早的对语音所属的语言种类做出判决以便进行识别,从而降低解码的计算量,对语种辨识过程中的语种剪枝进行了研究,表明采用合理的语种剪枝门限在不降低系统性能的情况下,可以有效的降低系统的计算量及识别时间。 展开更多
关键词 连续语音识别 语种辨识 段长分布 非齐次隐含马尔科模型 语种剪枝
下载PDF
基于自回归模型的加性噪声环境稳健语音识别 被引量:2
5
作者 刘敬伟 王作英 肖熙 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第1期50-53,共4页
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb l... 为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。 展开更多
关键词 语音识别 稳健性 自回归模型 段长分布 隐含Markov模型
原文传递
融合段长信息的中、英文语种辨识
6
作者 孙健 王作英 《模式识别与人工智能》 EI CSCD 北大核心 2006年第5期567-571,共5页
状态的段长信息反映语言发音变化速率的信息.不同语言的发音速率也存在着差异,因此状态的段长信息可以作为区分语种的信息之一.本文在建立基于段长分布的隐含 Markov 模型(DDBHMM)的音素识别系统和大词汇量连续语音识别(LVCSR)系统的基... 状态的段长信息反映语言发音变化速率的信息.不同语言的发音速率也存在着差异,因此状态的段长信息可以作为区分语种的信息之一.本文在建立基于段长分布的隐含 Markov 模型(DDBHMM)的音素识别系统和大词汇量连续语音识别(LVCSR)系统的基础上进行中、英文语种辨识,表明DDBHMM可以准确描述状态的段长信息,改善中、英文语种的辨识性能. 展开更多
关键词 语种辨识 基于段长分布的隐含Markov模型(DDBHMM) Gauss混合模型 连续音素识别 大词汇量连续语音识别(LVCSR)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部