期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
非凸段长分布隐含Markov模型的搜索算法
1
作者 吴及 肖熙 +1 位作者 许琳 王作英 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第7期924-927,共4页
基于段长分布的隐含Markov模型(DDBHMM)可解决经典隐含Markov模型(HMM)的状态段长指数分布的问题,实现了基于凸性假设的搜索。为解决非齐次模型的搜索算法问题,提出采用混合Gauss分布来拟合非凸段长分布,用子状态拆分的方法来实现非凸... 基于段长分布的隐含Markov模型(DDBHMM)可解决经典隐含Markov模型(HMM)的状态段长指数分布的问题,实现了基于凸性假设的搜索。为解决非齐次模型的搜索算法问题,提出采用混合Gauss分布来拟合非凸段长分布,用子状态拆分的方法来实现非凸段长分布DDBHMM识别算法。在音乐信号识别上的实验表明:该方法在召回率提高1.1%的情况下,使准确率提高约10%。该方法实现了非凸段长分布HMM的识别算法,并且对于其他非凸段长信号具有推广价值。 展开更多
关键词 语音识别 隐含马尔可夫模型 非凸性段长分布
原文传递
分布式语音识别系统的架构分析和具体实现
2
作者 孟建庭 吴及 王作英 《电声技术》 北大核心 2004年第8期51-53,共3页
研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端/服务器架构的分布式语音识别系统。系统采用基于段长分布的隐含马尔可夫模型(DDBHMM)的识别算法,使用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到... 研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端/服务器架构的分布式语音识别系统。系统采用基于段长分布的隐含马尔可夫模型(DDBHMM)的识别算法,使用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到稳定高效的性能。 展开更多
关键词 语音识别 分布式语音识别 段长分布的隐含弥可夫模型
下载PDF
一般拓扑结构的非齐次隐含马尔科夫模型及其在中、英文语种辨识中的应用 被引量:1
3
作者 王作英 孙健 《电子与信息学报》 EI CSCD 北大核心 2007年第4期867-869,共3页
为了充分利用语音信号中的段长信息,该文提出了一种具有一般拓扑结构的非齐次隐含Markov模型(Hidden Markov Model,HMM),并将其应用于中、英文语种辨识(Language IDentification,LID)系统。非齐次HMM既很好地描述了语音信号的发生过程,... 为了充分利用语音信号中的段长信息,该文提出了一种具有一般拓扑结构的非齐次隐含Markov模型(Hidden Markov Model,HMM),并将其应用于中、英文语种辨识(Language IDentification,LID)系统。非齐次HMM既很好地描述了语音信号的发生过程,又准确地利用了状态的段长信息和语言中的上下文连接结构信息,对于中、英文语种辨识系统,非齐次的HMM系统辨识性能好于齐次的HMM模型。而在非齐次的HMM中,同段长为均匀分布相比,段长分布为正态分布时系统的辨识性能更好,表明段长确实是一种重要的语种区分信息之一,且正态分布较均匀分布更接近于真实的段长分布。 展开更多
关键词 语种辨识 非齐次隐含Markov模型 段长分布
下载PDF
集成语种辨识的中英文LVCSR系统
4
作者 孙健 王作英 《计算机工程与设计》 CSCD 北大核心 2007年第8期1931-1933,共3页
为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。... 为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。为了在中、英文连续语音识别系统中能够尽早的对语音所属的语言种类做出判决以便进行识别,从而降低解码的计算量,对语种辨识过程中的语种剪枝进行了研究,表明采用合理的语种剪枝门限在不降低系统性能的情况下,可以有效的降低系统的计算量及识别时间。 展开更多
关键词 连续语音识别 语种辨识 段长分布 非齐次隐含马尔科夫模型 语种剪枝
下载PDF
汉语连续语音识别中多项式拟合语音轨迹模型的研究
5
作者 欧智坚 王作英 《电子学报》 EI CAS CSCD 北大核心 2003年第4期608-611,共4页
尽管作为当前最为流行的语音识别模型 ,HMM由于采用状态输出独立同分布假设 ,忽略了对语音轨迹动态特性的描述 .本文基于一个更为灵活的语音描述统计框架—广义DDBHMM ,提出了一个具体的多项式拟合语音轨迹模型 ,以及新的训练和识别算... 尽管作为当前最为流行的语音识别模型 ,HMM由于采用状态输出独立同分布假设 ,忽略了对语音轨迹动态特性的描述 .本文基于一个更为灵活的语音描述统计框架—广义DDBHMM ,提出了一个具体的多项式拟合语音轨迹模型 ,以及新的训练和识别算法 ,更好地刻划了真实的语音特性 .本文还给出了一种有效的剪枝算法 ,得到一个实用化模型 .汉语大词汇量非特定人连续语音识别的实验表明 。 展开更多
关键词 连续语音识别 隐马尔可夫模型 基于段长分布的隐马尔可夫模型
下载PDF
融合段长信息的中、英文语种辨识
6
作者 孙健 王作英 《模式识别与人工智能》 EI CSCD 北大核心 2006年第5期567-571,共5页
状态的段长信息反映语言发音变化速率的信息.不同语言的发音速率也存在着差异,因此状态的段长信息可以作为区分语种的信息之一.本文在建立基于段长分布的隐含 Markov 模型(DDBHMM)的音素识别系统和大词汇量连续语音识别(LVCSR)系统的基... 状态的段长信息反映语言发音变化速率的信息.不同语言的发音速率也存在着差异,因此状态的段长信息可以作为区分语种的信息之一.本文在建立基于段长分布的隐含 Markov 模型(DDBHMM)的音素识别系统和大词汇量连续语音识别(LVCSR)系统的基础上进行中、英文语种辨识,表明DDBHMM可以准确描述状态的段长信息,改善中、英文语种的辨识性能. 展开更多
关键词 语种辨识 基于段长分布的隐含Markov模型(DDBHMM) Gauss混合模型 连续音素识别 大词汇量连续语音识别(LVCSR)
原文传递
基于自回归模型的加性噪声环境稳健语音识别 被引量:2
7
作者 刘敬伟 王作英 肖熙 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第1期50-53,共4页
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb l... 为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。 展开更多
关键词 语音识别 稳健性 自回归模型 段长分布 隐含Markov模型
原文传递
基于DDBHMM的LVCSR系统的单步搜索算法
8
作者 孙健 王作英 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第10期1735-1738,共4页
为了在大词汇量连续语音识别(LVCSR)系统中能够利用段长信息,该文按树状组织发音词典,利用语言模型预测技术,基于最大似然状态序列(M LSS)算法,给出了采用基于段长分布的隐含M arkov模型(DDBHMM)的LVCSR系统的二元文法语言模型的单步搜... 为了在大词汇量连续语音识别(LVCSR)系统中能够利用段长信息,该文按树状组织发音词典,利用语言模型预测技术,基于最大似然状态序列(M LSS)算法,给出了采用基于段长分布的隐含M arkov模型(DDBHMM)的LVCSR系统的二元文法语言模型的单步搜索算法。实验结果表明,尽管单步搜索的替代错误率高于双步搜索,但单步搜索的插入和删除错误率都比双步搜索要低,总体性能上单步搜索要好于双步搜索。同时,DDBHMM能较准确地利用了语音信号中的状态段长信息,采用DDBHMM的LVCSR系统比采用经典的齐次HMM的系统有更好的识别性能。 展开更多
关键词 大词汇量连续语音识别 单步搜索 段长分布 最大似然状态序列
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部