期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于DDBHMM的维吾尔语语音声学层识别系统研究 被引量:2
1
作者 吾守尔.斯拉木 刘俊 王飞飞 《新疆大学学报(自然科学版)》 CAS 2010年第4期381-386,共6页
采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相... 采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相继设计了录音模块、特征提取模块、波形显示及结果输出显示模块等,对这些模块进行集成界面化后产生了一个基于DDBHMM的维吾尔语连续语音声学层实时识别系统,并对系统进行了测试及验证. 展开更多
关键词 语音识别 维吾尔语 ddbhmm 多线程
下载PDF
基于DDBHMM的数字语音识别
2
作者 全刚 肖熙 《电声技术》 2010年第6期45-47,共3页
数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表... 数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。 展开更多
关键词 数字语音识别 ddbhmm 非平稳噪声
下载PDF
基于DDBHMM的维吾尔语音声学识别
3
作者 王飞飞 吾守尔.斯拉木 那斯尔江.吐尔逊 《计算机工程》 CAS CSCD 北大核心 2011年第2期197-199,共3页
在维吾尔语连续语音识别试验的声学层建模基础上,引用DDBHMM模型将上下文相关的三音子作为基本识别单元,并提出一种状态绑定的思想,对状态进行优化。为得到更充分的训练模型,提高识别效率,对语料库进行扩充,在多组对比试验的基础上,分... 在维吾尔语连续语音识别试验的声学层建模基础上,引用DDBHMM模型将上下文相关的三音子作为基本识别单元,并提出一种状态绑定的思想,对状态进行优化。为得到更充分的训练模型,提高识别效率,对语料库进行扩充,在多组对比试验的基础上,分析扩充前后对声学层识别速度、准确率等各个方面的影响。 展开更多
关键词 语料库 维吾尔语 ddbhmm模型理论 三音子
下载PDF
连续语音的三音子DDBHMM识别方法
4
作者 游展 肖熙 王作英 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第4期506-509,共4页
针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS... 针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。 展开更多
关键词 语音识别 段长 ddbhmm 三音子
原文传递
基于段长分布的HMM语音识别模型 被引量:42
5
作者 王作英 肖熙 《电子学报》 EI CAS CSCD 北大核心 2004年第1期46-49,共4页
本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷 ,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型 ,证明了这种模型的状态转移概率表示与状态段长表示的等效性 ,并在此基础上提出了基于段长分布的HMM模... 本文针对齐次HMM语音识别模型在使用段长信息时存在的缺陷 ,形式化地定义了一种适合语音信号描述的自左向右非齐次隐含马尔科夫模型 ,证明了这种模型的状态转移概率表示与状态段长表示的等效性 ,并在此基础上提出了基于段长分布的HMM模型 (DDBHMM ) .非特定人连续语音实验结果表明 ,仅仅利用状态段长信息的DDBHMM语音识别模型比经典HMM模型的性能有了明显的提高 (误识率降低了 17 8% ) ,展示了DDBHMM的良好的性能 ,为语音信号的时长、语速、时间断续性以及语音特征的相关性等重要特征的描述和利用开辟了空间 . 展开更多
关键词 段长 语音识别 ddbhmm
下载PDF
段长信息在连续语音识别中的应用研究 被引量:5
6
作者 赵庆卫 肖熙 王作英 《声学学报》 EI CSCD 北大核心 2000年第2期175-181,共7页
基于段长分布的隐含马尔可夫模型(DDBHMM)有效地解决了经典HMM的缺陷.本文以DDBHMM模型为基础,详细研究了如何在连续语音识别中有效地利用段长信息。文中首先介绍了段长分布的统计方法,然后按照不同的说话速度对数... 基于段长分布的隐含马尔可夫模型(DDBHMM)有效地解决了经典HMM的缺陷.本文以DDBHMM模型为基础,详细研究了如何在连续语音识别中有效地利用段长信息。文中首先介绍了段长分布的统计方法,然后按照不同的说话速度对数据文件进行了分类,据此进行的识别实验表明,段长信息对于速度慢的文件效果最好,速度中等的次之,速度快的效果较小.作者认为,段长信息最大的作用在于能够得到更加精确的音节和状态分割点,并因而提高识别效果.同时,通过段长信息的有效利用,还能够提高识别系统对于说话速度的稳健性、作者又进行了细化研究,提出了利用分类段长和规整化的段长的研究方法,发现两者均可使识别效果有进一步的提高.为了研究如何利用段长之间的相关性,文中还提出了段长的Bigram的方法,并对之作了分析.最后,本文研究了采用后处理方法利用段长信息的效果,进一步说明了只有基于DDBHMM,在识别过程中同步利用段长信息,才能得到卓有成效的性能提高。 展开更多
关键词 段长信息 连续语音识别 ddbhmm模型
下载PDF
语音识别技术的进展 被引量:1
7
作者 张青松 《科技信息》 2011年第27期185-185,共1页
随着语音识别技术的深入研究和发展,语音识别技术已基本成熟并逐渐应用于人们生活中的各个领域。本文描述了语音识别技术的进展、问题及展望。
关键词 孤立词语音识别 连续语音识别 端点检测DTW HMM ddbhmm
下载PDF
汉语连续数字串语音识别系统 被引量:3
8
作者 许海天 吴及 王作英 《计算机工程与应用》 CSCD 北大核心 2002年第2期97-98,共2页
汉语数字串在语音识别中具有重要的地位,文章设计实现了一个实用化的汉语连续数字串语音识别系统,并针对汉语数字混淆度大的特点进行了分析,提出了模型改进和语速控制策略,使系统具有很好的整体性能。
关键词 汉语连续数字串语音识别系统 语速控制 计算机
下载PDF
分布式语音识别系统的架构分析和具体实现
9
作者 孟建庭 吴及 王作英 《电声技术》 北大核心 2004年第8期51-53,共3页
研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端/服务器架构的分布式语音识别系统。系统采用基于段长分布的隐含马尔可夫模型(DDBHMM)的识别算法,使用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到... 研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端/服务器架构的分布式语音识别系统。系统采用基于段长分布的隐含马尔可夫模型(DDBHMM)的识别算法,使用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到稳定高效的性能。 展开更多
关键词 语音识别 分布式语音识别 段长分布的隐含弥可夫模型
下载PDF
融合段长信息的中、英文语种辨识
10
作者 孙健 王作英 《模式识别与人工智能》 EI CSCD 北大核心 2006年第5期567-571,共5页
状态的段长信息反映语言发音变化速率的信息.不同语言的发音速率也存在着差异,因此状态的段长信息可以作为区分语种的信息之一.本文在建立基于段长分布的隐含 Markov 模型(DDBHMM)的音素识别系统和大词汇量连续语音识别(LVCSR)系统的基... 状态的段长信息反映语言发音变化速率的信息.不同语言的发音速率也存在着差异,因此状态的段长信息可以作为区分语种的信息之一.本文在建立基于段长分布的隐含 Markov 模型(DDBHMM)的音素识别系统和大词汇量连续语音识别(LVCSR)系统的基础上进行中、英文语种辨识,表明DDBHMM可以准确描述状态的段长信息,改善中、英文语种的辨识性能. 展开更多
关键词 语种辨识 基于段长分布的隐含Markov模型(ddbhmm) Gauss混合模型 连续音素识别 大词汇量连续语音识别(LVCSR)
原文传递
Peripheral Nonlinear Time Spectrum Features Algorithm for Large Vocabulary Mandarin Automatic Speech Recognition 被引量:1
11
作者 Fadhil H.T.Al-dulaimy 王作英 《Tsinghua Science and Technology》 SCIE EI CAS 2005年第2期174-182,共9页
This work describes an improved feature extractor algorithm to extract the peripheral features of point x(ti,fj) using a nonlinear algorithm to compute the nonlinear time spectrum (NL-TS) pattern. The algo- rithm ob... This work describes an improved feature extractor algorithm to extract the peripheral features of point x(ti,fj) using a nonlinear algorithm to compute the nonlinear time spectrum (NL-TS) pattern. The algo- rithm observes n×n neighborhoods of the point in all directions, and then incorporates the peripheral fea- tures using the Mel frequency cepstrum components (MFCCs)-based feature extractor of the Tsinghua elec- tronic engineering speech processing (THEESP) for Mandarin automatic speech recognition (MASR) sys- tem as replacements of the dynamic features with different feature combinations. In this algorithm, the or- thogonal bases are extracted directly from the speech data using discrite cosime transformation (DCT) with 3×3 blocks on an NL-TS pattern as the peripheral features. The new primal bases are then selected and simplified in the form of the ?dp- operator in the time direction and the ?dp- operator in the frequency di- t f rection. The algorithm has 23.29% improvements of the relative error rate in comparison with the standard MFCC feature-set and the dynamic features in tests using THEESP with the duration distribution-based hid- den Markov model (DDBHMM) based on MASR system. 展开更多
关键词 large vocabulary speech recognition Mandarin automatic speech recognition (MASR) dura- tion distribution-based hidden Markov model (ddbhmm) feature identification
原文传递
Duration-Distribution-Based HMM for Speech Recognition
12
作者 WANG Zuo-ying XIAO Xi 《Frontiers of Electrical and Electronic Engineering in China》 CSCD 2006年第1期26-30,共5页
To overcome the defects of the duration modeling in the homogeneous Hidden Markov Model(HMM)for speech recognition,a duration-distribution-based HMM(DDBHMM)is proposed in this paper based on a formalized definition of... To overcome the defects of the duration modeling in the homogeneous Hidden Markov Model(HMM)for speech recognition,a duration-distribution-based HMM(DDBHMM)is proposed in this paper based on a formalized definition of a left-to-right inhomogeneous Markov model.It has been demonstrated that it can be identically defined by either the state duration or the state transition probability.The speaker-independent continuous speech recognition experiments show that by only modeling the state duration in DDBHMM,a significant improvement(17.8%error rate reduction)can be achieved compared with the classical HMM.The ideal properties of DDBHMM give promise to many aspects of speech modeling,such as the modeling of the state duration,speed variation,speech discontinuity,and interframe correlation. 展开更多
关键词 DURATION speech recognition ddbhmm
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部