期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
HMM BASED RECOGNITION OF CHINESE TONES IN CONTINUOUS SPEECH
1
作者 Zhao Li (Department of Radio Engineering, Southeast University, Nanjing 210096) 《Journal of Electronics(China)》 2000年第1期9-14,共6页
This paper describes a method for recognizing Chinese tones in continuous speech. The first and second order differentials of the fundamental frequency logarithmically converted are used as feature parameters. A left-... This paper describes a method for recognizing Chinese tones in continuous speech. The first and second order differentials of the fundamental frequency logarithmically converted are used as feature parameters. A left-to-right hidden Markov modeling with five states, each of which is modeled by a single Gaussian distribution, expresses each of Chinese tones. Non-voiced portions are coded by random values normally distributed to uniformly deal with all the time frames in an utterance. Speaker dependent tone recognition was conducted for ten speakers. The average rate of 81.8% was obtained for these speakers. 展开更多
关键词 Chinese continuous speech TONE recognition FUNDAMENTAL frequency continuous hmm
下载PDF
汉语连续语音识别中经典HMM的实验评测 被引量:6
2
作者 郝杰 李星 《计算机工程与应用》 CSCD 北大核心 2001年第13期1-4,101,共5页
定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率... 定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率这两个自由度上的各种组合,研究了经典HMM模型的复杂度、稳健性、精确性与训练集合的数据量、训练时间、解码效率等特性之间的关系;并且通过实验分析了多候选的构造和剪枝的意义。该文构造的系统与具有国内最高水平的 THEESP系统的识别率相当,所得实验结果和结论为汉语语音识别的深入研究提供了必要的参考和依据。 展开更多
关键词 汉语连续语音识别 经典hmm模型 THEESP系统 语音信号处理
下载PDF
基于连续分布型HMM的汉语连续语音的声调识别方法 被引量:6
3
作者 赵力 邹采荣 吴镇扬 《信号处理》 CSCD 2000年第1期20-23,共4页
本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案。通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试... 本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案。通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试验,识别结果表明,10名话者1070个句子的连续语音声调识别的平均识别率是95.1%。 展开更多
关键词 汉语连续语音 声调识别 基频 语音识别
下载PDF
基于连续HMM的孤立语音鲁棒性识别方法 被引量:5
4
作者 徐文盛 戴蓓倩 +1 位作者 方绍武 李辉 《电路与系统学报》 CSCD 1999年第4期19-23,共5页
对于基于连续隐马尔可夫模型(CHMM)的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Mel倒谱参数(RAS_MFCC+△RAS_NFCC),进行特征参数级的去噪,明显... 对于基于连续隐马尔可夫模型(CHMM)的语音识别系统,为了提高系统在环境噪声下的鲁棒性,本文提出了一种能有效抑制加性平稳噪声和通道卷积噪声的相对自相关序列的Mel倒谱参数(RAS_MFCC+△RAS_NFCC),进行特征参数级的去噪,明显地改善了系统的噪声鲁棒性。为了进一步提高系统在低信噪比语音时的识别性能,我们采用了CHMM的混合语青训练法,获得了对各种信噪比语音都具有很强适应性的CHMM参数。实验证明。 展开更多
关键词 马尔可夫模型 鲁棒性 语音识别 Chmm
下载PDF
从线性预测HMM到一种新的语音识别的混合模型 被引量:3
5
作者 欧智坚 王作英 《电子学报》 EI CAS CSCD 北大核心 2002年第9期1313-1316,共4页
线性预测 HMM(Linear Prediction HMM,LPHMM)并没有象传统 HMM那样引人状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性... 线性预测 HMM(Linear Prediction HMM,LPHMM)并没有象传统 HMM那样引人状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式. 展开更多
关键词 线性预测hmm 语音识别 混合模型 边疆语音识别 隐马尔可夫模型 线性预测 隐马尔可夫模型
下载PDF
利用HMM提取连续语音中的口型信息 被引量:5
6
作者 茅力群 《微计算机信息》 北大核心 2006年第01Z期201-202,共2页
本文主要研究利用改进的HMM模型从非特定人的连续语音中识别出声母、韵母,以及每个音的持续时间,提出了这些语音信息与嘴巴的扩张程度、嘴型和持续时间等口型信息的关系,以便把它们传送给步进电机,(以驱动实物模型。
关键词 hmm模型 连续语音识别 口型信息
下载PDF
连续汉语音识别有双词文法约束的大型HMM
7
作者 张英林 贾骏 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 1999年第1期77-80,共4页
提出针对汉语连续语音识别中的大型HMM进行修正.在模型中加入双词文法约束,然后给出文法约束下的新的识别算法,新识别算法基于Viterbi算法和分层构筑思想之上.经实验测试,识别率有较大提高.
关键词 连续语音识别 双词文法 汉语 语音识别 hmm
下载PDF
采用上下文相关音素HMM的连续语音识别
8
作者 谢锦辉 《通信学报》 EI CSCD 北大核心 1994年第2期83-87,共5页
本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot(Esprit2104)课题下在法国LIMSI-CNRS建立的基于上下文无关(contextindependent... 本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot(Esprit2104)课题下在法国LIMSI-CNRS建立的基于上下文无关(contextindependent)音素HMM的一个基本连续语音识别系统。然后,本文详细给出了利用左或右上下文相关(leftorrightcontext-dependent)音素HMM,作者对上述系统改进后进行的连续语音识别。采用美国语音库DARPA-RM1,在不考虑句法(syntax)信息时,我们获得了连续语音(句子)识别时词识别率大约3~10个百分点的明显提高。实验是在法国LIMSI-CNRS进行的。最后,本文还给出了进一步改进系统性能的努力方向。 展开更多
关键词 音素hmm 连续语言 元音识别
下载PDF
基于HMM的黔东南少数民族地区苗语连续语音识别系统研究 被引量:3
9
作者 杨建菊 唐录洁 龙虎 《电脑知识与技术》 2017年第11期190-191,共2页
该文根据贵州黔东南少数民族地区苗族语言发音特点,对苗语连续语音识别系统进行研究,并尝试采用Sphinx工具应用HMM方法,对苗语连续语音识别系统进行初步设计和识别测试。
关键词 hmm 连续语音识别 SPHINX 苗语
下载PDF
基于瓶颈特征的藏语拉萨话连续语音识别研究 被引量:9
10
作者 周楠 赵悦 +3 位作者 李要嫱 徐晓娜 才旺拉姆 吴立成 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期249-254,共6页
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征... 基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。 展开更多
关键词 藏语拉萨话 连续语音识别 高斯混合–隐马尔科夫模型 瓶颈特征 深度神经网络
下载PDF
基于子字单元的维吾尔语语音识别研究 被引量:5
11
作者 薛化建 董兴华 +2 位作者 周喜 吐尔洪.吾司曼 李晓 《计算机工程》 CAS CSCD 北大核心 2011年第20期208-210,共3页
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个... 为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。 展开更多
关键词 维吾尔语 词切分 子字单元 隐马尔科夫模型 连续语音识别
下载PDF
基于3维空间Viterbi算法的汉语连续语音识别方法 被引量:5
12
作者 赵力 邹采荣 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2000年第7期67-69,58,共4页
本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位... 本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位的HMM状态和时间的 3维空间Viterbi算法来实现 .语音声学处理和语音言语处理的结合 ,采用修改型Earley分析法的Top Done型文法分析器和OnePassDP为基础的帧同步识别算法来实现 .在由 10名话者发音的有关旅馆预约指南的识别困难度是 2 7 3的 10 70句子的识别实验中 ,总平均识别率达到 94 4% . 展开更多
关键词 汉语连续语音识别 三维空间 VITERBI算法
下载PDF
藏语拉萨话大词表连续语音识别声学模型研究 被引量:16
13
作者 李冠宇 孟猛 《计算机工程》 CAS CSCD 2012年第5期189-191,共3页
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语... 根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。 展开更多
关键词 藏语 拉萨话 连续语音识别 隐马尔可夫模型 HTK工具 声学模型
下载PDF
基于经典隐马尔可夫模型的汉语连续语音识别系统 被引量:3
14
作者 郝杰 李星 《电子与信息学报》 EI CSCD 北大核心 2002年第7期944-947,共4页
该文构造了基于经典隐马尔可夫模型(Hidden Markov Model,HMM)的汉语连续语音识别系统,定量地分析与评价了经典HMM的性能。
关键词 隐马尔可夫模型 汉语 语音识别系统
下载PDF
一种抗噪孤立字语音识别模型 被引量:2
15
作者 徐文盛 戴蓓倩 +1 位作者 方绍武 李辉 《中国科学技术大学学报》 CAS CSCD 北大核心 2000年第6期659-665,共7页
论文提出了一种连续隐Markov模型和BP神经网络相结合的、具有两次辨识过程的抗噪孤立字识别模型 .首先以连续隐Markov模型完成语音信号的时序建模并提供一次识别信息 ;以BP神经网络进行后处理 ,提取二次识别信息 ,识别结果由两次识别信... 论文提出了一种连续隐Markov模型和BP神经网络相结合的、具有两次辨识过程的抗噪孤立字识别模型 .首先以连续隐Markov模型完成语音信号的时序建模并提供一次识别信息 ;以BP神经网络进行后处理 ,提取二次识别信息 ,识别结果由两次识别信息共同决定 .实验证明 ,由于有效地利用了隐Markov模型的强时序信号处理能力和BP神经网络的强模式分类和泛化性能 ,这种识别模型明显地改善了孤立字识别系统的抗噪性能 . 展开更多
关键词 连续隐MArkov模型 人工神经网络 噪声鲁棒性 语音识别 抗噪性能
下载PDF
正反向隐马尔可夫模型及其在连续语音识别中的应用 被引量:3
16
作者 王仁华 江辉 《电子学报》 EI CAS CSCD 北大核心 1996年第10期63-68,共6页
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用... 本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。 展开更多
关键词 语音识别 连续语音识别 hmm模型
下载PDF
连续语音识别前端鲁棒性研究 被引量:2
17
作者 胡丹 曾庆宁 +1 位作者 龙超 黄桂敏 《电视技术》 北大核心 2015年第24期43-46,58,共5页
针对大词汇量连续语音识别中识别率不高的问题,提出了将语音增强级联在识别系统前端,在语音增强中将谱减法和对数最小均方误差算法(logmmse)与用于噪声估计的最小控制递归平均算法(imcra)相结合。识别系统使用Mel频率倒谱系数(MFCC)提... 针对大词汇量连续语音识别中识别率不高的问题,提出了将语音增强级联在识别系统前端,在语音增强中将谱减法和对数最小均方误差算法(logmmse)与用于噪声估计的最小控制递归平均算法(imcra)相结合。识别系统使用Mel频率倒谱系数(MFCC)提取特征,用隐马尔科夫模型(HMM)训练与识别。实验结果表明,该方法最高能使单词识别率提高38.9%,使句子正确率提高21.8%。该方法用于大词汇量连续语音识别是可行有效的。 展开更多
关键词 连续语音识别 语音增强 hmm imcra 句子正确率
下载PDF
一种基于数据筛的音频视频连续语音识别系统 被引量:1
18
作者 谢磊 I Ravyse +4 位作者 蒋冬梅 赵荣椿 H Sahli W Verhelst J Cornelis 《计算机应用》 CSCD 北大核心 2003年第7期1-3,共3页
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法;在音频和视频集成建模方面,使用多数据流HMM来反映语音的双... 文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法;在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。 展开更多
关键词 语音识别 音频视频 连续语音识别 数据筛 多数据流hmm
下载PDF
对经典隐马尔可夫模型的经验性改进 被引量:2
19
作者 郝杰 李星 《计算机工程与应用》 CSCD 北大核心 2001年第11期24-25,100,共3页
文章分析了经典隐马尔可夫模型(Hidden Markov Model,HMM)齐次假设的理论缺陷,以及两种非齐次HMM。语音识别对比实验表明,经验性的惩罚概率法是稳健的、且更有效的补偿方法。实验结果还指出在最优惩罚概率下,经典HMM达到了与非齐... 文章分析了经典隐马尔可夫模型(Hidden Markov Model,HMM)齐次假设的理论缺陷,以及两种非齐次HMM。语音识别对比实验表明,经验性的惩罚概率法是稳健的、且更有效的补偿方法。实验结果还指出在最优惩罚概率下,经典HMM达到了与非齐次的基于段长分布的HMM(Duration Distribution Based HMM,DDBHMM)几乎相同的识别率,证明了齐次假设并不影响经典HMM在实用中的重要性。文章提出了一种改进Baum-Welch重估算法的初值的经验方法,用于HMM参数的估计,在汉语连续语音识别实验中一致性地降低了音节误识率。 展开更多
关键词 语音识别 惩罚概率法 隐马尔可夫模型 语音信号处理
下载PDF
汉语连续语音识别之音素声学模型的改进 被引量:7
20
作者 吕丹桔 Mei-Yuh Huang B Hoffmeister 《计算机仿真》 CSCD 北大核心 2010年第5期355-358,共4页
研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语... 研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语音系统识别率。为了描述连续语意中的协同发音现象,还针对改进后的主元音基元,设计了相应的有调问题集,利用决策树的参数共享策略建立了上下文相关的音素模型。实验结果表明,改进后的有调音素集合在削减了原有基元个数的基础上,字误识率(CER)有0.4%-0.6%的明显改善。 展开更多
关键词 大词汇量连续汉语语音识别 音素 主元音 决策树
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部