期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
汉语连续语音识别中语音处理和语言处理统合方法的研究 被引量:9
1
作者 赵力 邹采荣 吴镇扬 《声学学报》 EI CSCD 北大核心 2001年第1期73-78,共6页
提出了一种语音处理和语言处理按帧同步统合的汉语连续语音识别方法。该方法把基于 CFG语言模型和 Top Down型句法分析器的语言处理过程结合进基于有限状态自动机控制的 One Pass Viterbi语音识别算法中,实现... 提出了一种语音处理和语言处理按帧同步统合的汉语连续语音识别方法。该方法把基于 CFG语言模型和 Top Down型句法分析器的语言处理过程结合进基于有限状态自动机控制的 One Pass Viterbi语音识别算法中,实现了帧同步的语音语言处理的统合。为完成帧同步句法分析的单词预测和语音识别过程的结合,本文提出了一种类似于Earley法的 TopDown型句法分析方法以及 One Pass Viterbi算法中的有限状态自动机动态展开建立法. 60个音素单位和 8个声调单位的 HMM作为识别用基元模型被用于识别实验,识别结果表明,对于一个识别困难度(Perplexity)为27.3的任务(Task)的识别系统,利用本文提出的方法,10名话者发音的 1070句子的平均识别率达到 94.4%,比利用传统的基于单词确认(Word Spotting)以及从单词串(列)(lattice)进行句法分析的阶层性语音·语言统合方式的识别率提高约8%. 展开更多
关键词 汉语连续语音识别 语音处理 语言处理 统合
下载PDF
基于3维空间Viterbi算法的汉语连续语音识别方法 被引量:5
2
作者 赵力 邹采荣 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2000年第7期67-69,58,共4页
本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位... 本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位的HMM状态和时间的 3维空间Viterbi算法来实现 .语音声学处理和语音言语处理的结合 ,采用修改型Earley分析法的Top Done型文法分析器和OnePassDP为基础的帧同步识别算法来实现 .在由 10名话者发音的有关旅馆预约指南的识别困难度是 2 7 3的 10 70句子的识别实验中 ,总平均识别率达到 94 4% . 展开更多
关键词 汉语连续语音识别 三维空间 VITERBI算法
下载PDF
汉语连续语音识别中经典HMM的实验评测 被引量:6
3
作者 郝杰 李星 《计算机工程与应用》 CSCD 北大核心 2001年第13期1-4,101,共5页
定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率... 定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率这两个自由度上的各种组合,研究了经典HMM模型的复杂度、稳健性、精确性与训练集合的数据量、训练时间、解码效率等特性之间的关系;并且通过实验分析了多候选的构造和剪枝的意义。该文构造的系统与具有国内最高水平的 THEESP系统的识别率相当,所得实验结果和结论为汉语语音识别的深入研究提供了必要的参考和依据。 展开更多
关键词 汉语连续语音识别 经典HMM模型 THEESP系统 语音信号处理
下载PDF
汉语连续语音识别中的分级聚类算法的研究和应用 被引量:2
4
作者 徐向华 朱杰 郭强 《信号处理》 CSCD 2004年第5期497-500,共4页
针对汉语语音单音节结构的特点,考虑音节间协同发音的现象,本文提出了一种对三音子模型进行分级聚类的方法。与传统的基于决策树的状态聚类算法相比,该方法通过对稀少三音子模型聚类,更充分地利用训练数据,减少稀少三音子对状态聚类的影... 针对汉语语音单音节结构的特点,考虑音节间协同发音的现象,本文提出了一种对三音子模型进行分级聚类的方法。与传统的基于决策树的状态聚类算法相比,该方法通过对稀少三音子模型聚类,更充分地利用训练数据,减少稀少三音子对状态聚类的影响,从而提高声学模型的鲁棒性。实验结果表明:大词汇量连续语音识别器采用这种分级聚类方法,不仅可以大大减少模型及其参数的数量,还可使系统识别率有所提高,其中误识率相对于传统的决策树状态聚类系统降低了4.93%。 展开更多
关键词 状态聚类 决策树 训练数据 聚类算法 三音子 鲁棒性 聚类方法 汉语连续语音识别 协同发音 误识率
下载PDF
基于偶数帧段输入隐马尔可夫模型的噪声环境下汉语连续语音识别研究 被引量:1
5
作者 赵力 《声学学报》 EI CSCD 北大核心 2002年第1期59-61,共3页
提出了利用偶数帧段输入隐马尔可夫模型(HMM)提高在噪声环境下汉语连续语音识别系统鲁棒性的方法,并提出了对于传统谱相减降噪技术的修改方法。实验结果表明,本文的方法能有效地提高噪声背景下汉语连续语音识别系统的性能。
关键词 噪声环境 汉语连续语音识别系统 鲁棒性 偶数帧段 HMM 隐马尔可夫模型
下载PDF
汉语连续语音识别系统与知识导引的搜索策略研究 被引量:1
6
作者 宋战江 郑方 +2 位作者 徐明星 武健 吴文虎 《自动化学报》 EI CSCD 北大核心 2000年第4期470-477,共8页
从整体上介绍了汉语连续语音识别系统的基本原理 ,并重点对声学和语言两个层面的建模与搜索策略进行了分析 .在对传统帧同步搜索算法进行研究的基础上 ,提出了基于统计知识的帧同步搜索算法 SKB- FSS.它包含了三个主要的功能层次 :基于... 从整体上介绍了汉语连续语音识别系统的基本原理 ,并重点对声学和语言两个层面的建模与搜索策略进行了分析 .在对传统帧同步搜索算法进行研究的基础上 ,提出了基于统计知识的帧同步搜索算法 SKB- FSS.它包含了三个主要的功能层次 :基于归并的音节切分自动机产生确定的搜索边界点 ,由统计得到的差分状态驻留信息控制搜索过程中的状态转移 ,利用词搜索树控制音节候选的扩展规模并根据动态前向预测的方法进行合理而及时的路径剪枝 .实验结果验证了该搜索策略的有效性 . 展开更多
关键词 汉语连续语音识别系统 知识导引 语言处理
下载PDF
汉语连续语音识别之音素声学模型的改进 被引量:7
7
作者 吕丹桔 Mei-Yuh Huang B Hoffmeister 《计算机仿真》 CSCD 北大核心 2010年第5期355-358,共4页
研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语... 研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语音系统识别率。为了描述连续语意中的协同发音现象,还针对改进后的主元音基元,设计了相应的有调问题集,利用决策树的参数共享策略建立了上下文相关的音素模型。实验结果表明,改进后的有调音素集合在削减了原有基元个数的基础上,字误识率(CER)有0.4%-0.6%的明显改善。 展开更多
关键词 大词汇量连续汉语语音识别 音素 主元音 决策树
下载PDF
汉语连续数字串语音识别系统 被引量:3
8
作者 许海天 吴及 王作英 《计算机工程与应用》 CSCD 北大核心 2002年第2期97-98,共2页
汉语数字串在语音识别中具有重要的地位,文章设计实现了一个实用化的汉语连续数字串语音识别系统,并针对汉语数字混淆度大的特点进行了分析,提出了模型改进和语速控制策略,使系统具有很好的整体性能。
关键词 汉语连续数字串语音识别系统 语速控制 计算机
下载PDF
基于语音学分类的汉语三音子识别单元的算法 被引量:4
9
作者 李春 王作英 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第1期16-19,共4页
为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系... 为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。 展开更多
关键词 识别单元 汉语连续语音识别 三音子 语音学分类 训练算法 识别算法 音节结构
原文传递
基于MAP算法的无教师讲者自适应的研究
10
作者 赵力 邹采荣 吴镇扬 《应用科学学报》 CAS CSCD 2003年第4期353-356,共4页
提出了一种基于MAP算法的连续语音识别无教师讲者自适应方法,给出了简单有效的渐进自适应公式.通过识别实验结果表明,提出的方法能利用少量的自适应数据达到满意的学习效果,是一种实用和有效的讲者自适应方法.
关键词 MAP算法 无教师讲者自适应 汉语连续语音识别 语音识别系统 再学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部