期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
汉语语音听写机技术的研究与实现 被引量:6
1
作者 郑方 牟晓隆 +2 位作者 徐明星 武健 宋战江 《软件学报》 EI CSCD 北大核心 1999年第4期436-444,共9页
文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学... 文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学层面的差分状态驻留信息和特征变化量信息等.实验结果表明,基于知识的搜索策略使连续语音识别的性能提高了36.6%.文章还介绍了N-Gram统计语言模型的修正退化频度估计算法和搜索算法原理.通过对多年研究成果的分析,实现了一个汉语语音听写机的引擎。 展开更多
关键词 汉语语音听写机 汉语信息处理 语音识别
下载PDF
基于汉语语音特点的大词表语音识别系统的研究 被引量:2
2
作者 李建民 赵彤青 +2 位作者 郑方 方棣棠 吴文虎 《计算机学报》 EI CSCD 北大核心 1992年第5期364-370,共7页
本文探讨了汉语语音识别的若干问题,并简单介绍了一个大词表汉语语音识别系统,该系统充分考虑了汉语语音的特点,其中主要是汉语语音具有音节性比较强的特点、音节的简单声韵母结构以及汉语以词/词组为语音交流基础的特点.该系统一个显... 本文探讨了汉语语音识别的若干问题,并简单介绍了一个大词表汉语语音识别系统,该系统充分考虑了汉语语音的特点,其中主要是汉语语音具有音节性比较强的特点、音节的简单声韵母结构以及汉语以词/词组为语音交流基础的特点.该系统一个显著的特点是系统可以不进行任何训练地添加新词汇,从而使得系统具有比较好的用户接口. 现在系统具有10,000多个词汇,实时测试的平均识别结果是93.1%. 展开更多
关键词 语音识别 汉语
下载PDF
汉语连续语音识别系统与知识导引的搜索策略研究 被引量:1
3
作者 宋战江 郑方 +2 位作者 徐明星 武健 吴文虎 《自动化学报》 EI CSCD 北大核心 2000年第4期470-477,共8页
从整体上介绍了汉语连续语音识别系统的基本原理 ,并重点对声学和语言两个层面的建模与搜索策略进行了分析 .在对传统帧同步搜索算法进行研究的基础上 ,提出了基于统计知识的帧同步搜索算法 SKB- FSS.它包含了三个主要的功能层次 :基于... 从整体上介绍了汉语连续语音识别系统的基本原理 ,并重点对声学和语言两个层面的建模与搜索策略进行了分析 .在对传统帧同步搜索算法进行研究的基础上 ,提出了基于统计知识的帧同步搜索算法 SKB- FSS.它包含了三个主要的功能层次 :基于归并的音节切分自动机产生确定的搜索边界点 ,由统计得到的差分状态驻留信息控制搜索过程中的状态转移 ,利用词搜索树控制音节候选的扩展规模并根据动态前向预测的方法进行合理而及时的路径剪枝 .实验结果验证了该搜索策略的有效性 . 展开更多
关键词 汉语连续语音识别系统 知识导引 语言处理
下载PDF
连续汉语语音识别中基于归并的音节切分自动机 被引量:9
4
作者 张继勇 sp.cs.tsinghua.edu.cn +7 位作者 郑方 sp.cs.tsinghua.edu.cn 杜术 sp.cs.tsinghua.edu.cn 宋战江 sp.cs.tsinghua.edu.cn 徐明星 sp.cs.tsinghua.edu.cn 《软件学报》 EI CSCD 北大核心 1999年第11期1212-1215,共4页
文章研究并实现了汉语连续语音中的音节自动切分算法─—基于归并的音节切分自动机(merging-basedSyllabledeteCtionautomaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参... 文章研究并实现了汉语连续语音中的音节自动切分算法─—基于归并的音节切分自动机(merging-basedSyllabledeteCtionautomaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参数高度相似的相邻帧(1帧或若干帧)的语音信号进行“归并(merging)”,形成“归并类似段(mergedsimilarsegment,简称MSS)”,它们被认定属于同一音节的相同状态.这些MSS经过一个包含若干状态的“音节切分自动机(syllabledetectionautomaton,简称SDA)”后,输出音节的切分点.每个确定的切分段中所包合音节个数的范围(rangeofsyllablenumber,简称RSN)也由MBSDA算法给出. 展开更多
关键词 语音识别 归并 音节切分自动机 连续汉语语音
下载PDF
隐马尔可夫模型中一种新的帧相关建模方法 被引量:4
5
作者 郭庆 吴文虎 方棣棠 《软件学报》 EI CSCD 北大核心 1999年第6期631-635,共5页
在使用传统的隐马尔可夫模型(traditionalhiddenMarkovmodel,简称THMM)刻画现实中的语音时有一个明显的缺点,即THMM不能合适地表征语音信号的时域结构.时域上的相关性被认为对识别非常有用,... 在使用传统的隐马尔可夫模型(traditionalhiddenMarkovmodel,简称THMM)刻画现实中的语音时有一个明显的缺点,即THMM不能合适地表征语音信号的时域结构.时域上的相关性被认为对识别非常有用,因为相邻帧间的特征矢量具有很强的相关性.文章提出了一种新的方法,用以把时域的相关性糅合到一个基于传统的隐马尔可夫模型的语音识别系统中.首先,用条件概率的形式处理帧间相关性;然后,用一种非线性的概率近似公式来表征相邻帧之间的相关性.此方法丝毫不增加原来的THMM的空间复杂度,而且也几乎不增加训练和识别阶段的时间复杂度.最后。 展开更多
关键词 帧间相关性 语音识别 隐马尔可夫模型 建模
下载PDF
Karhunen-Loeve变换在语音识别中的应用 被引量:1
6
作者 郭庆 吴文虎 方棣棠 《模式识别与人工智能》 EI CSCD 北大核心 1998年第4期396-402,共7页
本文提出了在特征提取阶段利用帧间相关性的一种方法。对每一帧考虑其前后各n帧,加上自身帧共2n+1帧的特征矢量串起来组合成一个大的特征矢量串。对这个大的特征矢量串用Karhunen-Loeve变换进行降维处理,将变换后的数据作为本帧的特征... 本文提出了在特征提取阶段利用帧间相关性的一种方法。对每一帧考虑其前后各n帧,加上自身帧共2n+1帧的特征矢量串起来组合成一个大的特征矢量串。对这个大的特征矢量串用Karhunen-Loeve变换进行降维处理,将变换后的数据作为本帧的特征矢量用于后续的训练和识别。在基于CDCPM的语音识别系统中采用这种方法进行了音节的训练和识别,实验结果表明Karhunen-Loeve变换在考虑帧间相关性的特征提取阶段上表现了良好的效果,有着很广阔的应用前景。 展开更多
关键词 语音识别 KL变换 特征提取 语音信号处理
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部