期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于HTK的语音识别语言模型设计及性能分析 被引量:2
1
作者 张强 陶宏才 《成都信息工程学院学报》 2009年第2期142-146,共5页
在大词汇连续语音识别系统中,统计语言模型是该系统非常重要的一部分,对整个识别系统的识别效果产生重要的影响。分析了统计语言模型原理和相关技术,基于HTK设计了适合大词汇连续语音识别系统的统计语言模型,同时对该语言模型的复杂度... 在大词汇连续语音识别系统中,统计语言模型是该系统非常重要的一部分,对整个识别系统的识别效果产生重要的影响。分析了统计语言模型原理和相关技术,基于HTK设计了适合大词汇连续语音识别系统的统计语言模型,同时对该语言模型的复杂度、精确识别率进行分析,指出了影响统计语言模型性能的相关因素。 展开更多
关键词 语音识别 统计语言模型 htk N-GRAM模型
下载PDF
基于HTK的语音识别网络优化算法 被引量:3
2
作者 杨善茜 黄汉明 +1 位作者 蒋正锋 李锐 《计算机工程》 CAS CSCD 北大核心 2010年第14期169-171,共3页
隐马尔可夫模型工具包(HTK)的HParse命令根据用户以正则表达式形式定义的任务语法来生成HTK可用的底层表示的语音识别网络,但不是每个语句都能用正则表达式表示出来。针对该问题,提出基于HTK的语音识别网络算法用于识别网络的优化问题,... 隐马尔可夫模型工具包(HTK)的HParse命令根据用户以正则表达式形式定义的任务语法来生成HTK可用的底层表示的语音识别网络,但不是每个语句都能用正则表达式表示出来。针对该问题,提出基于HTK的语音识别网络算法用于识别网络的优化问题,给出该算法的具体实现过程。实验结果表明,在保证识别率的前提下,优化后的语音识别网络在语音识别系统中所用的时间比较短,算法是有效的。 展开更多
关键词 连续语音识别 自动机 隐马尔可夫模型工具包 语音识别网络
下载PDF
基于HTK的汉语语音售票系统的设计与实现 被引量:3
3
作者 饶耀全 吴小培 吕钊 《工业控制计算机》 2010年第10期58-61,共4页
为了解决火车站售票系统处理售票业务效率低、速度慢和低智能化等问题,提出了一种基于HTK(HMM Tool Kit,隐马尔科夫模型工具箱)的汉语语音售票系统。详细阐述了基于HTK的语音识别等关键技术的基本原理,并给出了系统实现的关键代码。在... 为了解决火车站售票系统处理售票业务效率低、速度慢和低智能化等问题,提出了一种基于HTK(HMM Tool Kit,隐马尔科夫模型工具箱)的汉语语音售票系统。详细阐述了基于HTK的语音识别等关键技术的基本原理,并给出了系统实现的关键代码。在语音识别测试中,语句级识别正确率为98.00%;字词级识别正确率达到了98.67%。实验结果表明所提出的语音售票系统具有较高的可行性与实用性。 展开更多
关键词 语音识别 htk 售票系统 ATK
下载PDF
基于HTK的维吾尔语连续音素识别技术研究
4
作者 米日古力.阿布都热素 米吉提.阿不力米提 +1 位作者 艾克白尔.帕塔尔 艾斯卡尔.艾木都拉 《计算机工程与应用》 CSCD 2013年第22期150-154,172,共6页
以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技... 以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。 展开更多
关键词 维吾尔语 声学模型 语言模型 维吾尔语音素 基于隐马尔可夫模型的工具箱(htk)
下载PDF
藏语拉萨话大词表连续语音识别声学模型研究 被引量:16
5
作者 李冠宇 孟猛 《计算机工程》 CAS CSCD 2012年第5期189-191,共3页
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语... 根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。 展开更多
关键词 藏语 拉萨话 连续语音识别 隐马尔可夫模型 htk工具 声学模型
下载PDF
基于隐马可夫模型的邻近方言差异系数研究
6
作者 王雪飞 刘珺 《计算机工程》 CAS CSCD 北大核心 2016年第4期179-183,共5页
量化邻近地域的方言差异性研究,运用方言朗读独立字词文本A形成声音文件M,使用HTK工具包将M文件构造为声学特征参数集S_M,计算方言差异系数。在邻近连续i个地域基础上得到相应的Si_Mi,同时使声音Mi结合对比样本区域(i=0)音-字(词)... 量化邻近地域的方言差异性研究,运用方言朗读独立字词文本A形成声音文件M,使用HTK工具包将M文件构造为声学特征参数集S_M,计算方言差异系数。在邻近连续i个地域基础上得到相应的Si_Mi,同时使声音Mi结合对比样本区域(i=0)音-字(词)映射表,形成i村落并对应文本Ai。差异系数ξ定义为Ai与A0(样本区域或村落)之间的文本内容差异之比。分析连续古村落ξ值特征结果表明,方言在邻近3个村落(地理位置)的ξ值介于0.88~1时,差异较小,而当邻近9个村落的ξ值(综合)小于0.6及词组ξ值小于0.2时,差异快速变大,建立方言距离并提出方言半径概念,确认所测试方言的半径为8(8个村落)。 展开更多
关键词 方言语音 方言差异系数 htk软件 隐马可夫模型 方言半径
下载PDF
基于骨导麦克风数据的咀嚼发音类型自动识别与分类方法 被引量:1
7
作者 更太加 张新意 魏建国 《声学技术》 CSCD 北大核心 2022年第4期556-561,共6页
口腔运动与人们的饮食规律息息相关,该文通过对口腔运动状态的分析识别来监测人们的饮食规律,以此来指导人们的饮食习惯。借助语音识别技术的思想和方法,分析识别口腔运动产生的骨导音,为提升识别效率,采用了传统的隐马尔可夫模型。基... 口腔运动与人们的饮食规律息息相关,该文通过对口腔运动状态的分析识别来监测人们的饮食规律,以此来指导人们的饮食习惯。借助语音识别技术的思想和方法,分析识别口腔运动产生的骨导音,为提升识别效率,采用了传统的隐马尔可夫模型。基于隐马尔可夫模型建立了一套骨导音识别系统,在进行骨导音识别之前,通过分帧加窗、提取梅尔频率倒谱系数,对其进行模型训练;在识别过程中,找出与待测音频信号和模板库中匹配度最高的模型,以其模型输出结果作为最后的识别结果。该方法的识别结果可以达到84%,实验结果表明该方法具有一定的可行性。 展开更多
关键词 梅尔倒谱系数 隐马尔可夫模型 htk工具 口腔运动状态
下载PDF
基于隐马尔可夫模型的维吾尔语连续语音识别系统 被引量:17
8
作者 那斯尔江.吐尔逊 吾守尔.斯拉木 《计算机应用》 CSCD 北大核心 2009年第7期2009-2011,2025,共4页
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolK it)工具实现了基于隐马尔可夫模型(HMM)的维... 维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolK it)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。 展开更多
关键词 维吾尔语 连续语音 语音识别 HMM的工具包
下载PDF
衡阳方言孤立词识别研究
9
作者 李荣华 赵征鹏 《计算机系统应用》 2017年第5期247-252,共6页
目前,汉语识别已经取得了一定的研究成果.但由于中国的地域性差异,十里不同音,使得汉语识别系统在进行方言识别时识别率低、性能差.针对语音识别系统在对方言进行识别时的缺陷,构建了基于HTK的衡阳方言孤立词识别系统.该系统使用HTK3.4.... 目前,汉语识别已经取得了一定的研究成果.但由于中国的地域性差异,十里不同音,使得汉语识别系统在进行方言识别时识别率低、性能差.针对语音识别系统在对方言进行识别时的缺陷,构建了基于HTK的衡阳方言孤立词识别系统.该系统使用HTK3.4.1工具箱,以音素为基本识别单元,提取39维梅尔频率倒谱系数(MFCC)语音特征参数,构建隐马尔可夫模型(HMM),采用Viterbi算法进行模型训练和匹配,实现了衡阳方言孤立词语音识别.通过对比实验,比较了在不同因素模型下和不同高斯混合数下系统的性能.实验结果表明,将39维MFCC和5个高斯混合数与HMM模型结合实验时,系统的性能得到很大的改善. 展开更多
关键词 htk 隐马尔可夫模型 衡阳方言 梅尔频率倒谱系数 VITERBI算法
下载PDF
Phoneme Based Speaker-Independent English Command Recognition
10
作者 贲俊 万旺根 余小清 《Journal of Shanghai University(English Edition)》 CAS 2003年第2期163-167,共5页
In this paper we propose a new algorithm of phoneme based speaker independent English command recognition and develop a speaker independent English command recognition system. It accelerates the whole system develop... In this paper we propose a new algorithm of phoneme based speaker independent English command recognition and develop a speaker independent English command recognition system. It accelerates the whole system development by using HTK (hide Markov toolkits) and Visual C++ based on the character'istics of speaker independent speech recognition. In recognition phase we combine the confidence measures with incomplete matching, which considerably improve the quality of recognition. The recognition accuracy is increased by 4.8% over complete matching without back end processing when the sige of vocabulary is more than 10. 展开更多
关键词 speech recognition confidence measure htk (hide Markov toolkits).
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部