期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于HTK的语音识别系统设计 被引量:23
1
作者 石现峰 张学智 张峰 《计算机技术与发展》 2006年第10期37-38,41,共3页
HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。文中主要介绍了HTK的基本原理和软件结构,并且针对HTK工具箱进行了二次开发,设计开发了一套完整的语音识别输入系统及... HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。文中主要介绍了HTK的基本原理和软件结构,并且针对HTK工具箱进行了二次开发,设计开发了一套完整的语音识别输入系统及其相应的测试平台,并验证了该语音识别系统的识别率,实验表明,该系统取得了较好的语音输入效果。 展开更多
关键词 htk 语音识别 hmm
下载PDF
一种基于HTK的数字语音识别系统 被引量:6
2
作者 魏巍 张海涛 《计算机系统应用》 2011年第9期17-21,共5页
数字语音识别是语音识别一个极其重要的分支,其在现实生活中的应用愈加广泛。HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。从HTK的基本原理和软件结构出发,设计了... 数字语音识别是语音识别一个极其重要的分支,其在现实生活中的应用愈加广泛。HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。从HTK的基本原理和软件结构出发,设计了一个基于HTK的数字语音识别系统,并验证了其识别效率。随后,通过更换识别单元,更改特征参数的维数和增加高斯混合分量的个数来考虑不同因素对系统性能的影响。最后,通过比较试验,验证了识别单元、高斯混合分量的数目以及MFCC维数的适当组合可提高系统的正确识别率。 展开更多
关键词 语音识别 htk hmm 识别单元 MFCC
下载PDF
Speaker-independent speech recognition based on HMM state-restructuring method 被引量:2
3
作者 徐向华 朱杰 郭强 《Journal of Southeast University(English Edition)》 EI CAS 2004年第4期427-430,共4页
Based on confusions between hidden Markov model (HMM) states, a state-restructuring method was proposed. In the method, HMM states were restructured by sharing Gaussian components with their related states, and the re... Based on confusions between hidden Markov model (HMM) states, a state-restructuring method was proposed. In the method, HMM states were restructured by sharing Gaussian components with their related states, and the re-estimation to the increased-parameters, i.e., the inter-state weights, was derived under the expectation maximization (EM) framework. Experiments were performed on speaker-independent, large vocabulary, continuous Mandarin speech recognition. Experimental results showed that the state-restructured systems outperformed the baseline, and achieve significant improvement on recognition accuracy compared with the conventional parameter-increasing method. Such comparative results confirmed that the state-restructuring method was efficient. 展开更多
关键词 Classification (of information) Markov processes Parameter estimation Robustness (control systems) Vocabulary control
下载PDF
HTK参数对普米语孤立词识别率的影响 被引量:4
4
作者 苏洁 李余芳 +2 位作者 郭琳 刘敬凤 潘文林 《云南民族大学学报(自然科学版)》 CAS 2015年第6期510-513,共4页
普米语是一种无文字的少数民族语言,目前已处于濒危状态,建立语音语料库及开展语音识别研究是保护和传承普米语的重要手段.基于HTK的语音识别中,参数的选取对不同语言的识别率有很大的影响.针对MFCC维数、HMM状态数及GMM个数这3个参数... 普米语是一种无文字的少数民族语言,目前已处于濒危状态,建立语音语料库及开展语音识别研究是保护和传承普米语的重要手段.基于HTK的语音识别中,参数的选取对不同语言的识别率有很大的影响.针对MFCC维数、HMM状态数及GMM个数这3个参数对普米语的识别率进行研究,结果表明:普米语语音识别的最佳MFCC维数为13维,最佳HMM状态数为8个,最佳GMM个数为3个. 展开更多
关键词 htk 普米语 孤立词 语音识别 MFCC hmm GMM
下载PDF
离散HMM的参数估计 被引量:1
5
作者 宣国荣 肖杨 《计算机工程》 CAS CSCD 北大核心 2003年第7期98-100,115,共4页
给出了两种离散HMM参数估计,一种是首先估计HMM的转移概率和直接估计离散符号集的分布,然后假设各状态都是正态分布,再从符号集的离散概率分布,来估计正态概率分布的参数(GMM);另一种是将离散符号设定为正态分布,用与连续HMM相... 给出了两种离散HMM参数估计,一种是首先估计HMM的转移概率和直接估计离散符号集的分布,然后假设各状态都是正态分布,再从符号集的离散概率分布,来估计正态概率分布的参数(GMM);另一种是将离散符号设定为正态分布,用与连续HMM相似的方法,来估计离散HMM正态概率分布的参数。 展开更多
关键词 离散hmm 分布估计 参数估计 高斯混合模型 htk
下载PDF
基于HTK的维吾尔语连续数字语音识别 被引量:7
6
作者 蔡琴 吾守尔.斯拉木 《现代计算机》 2007年第4期14-16,共3页
根据HTK工作原理,设计了维吾尔语连续数字识别的训练步骤,进行嵌入式重估训练,建立了基于音素级单位的HMM模型,建立了语言模型,实现了维吾尔语非特定人小词汇量亿以内的数字语音识别。
关键词 htk工具包 hmm 维吾尔语 语言模型
下载PDF
基于HTK的语音拨号系统设计与分析 被引量:1
7
作者 陈新锐 蒋正锋 陆世鹏 《电脑知识与技术》 2009年第10期7932-7933,共2页
介绍了一种基于HTK的语音拨号系统设计方案。方案中以HMM实验工具包HTK3.3为工具,通过对拨号语音提取39维MFCC特征参数,采用基于模板匹配的训练方法,完成了拨号语音识别系统的构建,并对该系统进行了性能分析。
关键词 语音拨号 模式识别 隐马尔科夫模型 隐马尔科夫工具箱 MEL频率倒谱系数
下载PDF
基于HTK的藏语拉萨话大词表连续语音识别的研究与实现 被引量:3
8
作者 李冠宇 《西北民族大学学报(自然科学版)》 2011年第3期19-23,共5页
在分析藏语拉萨话特点的基础上,确定拉萨话音素集并制定了面向语音识别的拉丁转写方案.根据藏语字音转换规则,建立以单音节为单位的拉萨话发音字典,以音素为建模单元,训练得到三音子连续隐马尔可夫(HiddenMarkov Model,HMM)模型,探索藏... 在分析藏语拉萨话特点的基础上,确定拉萨话音素集并制定了面向语音识别的拉丁转写方案.根据藏语字音转换规则,建立以单音节为单位的拉萨话发音字典,以音素为建模单元,训练得到三音子连续隐马尔可夫(HiddenMarkov Model,HMM)模型,探索藏语拉萨话语音识别的方法和总体框架,实现了基于HTK的藏语拉萨话特定人大词表连续语音识别. 展开更多
关键词 htk 藏语 拉萨话 连续语音识别 隐马尔可夫模型
下载PDF
基于HTK平台的语言学模型
9
作者 夏秀燕 王迎雪 《信息技术》 2009年第6期207-208,211,共3页
介绍了基于HTK(HMM Tools Kit)平台生成二元语言模型的具体实现过程。并对其生成的模型进行测试,最后的测试结果表明,在某特定领域训练的语言模型,用同样类别数据进行测试,其混淆度比用其它领域测试文本的混淆度低,这说明限定领... 介绍了基于HTK(HMM Tools Kit)平台生成二元语言模型的具体实现过程。并对其生成的模型进行测试,最后的测试结果表明,在某特定领域训练的语言模型,用同样类别数据进行测试,其混淆度比用其它领域测试文本的混淆度低,这说明限定领域进行语言学模型训练可以在一定程度上提高模型性能。 展开更多
关键词 htk(hmm TOOLS Kit) 特定领域 语言模型
下载PDF
基于HTK的普米语孤立词的语音识别 被引量:11
10
作者 李余芳 苏洁 +1 位作者 胡文君 潘文林 《云南民族大学学报(自然科学版)》 CAS 2015年第5期426-430,共5页
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米... 基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因. 展开更多
关键词 htk VITERBI算法 普米语 hmm 语音识别
下载PDF
基于HTK的汉语语音售票系统的设计与实现 被引量:3
11
作者 饶耀全 吴小培 吕钊 《工业控制计算机》 2010年第10期58-61,共4页
为了解决火车站售票系统处理售票业务效率低、速度慢和低智能化等问题,提出了一种基于HTK(HMM Tool Kit,隐马尔科夫模型工具箱)的汉语语音售票系统。详细阐述了基于HTK的语音识别等关键技术的基本原理,并给出了系统实现的关键代码。在... 为了解决火车站售票系统处理售票业务效率低、速度慢和低智能化等问题,提出了一种基于HTK(HMM Tool Kit,隐马尔科夫模型工具箱)的汉语语音售票系统。详细阐述了基于HTK的语音识别等关键技术的基本原理,并给出了系统实现的关键代码。在语音识别测试中,语句级识别正确率为98.00%;字词级识别正确率达到了98.67%。实验结果表明所提出的语音售票系统具有较高的可行性与实用性。 展开更多
关键词 语音识别 htk 售票系统 ATK
下载PDF
基于HTK调用MatLab的语音识别的研究 被引量:2
12
作者 张戈 严欢 殷景华 《现代计算机》 2010年第9期31-33,43,共4页
根据HTK原理,介绍基于HTK调用MatLab的语音识别过程。利用HTK软件建立隐马尔科夫模型(HMM)对录制的语料进行训练和识别。修改HMM中参数(包含语音特征、声学模型等),再利用MatLab计算速度快及其编程开发节省时间优势对其计算仿真,仿真图... 根据HTK原理,介绍基于HTK调用MatLab的语音识别过程。利用HTK软件建立隐马尔科夫模型(HMM)对录制的语料进行训练和识别。修改HMM中参数(包含语音特征、声学模型等),再利用MatLab计算速度快及其编程开发节省时间优势对其计算仿真,仿真图显示各类参数的语音识别结果,分析参数对语音识别系统识别率的影响,改进并提高语音识别率,从而达到更好的效果。 展开更多
关键词 htk hmm模型 声学模型
下载PDF
基于HTK的连续汉语数码语音输入系统研究 被引量:2
13
作者 杨嵩 《计算机与数字工程》 2012年第4期35-38,共4页
HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成以及字符识别等领域。文章在详细介绍了语音识别的过程、原理及相关概念的基础之上,介绍了HTK的基本原理和软件结构,以及使用HTK完成语音识别任务... HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成以及字符识别等领域。文章在详细介绍了语音识别的过程、原理及相关概念的基础之上,介绍了HTK的基本原理和软件结构,以及使用HTK完成语音识别任务的整个过程。最后,讨论声学单元等一系列的模型参数的选择,使用HTK搭建一个简单连续汉语语音输入系统。 展开更多
关键词 语音识别 htk 隐马尔可夫模型(hmm)
下载PDF
基于HTK的嵌入式猪只声音识别系统设计 被引量:1
14
作者 袁瑞临 张栖铭 +1 位作者 王峰 范凡 《电脑知识与技术》 2017年第2期186-188,共3页
为了对猪只异常状态进行检测,本文设计了一种基于嵌入式平台的猪只声音识别系统,该系统以S3C2440芯片为微处理器,以Linux为操作系统,以QT为显示界面,并通过移植基于隐马尔科夫模型算法的语音识别工具箱HTK,实现了自动识别猪只不同状态... 为了对猪只异常状态进行检测,本文设计了一种基于嵌入式平台的猪只声音识别系统,该系统以S3C2440芯片为微处理器,以Linux为操作系统,以QT为显示界面,并通过移植基于隐马尔科夫模型算法的语音识别工具箱HTK,实现了自动识别猪只不同状态的声音。经过实验验证表明,本系统达到了预期的实验效果。 展开更多
关键词 声音识别 S3C2440 隐马尔科夫模型 htk 嵌入式
下载PDF
基于HTK的连续语音识别网站系统的研究和实现 被引量:1
15
作者 王鸿儒 杨根科 杨祖华 《微型电脑应用》 2010年第7期19-20,30,共3页
隐马尔可夫模型(HMM)基本技术是语音识别中较为成功的算法,HMM具有较强的对时间序列结构的建模能力。文章在HMM Tool Kit(HTK)的基本技术之上,建立了一个以HMM为基础的提供连续语音识别服务的网站系统。该网络系统前台界面程序主要通过A... 隐马尔可夫模型(HMM)基本技术是语音识别中较为成功的算法,HMM具有较强的对时间序列结构的建模能力。文章在HMM Tool Kit(HTK)的基本技术之上,建立了一个以HMM为基础的提供连续语音识别服务的网站系统。该网络系统前台界面程序主要通过ASP.NET 2.0和Visual C#在Windows server 2003平台上建立,后台识别程序通过ATL实现。经过测试,该系统展示出其在语音数据检索中的应用价值。 展开更多
关键词 隐马尔可夫模型 连续语音识别 htk
下载PDF
基于HTK的连接数字语音识别的研究
16
作者 黄少龙 《山西电子技术》 2016年第5期86-88,共3页
HTK是剑桥大学工程系开发的一套基于C语言的语音处理工具包,目前在语音识别、语音合成以及字符序列等领域已得到广泛应用。本文首先简单介绍了语音识别的一些基本原理,接着从HTK的主要原理和软件结构出发,阐述了基于HTK语音识别系统的... HTK是剑桥大学工程系开发的一套基于C语言的语音处理工具包,目前在语音识别、语音合成以及字符序列等领域已得到广泛应用。本文首先简单介绍了语音识别的一些基本原理,接着从HTK的主要原理和软件结构出发,阐述了基于HTK语音识别系统的搭建过程以及每部分用到的工具或函数,最终完成了7字长的连续语音识别系统,并验证了其识别率。 展开更多
关键词 htk 语音识别 hmm模型 梅尔倒谱系数MFCC
下载PDF
藏语拉萨话大词表连续语音识别声学模型研究 被引量:16
17
作者 李冠宇 孟猛 《计算机工程》 CAS CSCD 2012年第5期189-191,共3页
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语... 根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。 展开更多
关键词 藏语 拉萨话 连续语音识别 隐马尔可夫模型 htk工具 声学模型
下载PDF
基于隐马可夫模型的邻近方言差异系数研究
18
作者 王雪飞 刘珺 《计算机工程》 CAS CSCD 北大核心 2016年第4期179-183,共5页
量化邻近地域的方言差异性研究,运用方言朗读独立字词文本A形成声音文件M,使用HTK工具包将M文件构造为声学特征参数集S_M,计算方言差异系数。在邻近连续i个地域基础上得到相应的Si_Mi,同时使声音Mi结合对比样本区域(i=0)音-字(词)... 量化邻近地域的方言差异性研究,运用方言朗读独立字词文本A形成声音文件M,使用HTK工具包将M文件构造为声学特征参数集S_M,计算方言差异系数。在邻近连续i个地域基础上得到相应的Si_Mi,同时使声音Mi结合对比样本区域(i=0)音-字(词)映射表,形成i村落并对应文本Ai。差异系数ξ定义为Ai与A0(样本区域或村落)之间的文本内容差异之比。分析连续古村落ξ值特征结果表明,方言在邻近3个村落(地理位置)的ξ值介于0.88~1时,差异较小,而当邻近9个村落的ξ值(综合)小于0.6及词组ξ值小于0.2时,差异快速变大,建立方言距离并提出方言半径概念,确认所测试方言的半径为8(8个村落)。 展开更多
关键词 方言语音 方言差异系数 htk软件 隐马可夫模型 方言半径
下载PDF
基于骨导麦克风数据的咀嚼发音类型自动识别与分类方法 被引量:1
19
作者 更太加 张新意 魏建国 《声学技术》 CSCD 北大核心 2022年第4期556-561,共6页
口腔运动与人们的饮食规律息息相关,该文通过对口腔运动状态的分析识别来监测人们的饮食规律,以此来指导人们的饮食习惯。借助语音识别技术的思想和方法,分析识别口腔运动产生的骨导音,为提升识别效率,采用了传统的隐马尔可夫模型。基... 口腔运动与人们的饮食规律息息相关,该文通过对口腔运动状态的分析识别来监测人们的饮食规律,以此来指导人们的饮食习惯。借助语音识别技术的思想和方法,分析识别口腔运动产生的骨导音,为提升识别效率,采用了传统的隐马尔可夫模型。基于隐马尔可夫模型建立了一套骨导音识别系统,在进行骨导音识别之前,通过分帧加窗、提取梅尔频率倒谱系数,对其进行模型训练;在识别过程中,找出与待测音频信号和模板库中匹配度最高的模型,以其模型输出结果作为最后的识别结果。该方法的识别结果可以达到84%,实验结果表明该方法具有一定的可行性。 展开更多
关键词 梅尔倒谱系数 隐马尔可夫模型 htk工具 口腔运动状态
下载PDF
基于Julius的机器人语音识别系统构建
20
作者 付维 刘冬 闵华松 《单片机与嵌入式系统应用》 2011年第8期41-44,共4页
随着机器人技术不断发展,本文提出机器人的语音识别这一智能人机交互方式。在研究了基于HMM语音识别基本原理的情况下,在实验室的机器人平台上,利用HTK和Julius开源平台,构建了一个孤立词的语音识别系统。利用该语音识别系统可以提取语... 随着机器人技术不断发展,本文提出机器人的语音识别这一智能人机交互方式。在研究了基于HMM语音识别基本原理的情况下,在实验室的机器人平台上,利用HTK和Julius开源平台,构建了一个孤立词的语音识别系统。利用该语音识别系统可以提取语音命令用于机器人的控制。 展开更多
关键词 机器人 语音识别 hmm htk Julius
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部