期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于HTK的语音识别语言模型设计及性能分析 被引量:2
1
作者 张强 陶宏才 《成都信息工程学院学报》 2009年第2期142-146,共5页
在大词汇连续语音识别系统中,统计语言模型是该系统非常重要的一部分,对整个识别系统的识别效果产生重要的影响。分析了统计语言模型原理和相关技术,基于HTK设计了适合大词汇连续语音识别系统的统计语言模型,同时对该语言模型的复杂度... 在大词汇连续语音识别系统中,统计语言模型是该系统非常重要的一部分,对整个识别系统的识别效果产生重要的影响。分析了统计语言模型原理和相关技术,基于HTK设计了适合大词汇连续语音识别系统的统计语言模型,同时对该语言模型的复杂度、精确识别率进行分析,指出了影响统计语言模型性能的相关因素。 展开更多
关键词 语音识别 统计语言模型 htk N-GRAM模型
下载PDF
基于HTK的语音识别网络优化算法 被引量:3
2
作者 杨善茜 黄汉明 +1 位作者 蒋正锋 李锐 《计算机工程》 CAS CSCD 北大核心 2010年第14期169-171,共3页
隐马尔可夫模型工具包(HTK)的HParse命令根据用户以正则表达式形式定义的任务语法来生成HTK可用的底层表示的语音识别网络,但不是每个语句都能用正则表达式表示出来。针对该问题,提出基于HTK的语音识别网络算法用于识别网络的优化问题,... 隐马尔可夫模型工具包(HTK)的HParse命令根据用户以正则表达式形式定义的任务语法来生成HTK可用的底层表示的语音识别网络,但不是每个语句都能用正则表达式表示出来。针对该问题,提出基于HTK的语音识别网络算法用于识别网络的优化问题,给出该算法的具体实现过程。实验结果表明,在保证识别率的前提下,优化后的语音识别网络在语音识别系统中所用的时间比较短,算法是有效的。 展开更多
关键词 连续语音识别 自动机 隐马尔可夫模型工具包 语音识别网络
下载PDF
基于HTK的特定词语音识别系统 被引量:3
3
作者 曾妮 费洪晓 姜振飞 《计算机系统应用》 2011年第3期157-160,共4页
语音识别技术经过半个世纪的发展,目前已日趋成熟,其在语音拨号系统、数字遥控、工业控制等领域都有了广泛的应用。由于目前常用的声学模型和语言模型的局限性,计算机只能识别一些词汇或一些句子。语音识别系统在语种改变时,往往会出现... 语音识别技术经过半个世纪的发展,目前已日趋成熟,其在语音拨号系统、数字遥控、工业控制等领域都有了广泛的应用。由于目前常用的声学模型和语言模型的局限性,计算机只能识别一些词汇或一些句子。语音识别系统在语种改变时,往往会出现错误的识别结果。针对上述问题,结合隐马尔可夫模型原理,在HTK语音处理工具箱的基础上构建了中英文特定词语音识别系统。该系统通过代码控制整个构建过程,使其在更换新的训练数据和词典后能快速生成对应的识别模型。 展开更多
关键词 语音识别 隐马尔可夫模型 htk
下载PDF
基于HTK的语音识别的并行化研究与实现 被引量:1
4
作者 刘勇进 史晓东 《计算机应用》 CSCD 北大核心 2009年第4期1052-1055,共4页
详细地分析了语音识别的过程,给出了相应的算法描述,并分析了语音识别并行化的可能性。将并行计算的思想应用于语音识别的算法中,使用多线程技术,并引入避免竞争条件的机制,在多核计算机上并行地计算HMM模型节点的似然率,从而得到语音... 详细地分析了语音识别的过程,给出了相应的算法描述,并分析了语音识别并行化的可能性。将并行计算的思想应用于语音识别的算法中,使用多线程技术,并引入避免竞争条件的机制,在多核计算机上并行地计算HMM模型节点的似然率,从而得到语音识别的并行化算法。分析了该并行化算法的性能,同时在语音识别工具包HTK 3.4上实现了这种并行化算法。基于WSJ0语料库的实验结果表明该并行化算法在不影响识别结果的前提下能够有效地提高语音识别的实时性能。 展开更多
关键词 多核 htk 并行计算 语音识别
下载PDF
基于HTK的连续语音识别系统及其在TIMIT上的实验 被引量:6
5
作者 涂俊辉 续晋华 《现代计算机》 2009年第11期29-33,共5页
介绍一个连续语音识别系统的构成以及HTK工具的使用,然后尝试利用该工具搭建一个连续语音识别系统,使用该系统在一个非特定人的大词汇量连续语音数据库——TIMIT上进行实验,讨论如何选择不同的声学单元进行建模,并且对模型的参数进行一... 介绍一个连续语音识别系统的构成以及HTK工具的使用,然后尝试利用该工具搭建一个连续语音识别系统,使用该系统在一个非特定人的大词汇量连续语音数据库——TIMIT上进行实验,讨论如何选择不同的声学单元进行建模,并且对模型的参数进行一系列的改进。 展开更多
关键词 连续语音识别 隐马尔可夫模型 htk TIMIT
下载PDF
基于HTK的连续语音识别网站系统的研究和实现 被引量:1
6
作者 王鸿儒 杨根科 杨祖华 《微型电脑应用》 2010年第7期19-20,30,共3页
隐马尔可夫模型(HMM)基本技术是语音识别中较为成功的算法,HMM具有较强的对时间序列结构的建模能力。文章在HMM Tool Kit(HTK)的基本技术之上,建立了一个以HMM为基础的提供连续语音识别服务的网站系统。该网络系统前台界面程序主要通过A... 隐马尔可夫模型(HMM)基本技术是语音识别中较为成功的算法,HMM具有较强的对时间序列结构的建模能力。文章在HMM Tool Kit(HTK)的基本技术之上,建立了一个以HMM为基础的提供连续语音识别服务的网站系统。该网络系统前台界面程序主要通过ASP.NET 2.0和Visual C#在Windows server 2003平台上建立,后台识别程序通过ATL实现。经过测试,该系统展示出其在语音数据检索中的应用价值。 展开更多
关键词 隐马尔可夫模型 连续语音识别 htk
下载PDF
基于HTK的维吾尔语连续音素识别技术研究
7
作者 米日古力.阿布都热素 米吉提.阿不力米提 +1 位作者 艾克白尔.帕塔尔 艾斯卡尔.艾木都拉 《计算机工程与应用》 CSCD 2013年第22期150-154,172,共6页
以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技... 以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。 展开更多
关键词 维吾尔语 声学模型 语言模型 维吾尔语音素 基于隐马尔可夫模型的工具箱(htk)
下载PDF
MatLab环境下调用HTK的连续语音识别方法
8
作者 李理 王冬霞 《电子世界》 2014年第20期131-132,共2页
本文根据HTK(HMMToolkit)的基本原理,在MatLab环境下通过调用HTK各命令实现小词汇量连续语音识别。采用HTK工具包搭建语音的隐马尔可夫模型(HMM),再利用MatLab循环编程开发进行仿真实验,避免了传统地逐步运行HTK各个命令的冗余... 本文根据HTK(HMMToolkit)的基本原理,在MatLab环境下通过调用HTK各命令实现小词汇量连续语音识别。采用HTK工具包搭建语音的隐马尔可夫模型(HMM),再利用MatLab循环编程开发进行仿真实验,避免了传统地逐步运行HTK各个命令的冗余操作,降低了操作复杂度。 展开更多
关键词 htk 语音识别 隐马尔可夫模型
下载PDF
基于HTK的孤立词语音识别
9
作者 杜宇斌 赵磊 《山东理工大学学报(自然科学版)》 CAS 2019年第5期63-69,共7页
设计孤立词的语音识别系统,对小词汇量、非特定人的语音进行识别。利用HTK(Hidden Markov Model Toolkit,隐马尔科夫模型工具箱)语音识别工具包进行系统的搭建,从语音识别的原理出发,对每一个单词建立和训练隐马尔科夫模型,探讨语音识... 设计孤立词的语音识别系统,对小词汇量、非特定人的语音进行识别。利用HTK(Hidden Markov Model Toolkit,隐马尔科夫模型工具箱)语音识别工具包进行系统的搭建,从语音识别的原理出发,对每一个单词建立和训练隐马尔科夫模型,探讨语音识别的基本流程和实现方法,为连续语音识别研究打下基础。实验结果显示,隐马尔科夫模型对孤立词具有良好的识别性能。在正常说话语境下,对语料库中单词的识别率可达到80%。 展开更多
关键词 孤立词识别 htk 隐马尔科夫模型 模型训练
下载PDF
基于HTK的语音驱动唇形动画的实现
10
作者 高春梅 郑伯川 《现代计算机(中旬刊)》 2011年第11期3-7,共5页
语音驱动唇形动画的同步是人脸动画的难点之一。首先以音节为识别单位,通过严格的声韵母建模方法,利用HTK工具包,识别得到语音文件中的音节序列与时间信息;然后利用基本唇形库和音节到唇形映射表,获得与音节序列对应的唇形序列;利用唇... 语音驱动唇形动画的同步是人脸动画的难点之一。首先以音节为识别单位,通过严格的声韵母建模方法,利用HTK工具包,识别得到语音文件中的音节序列与时间信息;然后利用基本唇形库和音节到唇形映射表,获得与音节序列对应的唇形序列;利用唇形序列的时间信息插值播放唇形序列,实现语音驱动的唇形动画。实验表明,该方法不仅大大减少了模型数目,而且能准确识别音节序列以及时间信息,可有效地实现语音与唇动的同步。 展开更多
关键词 语音识别 语音驱动 唇形动画 声学模型 htk
下载PDF
藏语拉萨话大词表连续语音识别声学模型研究 被引量:16
11
作者 李冠宇 孟猛 《计算机工程》 CAS CSCD 2012年第5期189-191,共3页
根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语... 根据藏语的特点,提出藏语拉萨话大词表连续语音识别声学模型,利用高层次的藏语语言知识减少模式匹配的模糊性。以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。 展开更多
关键词 藏语 拉萨话 连续语音识别 隐马尔可夫模型 htk工具 声学模型
下载PDF
中文语音合成系统的设计与实现 被引量:6
12
作者 范会敏 何鑫 《计算机系统应用》 2017年第2期73-77,共5页
为了实现机器能够发出声音,本文设计并搭建了HTK(HMM-Tool-Kit)平台用来实现中文语音合成系统.采用参数合成法实现了文本到语音的合成,并对合成系统中的文本分析、韵律控制以及语音合成的实现技术进行了详细的论述.最后在Linux系统下搭... 为了实现机器能够发出声音,本文设计并搭建了HTK(HMM-Tool-Kit)平台用来实现中文语音合成系统.采用参数合成法实现了文本到语音的合成,并对合成系统中的文本分析、韵律控制以及语音合成的实现技术进行了详细的论述.最后在Linux系统下搭建环境并进行实验,得到了预期的结果,实现了文本到语音的转化. 展开更多
关键词 htk 参数合成 HTS HMM模型 STRIGHT合成器
下载PDF
基于隐马可夫模型的邻近方言差异系数研究
13
作者 王雪飞 刘珺 《计算机工程》 CAS CSCD 北大核心 2016年第4期179-183,共5页
量化邻近地域的方言差异性研究,运用方言朗读独立字词文本A形成声音文件M,使用HTK工具包将M文件构造为声学特征参数集S_M,计算方言差异系数。在邻近连续i个地域基础上得到相应的Si_Mi,同时使声音Mi结合对比样本区域(i=0)音-字(词)... 量化邻近地域的方言差异性研究,运用方言朗读独立字词文本A形成声音文件M,使用HTK工具包将M文件构造为声学特征参数集S_M,计算方言差异系数。在邻近连续i个地域基础上得到相应的Si_Mi,同时使声音Mi结合对比样本区域(i=0)音-字(词)映射表,形成i村落并对应文本Ai。差异系数ξ定义为Ai与A0(样本区域或村落)之间的文本内容差异之比。分析连续古村落ξ值特征结果表明,方言在邻近3个村落(地理位置)的ξ值介于0.88~1时,差异较小,而当邻近9个村落的ξ值(综合)小于0.6及词组ξ值小于0.2时,差异快速变大,建立方言距离并提出方言半径概念,确认所测试方言的半径为8(8个村落)。 展开更多
关键词 方言语音 方言差异系数 htk软件 隐马可夫模型 方言半径
下载PDF
基于隐马尔可夫模型的维吾尔语连续语音识别系统 被引量:17
14
作者 那斯尔江.吐尔逊 吾守尔.斯拉木 《计算机应用》 CSCD 北大核心 2009年第7期2009-2011,2025,共4页
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolK it)工具实现了基于隐马尔可夫模型(HMM)的维... 维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolK it)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。 展开更多
关键词 维吾尔语 连续语音 语音识别 HMM的工具包
下载PDF
衡阳方言孤立词识别研究
15
作者 李荣华 赵征鹏 《计算机系统应用》 2017年第5期247-252,共6页
目前,汉语识别已经取得了一定的研究成果.但由于中国的地域性差异,十里不同音,使得汉语识别系统在进行方言识别时识别率低、性能差.针对语音识别系统在对方言进行识别时的缺陷,构建了基于HTK的衡阳方言孤立词识别系统.该系统使用HTK3.4.... 目前,汉语识别已经取得了一定的研究成果.但由于中国的地域性差异,十里不同音,使得汉语识别系统在进行方言识别时识别率低、性能差.针对语音识别系统在对方言进行识别时的缺陷,构建了基于HTK的衡阳方言孤立词识别系统.该系统使用HTK3.4.1工具箱,以音素为基本识别单元,提取39维梅尔频率倒谱系数(MFCC)语音特征参数,构建隐马尔可夫模型(HMM),采用Viterbi算法进行模型训练和匹配,实现了衡阳方言孤立词语音识别.通过对比实验,比较了在不同因素模型下和不同高斯混合数下系统的性能.实验结果表明,将39维MFCC和5个高斯混合数与HMM模型结合实验时,系统的性能得到很大的改善. 展开更多
关键词 htk 隐马尔可夫模型 衡阳方言 梅尔频率倒谱系数 VITERBI算法
下载PDF
基于骨导麦克风数据的咀嚼发音类型自动识别与分类方法
16
作者 更太加 张新意 魏建国 《声学技术》 CSCD 北大核心 2022年第4期556-561,共6页
口腔运动与人们的饮食规律息息相关,该文通过对口腔运动状态的分析识别来监测人们的饮食规律,以此来指导人们的饮食习惯。借助语音识别技术的思想和方法,分析识别口腔运动产生的骨导音,为提升识别效率,采用了传统的隐马尔可夫模型。基... 口腔运动与人们的饮食规律息息相关,该文通过对口腔运动状态的分析识别来监测人们的饮食规律,以此来指导人们的饮食习惯。借助语音识别技术的思想和方法,分析识别口腔运动产生的骨导音,为提升识别效率,采用了传统的隐马尔可夫模型。基于隐马尔可夫模型建立了一套骨导音识别系统,在进行骨导音识别之前,通过分帧加窗、提取梅尔频率倒谱系数,对其进行模型训练;在识别过程中,找出与待测音频信号和模板库中匹配度最高的模型,以其模型输出结果作为最后的识别结果。该方法的识别结果可以达到84%,实验结果表明该方法具有一定的可行性。 展开更多
关键词 梅尔倒谱系数 隐马尔可夫模型 htk工具 口腔运动状态
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部