期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于动态贝叶斯网络的音视频连续语音识别和音素切分 被引量:2
1
作者 吕国云 蒋冬梅 +5 位作者 蒋晓悦 赵荣椿 侯云舒 孙阿利 H.Sahli W.Verhelst 《计算机应用》 CSCD 北大核心 2007年第7期1670-1673,共4页
构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的... 构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率比HMM识别率高2.47%。实验最后还分析了音视频数据音素时间切分的异步关系,为基于多流DBN模型的音视频连续语音识别和确定音频和视频的异步关系奠定了基础。 展开更多
关键词 动态贝叶斯网络 音视频 语音识别 音素切分
下载PDF
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究 被引量:1
2
作者 吕国云 蒋冬梅 +2 位作者 张艳宁 赵荣椿 Hichem Sahli 《西北工业大学学报》 EI CAS CSCD 北大核心 2008年第2期173-178,共6页
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Net... 提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network,Phone-shared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接。它的识别基元为音素,描述了音素的动态发音变化过程。大词汇量语音识别的实验结果表明:在纯净语音环境下,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%。 展开更多
关键词 动态贝叶斯网络 音视频语音识别音素切分
下载PDF
基于多流三音素DBN模型的音视频语音识别和音素切分
3
作者 吕国云 蒋冬梅 +3 位作者 樊养余 赵荣椿 H.Sahli W.Vlerhelst 《电子与信息学报》 EI CSCD 北大核心 2009年第2期297-301,共5页
为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基... 为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基元是三音素,描述了连续语音中的协同发音现象。实验结果表明:该模型在音视频语音识别和对音频视频流的音素切分方面,以及在确定音视频流的异步关系上,都具备较好的性能。 展开更多
关键词 语音识别 动态贝叶斯网络 音素切分 音视频
下载PDF
面向语音合成的藏语音素切分算法研究
4
作者 张金溪 李照耀 +1 位作者 肖俊生 李艾林 《西北民族大学学报(自然科学版)》 2012年第4期27-31,共5页
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩... 文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性. 展开更多
关键词 音素自动切分 藏语 语音合成 语料库
下载PDF
一种语料缺乏条件下的藏语音素自动切分方法 被引量:2
5
作者 李冠宇 于洪志 吴志强 《计算机工程与科学》 CSCD 北大核心 2014年第10期2009-2013,共5页
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础... 藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM-HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。 展开更多
关键词 藏语 拉萨方言 自动音素切分 维特比算法 隐马尔可夫模型
下载PDF
面向语音合成的维吾尔语音素自动切分算法研究 被引量:4
6
作者 阿依木尼萨.胡甫尔 艾斯卡尔.艾木都拉 《计算机应用与软件》 CSCD 2011年第9期18-21,共4页
结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入... 结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。 展开更多
关键词 音素自动切分 隐马尔科夫模型 维吾尔语 语音合成 音素语音语料库
下载PDF
中国学生英语超切分音素存在问题及教学策略
7
作者 何晓磊 《广东职业技术教育与研究》 2015年第1期64-66,共3页
切分音素和超切分音素是英语语音的两大组成部分。目前,大学课堂上的英语语音教学普遍偏重于切分音素的教学和操练,而忽视了超切分音素的教学。近期大量的研究表明,超切分音素对英语发音和口语表达的影响更大。笔者根据自身教学经验和研... 切分音素和超切分音素是英语语音的两大组成部分。目前,大学课堂上的英语语音教学普遍偏重于切分音素的教学和操练,而忽视了超切分音素的教学。近期大量的研究表明,超切分音素对英语发音和口语表达的影响更大。笔者根据自身教学经验和研究,归纳分析了中国大学生存在的超切分音素问题并简要地介绍了英语语音课堂上超切分音素的教学策略。 展开更多
关键词 切分音素 切分音素 汉语负迁移 教学策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部