期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于动态贝叶斯网络的音视频连续语音识别和音素切分
被引量:
2
1
作者
吕国云
蒋冬梅
+5 位作者
蒋晓悦
赵荣椿
侯云舒
孙阿利
H.Sahli
W.Verhelst
《计算机应用》
CSCD
北大核心
2007年第7期1670-1673,共4页
构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的...
构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率比HMM识别率高2.47%。实验最后还分析了音视频数据音素时间切分的异步关系,为基于多流DBN模型的音视频连续语音识别和确定音频和视频的异步关系奠定了基础。
展开更多
关键词
动态贝叶斯网络
音视频
语音识别
音素切分
下载PDF
职称材料
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究
被引量:
1
2
作者
吕国云
蒋冬梅
+2 位作者
张艳宁
赵荣椿
Hichem Sahli
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2008年第2期173-178,共6页
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Net...
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network,Phone-shared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接。它的识别基元为音素,描述了音素的动态发音变化过程。大词汇量语音识别的实验结果表明:在纯净语音环境下,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%。
展开更多
关键词
动态贝叶斯网络
音视频语音识别
音素切分
下载PDF
职称材料
基于多流三音素DBN模型的音视频语音识别和音素切分
3
作者
吕国云
蒋冬梅
+3 位作者
樊养余
赵荣椿
H.Sahli
W.Vlerhelst
《电子与信息学报》
EI
CSCD
北大核心
2009年第2期297-301,共5页
为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基...
为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基元是三音素,描述了连续语音中的协同发音现象。实验结果表明:该模型在音视频语音识别和对音频视频流的音素切分方面,以及在确定音视频流的异步关系上,都具备较好的性能。
展开更多
关键词
语音识别
动态贝叶斯网络
音素切分
音视频
下载PDF
职称材料
面向语音合成的藏语音素切分算法研究
4
作者
张金溪
李照耀
+1 位作者
肖俊生
李艾林
《西北民族大学学报(自然科学版)》
2012年第4期27-31,共5页
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩...
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性.
展开更多
关键词
音素
自动
切分
藏语
语音合成
语料库
下载PDF
职称材料
一种语料缺乏条件下的藏语音素自动切分方法
被引量:
2
5
作者
李冠宇
于洪志
吴志强
《计算机工程与科学》
CSCD
北大核心
2014年第10期2009-2013,共5页
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础...
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM-HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。
展开更多
关键词
藏语
拉萨方言
自动
音素切分
维特比算法
隐马尔可夫模型
下载PDF
职称材料
面向语音合成的维吾尔语音素自动切分算法研究
被引量:
4
6
作者
阿依木尼萨.胡甫尔
艾斯卡尔.艾木都拉
《计算机应用与软件》
CSCD
2011年第9期18-21,共4页
结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入...
结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。
展开更多
关键词
音素
自动
切分
隐马尔科夫模型
维吾尔语
语音合成
音素
语音语料库
下载PDF
职称材料
中国学生英语超切分音素存在问题及教学策略
7
作者
何晓磊
《广东职业技术教育与研究》
2015年第1期64-66,共3页
切分音素和超切分音素是英语语音的两大组成部分。目前,大学课堂上的英语语音教学普遍偏重于切分音素的教学和操练,而忽视了超切分音素的教学。近期大量的研究表明,超切分音素对英语发音和口语表达的影响更大。笔者根据自身教学经验和研...
切分音素和超切分音素是英语语音的两大组成部分。目前,大学课堂上的英语语音教学普遍偏重于切分音素的教学和操练,而忽视了超切分音素的教学。近期大量的研究表明,超切分音素对英语发音和口语表达的影响更大。笔者根据自身教学经验和研究,归纳分析了中国大学生存在的超切分音素问题并简要地介绍了英语语音课堂上超切分音素的教学策略。
展开更多
关键词
超
切分
音素
切分
音素
汉语负迁移
教学策略
下载PDF
职称材料
题名
基于动态贝叶斯网络的音视频连续语音识别和音素切分
被引量:
2
1
作者
吕国云
蒋冬梅
蒋晓悦
赵荣椿
侯云舒
孙阿利
H.Sahli
W.Verhelst
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子与信息处理系
出处
《计算机应用》
CSCD
北大核心
2007年第7期1670-1673,共4页
基金
科技部与比利时弗拉芒大区科技合作项目([2004]487)
西北工业大学英才培养计划项目(04XD0102)
文摘
构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率比HMM识别率高2.47%。实验最后还分析了音视频数据音素时间切分的异步关系,为基于多流DBN模型的音视频连续语音识别和确定音频和视频的异步关系奠定了基础。
关键词
动态贝叶斯网络
音视频
语音识别
音素切分
Keywords
Dynamic Bayesian Networks(DBN)
audio-video
speech recognition
phone segmentation
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究
被引量:
1
2
作者
吕国云
蒋冬梅
张艳宁
赵荣椿
Hichem Sahli
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子与信息处理系
出处
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2008年第2期173-178,共6页
基金
中国科技部与比利时国际合作项目(No.[2004]487)资助
文摘
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network,Phone-shared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接。它的识别基元为音素,描述了音素的动态发音变化过程。大词汇量语音识别的实验结果表明:在纯净语音环境下,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%。
关键词
动态贝叶斯网络
音视频语音识别
音素切分
Keywords
single-stream multi-state dynamic Bayesian network (SM-DBN), continuous speechrecognition, phone segmentation
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多流三音素DBN模型的音视频语音识别和音素切分
3
作者
吕国云
蒋冬梅
樊养余
赵荣椿
H.Sahli
W.Vlerhelst
机构
西北工业大学
布鲁塞尔自由大学电子与信息处理系
出处
《电子与信息学报》
EI
CSCD
北大核心
2009年第2期297-301,共5页
基金
中国博士后科学基金和中国科技部资助课题
比利时弗拉芒大区科技合作项目([2004]487)资助课题
文摘
为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基元是三音素,描述了连续语音中的协同发音现象。实验结果表明:该模型在音视频语音识别和对音频视频流的音素切分方面,以及在确定音视频流的异步关系上,都具备较好的性能。
关键词
语音识别
动态贝叶斯网络
音素切分
音视频
Keywords
Speech recognition
Dynamic Bayesian network
Phone segmentation
Audio-visual
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向语音合成的藏语音素切分算法研究
4
作者
张金溪
李照耀
肖俊生
李艾林
机构
西北民族大学 中国民族语言文字信息技术重点实验室
出处
《西北民族大学学报(自然科学版)》
2012年第4期27-31,共5页
基金
国家自然基金项目(61262054)
西北民族大学中央高校基本科研业务费专项(ycx12024)
文摘
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性.
关键词
音素
自动
切分
藏语
语音合成
语料库
Keywords
Phoneme automatic segmentation
Tibetan
Speech synthesis
Corpus
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种语料缺乏条件下的藏语音素自动切分方法
被引量:
2
5
作者
李冠宇
于洪志
吴志强
机构
西北民族大学中国民族语言文字教育部重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2014年第10期2009-2013,共5页
基金
国家自然科学基金资助项目(61262054)
文摘
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM-HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。
关键词
藏语
拉萨方言
自动
音素切分
维特比算法
隐马尔可夫模型
Keywords
Tibetan
Lhasa dialect
automatic phoneme segmentation
Viterbi
HMM
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向语音合成的维吾尔语音素自动切分算法研究
被引量:
4
6
作者
阿依木尼萨.胡甫尔
艾斯卡尔.艾木都拉
机构
新疆大学信息科学与工程学院
出处
《计算机应用与软件》
CSCD
2011年第9期18-21,共4页
基金
国家自然科学基金(61062008)
国家语委项目(MZ115-75)
文摘
结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。
关键词
音素
自动
切分
隐马尔科夫模型
维吾尔语
语音合成
音素
语音语料库
Keywords
Phoneme automatic segmentation HMM Uyghur language Speech synthesis Phonemic speech corpus
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中国学生英语超切分音素存在问题及教学策略
7
作者
何晓磊
机构
广东理工学院
出处
《广东职业技术教育与研究》
2015年第1期64-66,共3页
文摘
切分音素和超切分音素是英语语音的两大组成部分。目前,大学课堂上的英语语音教学普遍偏重于切分音素的教学和操练,而忽视了超切分音素的教学。近期大量的研究表明,超切分音素对英语发音和口语表达的影响更大。笔者根据自身教学经验和研究,归纳分析了中国大学生存在的超切分音素问题并简要地介绍了英语语音课堂上超切分音素的教学策略。
关键词
超
切分
音素
切分
音素
汉语负迁移
教学策略
分类号
H319.3 [语言文字—英语]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于动态贝叶斯网络的音视频连续语音识别和音素切分
吕国云
蒋冬梅
蒋晓悦
赵荣椿
侯云舒
孙阿利
H.Sahli
W.Verhelst
《计算机应用》
CSCD
北大核心
2007
2
下载PDF
职称材料
2
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究
吕国云
蒋冬梅
张艳宁
赵荣椿
Hichem Sahli
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2008
1
下载PDF
职称材料
3
基于多流三音素DBN模型的音视频语音识别和音素切分
吕国云
蒋冬梅
樊养余
赵荣椿
H.Sahli
W.Vlerhelst
《电子与信息学报》
EI
CSCD
北大核心
2009
0
下载PDF
职称材料
4
面向语音合成的藏语音素切分算法研究
张金溪
李照耀
肖俊生
李艾林
《西北民族大学学报(自然科学版)》
2012
0
下载PDF
职称材料
5
一种语料缺乏条件下的藏语音素自动切分方法
李冠宇
于洪志
吴志强
《计算机工程与科学》
CSCD
北大核心
2014
2
下载PDF
职称材料
6
面向语音合成的维吾尔语音素自动切分算法研究
阿依木尼萨.胡甫尔
艾斯卡尔.艾木都拉
《计算机应用与软件》
CSCD
2011
4
下载PDF
职称材料
7
中国学生英语超切分音素存在问题及教学策略
何晓磊
《广东职业技术教育与研究》
2015
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部