期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于动态贝叶斯网络的音视频连续语音识别和音素切分
被引量:
2
1
作者
吕国云
蒋冬梅
+5 位作者
蒋晓悦
赵荣椿
侯云舒
孙阿利
h.sahli
W.Verhelst
《计算机应用》
CSCD
北大核心
2007年第7期1670-1673,共4页
构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的...
构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率比HMM识别率高2.47%。实验最后还分析了音视频数据音素时间切分的异步关系,为基于多流DBN模型的音视频连续语音识别和确定音频和视频的异步关系奠定了基础。
展开更多
关键词
动态贝叶斯网络
音视频
语音识别
音素切分
下载PDF
职称材料
一种噪音环境下的基于特征口形的音频视频混合连续语音识别系统
被引量:
1
2
作者
谢磊
I.Cravyse
+5 位作者
蒋冬梅
赵荣椿
h.sahli
Werner Verhelst
J Cornelis
Ignace Lemahieu
《计算机工程与应用》
CSCD
北大核心
2003年第16期3-5,35,共4页
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更...
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。
展开更多
关键词
音频-视频混合连续语音识别
主分量分析
特征口形
多数据流
HMM
下载PDF
职称材料
题名
基于动态贝叶斯网络的音视频连续语音识别和音素切分
被引量:
2
1
作者
吕国云
蒋冬梅
蒋晓悦
赵荣椿
侯云舒
孙阿利
h.sahli
W.Verhelst
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子与信息处理系
出处
《计算机应用》
CSCD
北大核心
2007年第7期1670-1673,共4页
基金
科技部与比利时弗拉芒大区科技合作项目([2004]487)
西北工业大学英才培养计划项目(04XD0102)
文摘
构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率比HMM识别率高2.47%。实验最后还分析了音视频数据音素时间切分的异步关系,为基于多流DBN模型的音视频连续语音识别和确定音频和视频的异步关系奠定了基础。
关键词
动态贝叶斯网络
音视频
语音识别
音素切分
Keywords
Dynamic Bayesian Networks(DBN)
audio-video
speech recognition
phone segmentation
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种噪音环境下的基于特征口形的音频视频混合连续语音识别系统
被引量:
1
2
作者
谢磊
I.Cravyse
蒋冬梅
赵荣椿
h.sahli
Werner Verhelst
J Cornelis
Ignace Lemahieu
机构
西北工业大学计算机科学与工程系
ETRO
UniversityofGent(RUG)
出处
《计算机工程与应用》
CSCD
北大核心
2003年第16期3-5,35,共4页
基金
中国科技部与比利时弗拉芒大区的国际科技合作项目"现实世界的机器视觉与语音技术"的支持(编号:国科外字19990209号)
文摘
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。
关键词
音频-视频混合连续语音识别
主分量分析
特征口形
多数据流
HMM
Keywords
Audio-Visual Speech Recognition,Principal Components Analysis,Eigen Mouth,Multi-Stream,HMM
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于动态贝叶斯网络的音视频连续语音识别和音素切分
吕国云
蒋冬梅
蒋晓悦
赵荣椿
侯云舒
孙阿利
h.sahli
W.Verhelst
《计算机应用》
CSCD
北大核心
2007
2
下载PDF
职称材料
2
一种噪音环境下的基于特征口形的音频视频混合连续语音识别系统
谢磊
I.Cravyse
蒋冬梅
赵荣椿
h.sahli
Werner Verhelst
J Cornelis
Ignace Lemahieu
《计算机工程与应用》
CSCD
北大核心
2003
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部