-
题名基于发音特征的音/视频双流语音识别模型
被引量:1
- 1
-
-
作者
宋培岩
蒋冬梅
王风娜
-
机构
西北工业大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第7期2481-2483,共3页
-
基金
国家自然科学基金资助项目(60703104)
-
文摘
构建了一种基于发音特征的音/视频双流动态贝叶斯网络(dynamic Bayesian network,DBN)语音识别模型,定义了各节点的条件概率关系,以及发音特征之间的异步约束关系,最后在音/视频连接数字语音数据库上进行了语音识别实验,并与音频单流、视频单流DBN模型比较了在不同信噪比情况下的识别效果。结果表明,在低信噪比情况下,基于发音特征的音/视频双流语音识别模型表现出最好的识别性能,而且随着噪声的增加,其识别率下降的趋势比较平缓,表明该模型对噪声具有很强的鲁棒性,更适用于低信噪比环境下的语音识别。
-
关键词
动态贝叶斯网络
发音特征
音/视频
语音识别
-
Keywords
dynamic Bayesian network( DBN)
articulatory feature
audio-visual
speech recognition
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名结合发音特征的动态贝叶斯网络语音识别模型
- 2
-
-
作者
王风娜
蒋冬梅
宋培岩
-
机构
西北工业大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第8期178-181,共4页
-
基金
国家自然科学基金No.60703104~~
-
文摘
构建了一种新的基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)的异步整词-发音特征语音识别模型AWA-DBN(每个词由其发音特征的运动来描述),定义了各发音特征节点及异步检查节点的条件概率分布。在标准数字语音库Aurora5.0上的语音识别实验表明,与整词-状态DBN(WS-DBN,每个词由固定个数的整词状态构成)和整词-音素DBN(WP-DBN,每个词由其对应的音素序列构成)模型相比,WS-DBN模型虽然具有最高的识别率,但其只适用于小词汇量孤立词语音识别,AWA-DBN和WP-DBN可以为大词汇量连续语音建模,而AWA-DBN模型比WP-DBN模型具有更高的语音识别率和系统鲁棒性。
-
关键词
发音特征
动态贝叶斯网络
语音识别
-
Keywords
Artieulatory Feature(AF)
Dynamic Bayesian Network(DBN )
speech recognition
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-