期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BTSM和DBN模型的唇读和视素切分研究
1
作者
吕国云
赵荣椿
+3 位作者
蒋冬梅
蒋晓悦
侯云舒
sahli h
《计算机工程与应用》
CSCD
北大核心
2007年第14期21-24,共4页
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能...
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。
展开更多
关键词
动态贝叶斯网络
贝叶斯切线形状模型
语音识别
视觉语音
下载PDF
职称材料
基于上下文三音素DBN模型的连续语音识别
2
作者
吕国云
赵荣椿
+1 位作者
蒋冬梅
sahli h
《计算机工程与应用》
CSCD
北大核心
2007年第35期35-38,共4页
考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上...
考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上下文相关三音素节点替代单音素节点,每个词由它的对应三音素单元构成,而三音素单元和观测向量相联系;SS-DBN-TRI-CON模型基于SS-DBN模型,通过增加当前音素的前音素节点和后音素节点,构成一个新的词间扩展的三音素变量节点,新的三音素节点和观测向量相联系,采用高斯混合模型来描述,采用数字连续语音数据库的实验结果表明:SS-DBN-TRI-CON具备最好的语音识别性能。
展开更多
关键词
动态贝叶斯网络
语音识别
三音素
单音素
上下文相关
下载PDF
职称材料
题名
基于BTSM和DBN模型的唇读和视素切分研究
1
作者
吕国云
赵荣椿
蒋冬梅
蒋晓悦
侯云舒
sahli h
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子信息系
出处
《计算机工程与应用》
CSCD
北大核心
2007年第14期21-24,共4页
基金
中国科技部与比利时弗拉芒大区科技合作项目(No.[2004]487)
西北工业大学英才培养计划项目(No.04XD0102)
文摘
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。
关键词
动态贝叶斯网络
贝叶斯切线形状模型
语音识别
视觉语音
Keywords
dynamic Bayesian network
Bayesian tangent shape model
speech recognition
visual speech
分类号
TP392.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于上下文三音素DBN模型的连续语音识别
2
作者
吕国云
赵荣椿
蒋冬梅
sahli h
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子信息系
出处
《计算机工程与应用》
CSCD
北大核心
2007年第35期35-38,共4页
基金
中国科技部与比利时弗拉芒大区科技合作项目(No.[2004]487)
西北工业大学英才培养计划项目(No.04XD0102)。
文摘
考虑连续语音中的协同发音问题,提出基于词内扩展的单流上下文相关三音素动态贝叶斯网络(SS-DBN-TRI)模型和词间扩展的单流上下文相关三音素DBN(SS-DBN-TRI-CON)模型。SS-DBN-TRI模型是Bilmes提出单流DBN(SS-DBN)模型的改进,采用词内上下文相关三音素节点替代单音素节点,每个词由它的对应三音素单元构成,而三音素单元和观测向量相联系;SS-DBN-TRI-CON模型基于SS-DBN模型,通过增加当前音素的前音素节点和后音素节点,构成一个新的词间扩展的三音素变量节点,新的三音素节点和观测向量相联系,采用高斯混合模型来描述,采用数字连续语音数据库的实验结果表明:SS-DBN-TRI-CON具备最好的语音识别性能。
关键词
动态贝叶斯网络
语音识别
三音素
单音素
上下文相关
Keywords
Dynamic Bayesian Network(DBN)
speech recognition
triphone
mono-phone
context-dependent
分类号
TP392.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于BTSM和DBN模型的唇读和视素切分研究
吕国云
赵荣椿
蒋冬梅
蒋晓悦
侯云舒
sahli h
《计算机工程与应用》
CSCD
北大核心
2007
0
下载PDF
职称材料
2
基于上下文三音素DBN模型的连续语音识别
吕国云
赵荣椿
蒋冬梅
sahli h
《计算机工程与应用》
CSCD
北大核心
2007
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部