期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BTSM和DBN模型的唇读和视素切分研究
1
作者
吕国云
赵荣椿
+3 位作者
蒋冬梅
蒋晓悦
侯云舒
Sahli H
《计算机工程与应用》
CSCD
北大核心
2007年第14期21-24,共4页
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能...
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。
展开更多
关键词
动态
贝叶斯
网络
贝叶斯
切线
形状
模型
语音识别
视觉语音
下载PDF
职称材料
一种新的二维图像特征提取算法
被引量:
3
2
作者
闫煜
金峰
鲁华祥
《微计算机信息》
北大核心
2006年第05S期189-192,共4页
本文在Bayesianshapemodel(BSM)算法的基础上提出了一种新的二维图像特征提取算法。新算法为形状矩阵定义了一种新的表示方法,并提出了一种根据物体形状某些点(轮廓点)的坐标来估计剩余点(控制点)的坐标的新的方法。实验结果表明,在与...
本文在Bayesianshapemodel(BSM)算法的基础上提出了一种新的二维图像特征提取算法。新算法为形状矩阵定义了一种新的表示方法,并提出了一种根据物体形状某些点(轮廓点)的坐标来估计剩余点(控制点)的坐标的新的方法。实验结果表明,在与传统算法计算量等同的条件下,该算法在精确度方面获得了很大的提高。
展开更多
关键词
贝叶斯形状模型
物体定位
主元分析
形状
表示
二维图像特征
下载PDF
职称材料
基于BTSM-LDA的口形动态特征及多流异步音视频语音识别
3
作者
吕国云
赵荣椿
+3 位作者
蒋冬梅
H.Sahli
樊养余
W.Verhelst
《数据采集与处理》
CSCD
北大核心
2008年第4期397-403,共7页
引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余。同时采用一种新颖的多流异步动态贝叶...
引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余。同时采用一种新颖的多流异步动态贝叶斯网络(MS—ADBN)模型来实现音视频的连续语音识别,该模型在词节点级别体现了音视频流的同步异步性。识别实验结果表明:采用LDA视觉语音动态特征的系统性能明显优于静态的口形轮廓几何特征,在语音信噪比为0~30dB的测试环境下,融合LDA视觉特征的MS—ADBN模型比多流异步HMM的平均识别率提高4.92%,说明MS—ADBN模型更好地表达了音视频流之间的异步关系。
展开更多
关键词
动态
贝叶斯
网络
语音识别
贝叶斯
切线
形状
模型
多流异步
线性判别分析
下载PDF
职称材料
题名
基于BTSM和DBN模型的唇读和视素切分研究
1
作者
吕国云
赵荣椿
蒋冬梅
蒋晓悦
侯云舒
Sahli H
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子信息系
出处
《计算机工程与应用》
CSCD
北大核心
2007年第14期21-24,共4页
基金
中国科技部与比利时弗拉芒大区科技合作项目(No.[2004]487)
西北工业大学英才培养计划项目(No.04XD0102)
文摘
为实现文本/语音驱动的说话人头部动画,提出基于贝叶斯切线形状模型的口形轮廓特征提取方法和基于动态贝叶斯网络(Dynamic Bayesian Network,DBN)模型的唇读系统。在描述词与它的组成视素关系的基础上,得到视素时间切分序列。为比较性能,音素DBN模型和HMM的音素识别结果被影射成视素序列。在评价准则上,提出绝对视素切分正确性和基于图像与嘴唇几何特征两种相对视素切分正确性的评价标准。实验表明,DBN模型识别性能优于HMM,而基于视素的DBN模型能为说话人头部动画提供最好的口形。
关键词
动态
贝叶斯
网络
贝叶斯
切线
形状
模型
语音识别
视觉语音
Keywords
dynamic Bayesian network
Bayesian tangent shape model
speech recognition
visual speech
分类号
TP392.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种新的二维图像特征提取算法
被引量:
3
2
作者
闫煜
金峰
鲁华祥
机构
中国科学院半导体所神经网络实验室
出处
《微计算机信息》
北大核心
2006年第05S期189-192,共4页
基金
国家自然科学基金(No.90207008)
文摘
本文在Bayesianshapemodel(BSM)算法的基础上提出了一种新的二维图像特征提取算法。新算法为形状矩阵定义了一种新的表示方法,并提出了一种根据物体形状某些点(轮廓点)的坐标来估计剩余点(控制点)的坐标的新的方法。实验结果表明,在与传统算法计算量等同的条件下,该算法在精确度方面获得了很大的提高。
关键词
贝叶斯形状模型
物体定位
主元分析
形状
表示
二维图像特征
Keywords
Bayesian shape model
object locating
principal component analysis
shape representation
分类号
TP317.4 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于BTSM-LDA的口形动态特征及多流异步音视频语音识别
3
作者
吕国云
赵荣椿
蒋冬梅
H.Sahli
樊养余
W.Verhelst
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子与信息处理系
出处
《数据采集与处理》
CSCD
北大核心
2008年第4期397-403,共7页
基金
中国科技部和比利时国际合作([2004]487)资助项目
国家高技术研究发展(八六三)计划(2007AA01I324)资助项目
文摘
引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余。同时采用一种新颖的多流异步动态贝叶斯网络(MS—ADBN)模型来实现音视频的连续语音识别,该模型在词节点级别体现了音视频流的同步异步性。识别实验结果表明:采用LDA视觉语音动态特征的系统性能明显优于静态的口形轮廓几何特征,在语音信噪比为0~30dB的测试环境下,融合LDA视觉特征的MS—ADBN模型比多流异步HMM的平均识别率提高4.92%,说明MS—ADBN模型更好地表达了音视频流之间的异步关系。
关键词
动态
贝叶斯
网络
语音识别
贝叶斯
切线
形状
模型
多流异步
线性判别分析
Keywords
dynamic Bayesian networks
speech recognition
Bayesian tangent shape model
multi-stream asynchrony
linear discrimination analysis
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于BTSM和DBN模型的唇读和视素切分研究
吕国云
赵荣椿
蒋冬梅
蒋晓悦
侯云舒
Sahli H
《计算机工程与应用》
CSCD
北大核心
2007
0
下载PDF
职称材料
2
一种新的二维图像特征提取算法
闫煜
金峰
鲁华祥
《微计算机信息》
北大核心
2006
3
下载PDF
职称材料
3
基于BTSM-LDA的口形动态特征及多流异步音视频语音识别
吕国云
赵荣椿
蒋冬梅
H.Sahli
樊养余
W.Verhelst
《数据采集与处理》
CSCD
北大核心
2008
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部