期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BTSM-LDA的口形动态特征及多流异步音视频语音识别
1
作者
吕国云
赵荣椿
+3 位作者
蒋冬梅
h.sahli
樊养余
W.Ver
h
elst
《数据采集与处理》
CSCD
北大核心
2008年第4期397-403,共7页
引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余。同时采用一种新颖的多流异步动态贝叶...
引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余。同时采用一种新颖的多流异步动态贝叶斯网络(MS—ADBN)模型来实现音视频的连续语音识别,该模型在词节点级别体现了音视频流的同步异步性。识别实验结果表明:采用LDA视觉语音动态特征的系统性能明显优于静态的口形轮廓几何特征,在语音信噪比为0~30dB的测试环境下,融合LDA视觉特征的MS—ADBN模型比多流异步HMM的平均识别率提高4.92%,说明MS—ADBN模型更好地表达了音视频流之间的异步关系。
展开更多
关键词
动态贝叶斯网络
语音识别
贝叶斯切线形状模型
多流异步
线性判别分析
下载PDF
职称材料
基于多流三音素DBN模型的音视频语音识别和音素切分
2
作者
吕国云
蒋冬梅
+3 位作者
樊养余
赵荣椿
h.sahli
W.Vler
h
elst
《电子与信息学报》
EI
CSCD
北大核心
2009年第2期297-301,共5页
为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基...
为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基元是三音素,描述了连续语音中的协同发音现象。实验结果表明:该模型在音视频语音识别和对音频视频流的音素切分方面,以及在确定音视频流的异步关系上,都具备较好的性能。
展开更多
关键词
语音识别
动态贝叶斯网络
音素切分
音视频
下载PDF
职称材料
题名
基于BTSM-LDA的口形动态特征及多流异步音视频语音识别
1
作者
吕国云
赵荣椿
蒋冬梅
h.sahli
樊养余
W.Ver
h
elst
机构
西北工业大学计算机学院
布鲁塞尔自由大学电子与信息处理系
出处
《数据采集与处理》
CSCD
北大核心
2008年第4期397-403,共7页
基金
中国科技部和比利时国际合作([2004]487)资助项目
国家高技术研究发展(八六三)计划(2007AA01I324)资助项目
文摘
引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余。同时采用一种新颖的多流异步动态贝叶斯网络(MS—ADBN)模型来实现音视频的连续语音识别,该模型在词节点级别体现了音视频流的同步异步性。识别实验结果表明:采用LDA视觉语音动态特征的系统性能明显优于静态的口形轮廓几何特征,在语音信噪比为0~30dB的测试环境下,融合LDA视觉特征的MS—ADBN模型比多流异步HMM的平均识别率提高4.92%,说明MS—ADBN模型更好地表达了音视频流之间的异步关系。
关键词
动态贝叶斯网络
语音识别
贝叶斯切线形状模型
多流异步
线性判别分析
Keywords
dynamic Bayesian networks
speech recognition
Bayesian tangent shape model
multi-stream asynchrony
linear discrimination analysis
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多流三音素DBN模型的音视频语音识别和音素切分
2
作者
吕国云
蒋冬梅
樊养余
赵荣椿
h.sahli
W.Vler
h
elst
机构
西北工业大学
布鲁塞尔自由大学电子与信息处理系
出处
《电子与信息学报》
EI
CSCD
北大核心
2009年第2期297-301,共5页
基金
中国博士后科学基金和中国科技部资助课题
比利时弗拉芒大区科技合作项目([2004]487)资助课题
文摘
为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基元是三音素,描述了连续语音中的协同发音现象。实验结果表明:该模型在音视频语音识别和对音频视频流的音素切分方面,以及在确定音视频流的异步关系上,都具备较好的性能。
关键词
语音识别
动态贝叶斯网络
音素切分
音视频
Keywords
Speech recognition
Dynamic Bayesian network
Phone segmentation
Audio-visual
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于BTSM-LDA的口形动态特征及多流异步音视频语音识别
吕国云
赵荣椿
蒋冬梅
h.sahli
樊养余
W.Ver
h
elst
《数据采集与处理》
CSCD
北大核心
2008
0
下载PDF
职称材料
2
基于多流三音素DBN模型的音视频语音识别和音素切分
吕国云
蒋冬梅
樊养余
赵荣椿
h.sahli
W.Vler
h
elst
《电子与信息学报》
EI
CSCD
北大核心
2009
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部