期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BN-SGMM-HMM模型的低资源语音识别系统
被引量:
8
1
作者
雷杰
赵宏亮
+2 位作者
艾宁智
邹万冰
詹毅
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2021年第12期1627-1632,共6页
针对语音识别系统在低资源条件下,采用传统的高斯混合-隐马尔可夫声学模型(GMM-HMM)会带来识别精度低、参数规模过大等问题,文章提出基于BN-SGMM-HMM的声学模型来解决GMM-HMM模型的不足。该模型在声学特征方面,通过基于瓶颈(bottleneck,...
针对语音识别系统在低资源条件下,采用传统的高斯混合-隐马尔可夫声学模型(GMM-HMM)会带来识别精度低、参数规模过大等问题,文章提出基于BN-SGMM-HMM的声学模型来解决GMM-HMM模型的不足。该模型在声学特征方面,通过基于瓶颈(bottleneck,BN)层的神经网络来进行提取,从而提高声学特征的可区分性与鲁棒性,同时在训练过程中引入Dropout策略来防止过拟合问题;在声学模型方面,采用子空间高斯混合模型(subspace Gaussian mixture model,SGMM),使得模型参数规模显著降低56.5%。同时,这两方面的改进也提升了低资源语音识别系统的识别率,TIMIT语音数据库实验表明,采用该模型,与GMM-HMM模型相比提高8.0%,与BN-GMM-HMM模型相比提高3.6%。这些优点对该模型在低功耗需求的硬件平台上实现部署有极大的帮助。
展开更多
关键词
语音识别
瓶颈特征
子空间高斯混合模型(SGMM)
Dropout策略
低资源
下载PDF
职称材料
题名
基于BN-SGMM-HMM模型的低资源语音识别系统
被引量:
8
1
作者
雷杰
赵宏亮
艾宁智
邹万冰
詹毅
机构
辽宁大学物理学院
吉林大学电子科学与工程学院
中国科学院微电子研究所
出处
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2021年第12期1627-1632,共6页
基金
国家重点研发计划资助项目(2019YFB2204601)。
文摘
针对语音识别系统在低资源条件下,采用传统的高斯混合-隐马尔可夫声学模型(GMM-HMM)会带来识别精度低、参数规模过大等问题,文章提出基于BN-SGMM-HMM的声学模型来解决GMM-HMM模型的不足。该模型在声学特征方面,通过基于瓶颈(bottleneck,BN)层的神经网络来进行提取,从而提高声学特征的可区分性与鲁棒性,同时在训练过程中引入Dropout策略来防止过拟合问题;在声学模型方面,采用子空间高斯混合模型(subspace Gaussian mixture model,SGMM),使得模型参数规模显著降低56.5%。同时,这两方面的改进也提升了低资源语音识别系统的识别率,TIMIT语音数据库实验表明,采用该模型,与GMM-HMM模型相比提高8.0%,与BN-GMM-HMM模型相比提高3.6%。这些优点对该模型在低功耗需求的硬件平台上实现部署有极大的帮助。
关键词
语音识别
瓶颈特征
子空间高斯混合模型(SGMM)
Dropout策略
低资源
Keywords
speech recognition
bottleneck(BN)feature
subspace Gaussian mixture model(SGMM)
Dropout strategy
low resource
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TN912 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于BN-SGMM-HMM模型的低资源语音识别系统
雷杰
赵宏亮
艾宁智
邹万冰
詹毅
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2021
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部