期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于DNN-HMM和RNN的维吾尔语语音识别
被引量:
4
1
作者
阿地力江·阿布都尼亚孜
米吉提·阿不里米提
艾斯卡尔·艾木都拉
《现代电子技术》
2021年第17期90-94,共5页
基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超...
基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超越。文中采用Kaldi开源语音识别平台,结合RNN语言模型和DNN模型的三种损失函数,即最大互信息量(MMI)、最小贝叶斯风险(sMBR)和最小因素错误率(MPE),在维吾尔语语料库(THUYG-20公开语料库)测试数据上分别取得了16.73%,16.55%和15.95%的词错误率。相比高斯混合模型的词错误率分别降低了2.88%,3.06%和3.66%。深层神经网络在资源匮乏的少数民族语言以及多语言信息处理上有更强的能力。
展开更多
关键词
维吾尔语语音识别
rnn语言模型
DNN-HMM
声学
模型
判别式训练
损失函数
Kaldi
下载PDF
职称材料
自由表述口语语音评测后验概率估计改进方法
被引量:
4
2
作者
许苏魁
戴礼荣
+2 位作者
魏思
刘庆峰
高前勇
《中文信息学报》
CSCD
北大核心
2017年第2期212-219,共8页
该文研究了两种用于改善深度神经网络声学建模框架下自由表述口语语音评测任务后验概率估计的方法:1)使用RNN语言模型对一遍解码N-best候选做语言模型得分重估计来获得更准确的识别结果以重新估计后验概率;2)借鉴多语种神经网络训练框架...
该文研究了两种用于改善深度神经网络声学建模框架下自由表述口语语音评测任务后验概率估计的方法:1)使用RNN语言模型对一遍解码N-best候选做语言模型得分重估计来获得更准确的识别结果以重新估计后验概率;2)借鉴多语种神经网络训练框架,提出将方言数据聚类状态加入解码神经网络输出节点,在后验概率估计中引入方言似然度得分以评估方言程度的新方法。实验表明,这两种方法估计出的后验概率与人工分相关度分别绝对提升了3.5%和1.0%,两种方法融合后相关度绝对提升4.9%;对于一个真实的评测任务,结合该文改进的后验概率评分特征,总体评分相关度绝对提升2.2%。
展开更多
关键词
自由表述口语
语音评测
后验概率
深度神经网络
rnn语言模型
下载PDF
职称材料
题名
基于DNN-HMM和RNN的维吾尔语语音识别
被引量:
4
1
作者
阿地力江·阿布都尼亚孜
米吉提·阿不里米提
艾斯卡尔·艾木都拉
机构
新疆大学信息科学与工程学院
出处
《现代电子技术》
2021年第17期90-94,共5页
基金
国家重点研发计划项目(2017YFC0820602)。
文摘
基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力。随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超越。文中采用Kaldi开源语音识别平台,结合RNN语言模型和DNN模型的三种损失函数,即最大互信息量(MMI)、最小贝叶斯风险(sMBR)和最小因素错误率(MPE),在维吾尔语语料库(THUYG-20公开语料库)测试数据上分别取得了16.73%,16.55%和15.95%的词错误率。相比高斯混合模型的词错误率分别降低了2.88%,3.06%和3.66%。深层神经网络在资源匮乏的少数民族语言以及多语言信息处理上有更强的能力。
关键词
维吾尔语语音识别
rnn语言模型
DNN-HMM
声学
模型
判别式训练
损失函数
Kaldi
Keywords
Uygur speech recognition
rnn
language model
DNN-HMM
acoustic model
discriminative training
loss function
Kaldi
分类号
TN911.7-34 [电子电信—通信与信息系统]
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
自由表述口语语音评测后验概率估计改进方法
被引量:
4
2
作者
许苏魁
戴礼荣
魏思
刘庆峰
高前勇
机构
中国科学技术大学语音及语言信息处理国家工程实验室
科大讯飞信息股份有限公司
出处
《中文信息学报》
CSCD
北大核心
2017年第2期212-219,共8页
基金
国家自然科学基金(61273264)
文摘
该文研究了两种用于改善深度神经网络声学建模框架下自由表述口语语音评测任务后验概率估计的方法:1)使用RNN语言模型对一遍解码N-best候选做语言模型得分重估计来获得更准确的识别结果以重新估计后验概率;2)借鉴多语种神经网络训练框架,提出将方言数据聚类状态加入解码神经网络输出节点,在后验概率估计中引入方言似然度得分以评估方言程度的新方法。实验表明,这两种方法估计出的后验概率与人工分相关度分别绝对提升了3.5%和1.0%,两种方法融合后相关度绝对提升4.9%;对于一个真实的评测任务,结合该文改进的后验概率评分特征,总体评分相关度绝对提升2.2%。
关键词
自由表述口语
语音评测
后验概率
深度神经网络
rnn语言模型
Keywords
freely spoken speech
pronunciation quality evaluation
posterior probability
deep neural network
rnn
language model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于DNN-HMM和RNN的维吾尔语语音识别
阿地力江·阿布都尼亚孜
米吉提·阿不里米提
艾斯卡尔·艾木都拉
《现代电子技术》
2021
4
下载PDF
职称材料
2
自由表述口语语音评测后验概率估计改进方法
许苏魁
戴礼荣
魏思
刘庆峰
高前勇
《中文信息学报》
CSCD
北大核心
2017
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部