期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于深度神经网络的四川方言识别 被引量:4
1
作者 石佳影 黄威 《现代计算机》 2016年第9期3-6,10,共5页
针对四川方言的发音以及音调的特点,提出一种新的基于深度神经网络(Deep Neural Network,DNN)的四川方言语音识别方法。该研究基于Kaldi平台提供的深度神经网络模型,利用梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficient,MFCC)... 针对四川方言的发音以及音调的特点,提出一种新的基于深度神经网络(Deep Neural Network,DNN)的四川方言语音识别方法。该研究基于Kaldi平台提供的深度神经网络模型,利用梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficient,MFCC)对四川方言进行特征提取并构建四川话发音字典对四川方言进行识别研究,实现从四川方言对普通话的映射识别,并构建基于语音与普通话标签的四川方言语料库。实验结果表明,采用该方法进行四川方言识别,出错率随着训练集数据的增多有明显下降趋势,并保持在较低状态。 展开更多
关键词 四川方言识别 深度神经网络 语音识别
下载PDF
基于深度神经网络的语音识别研究 被引量:4
2
作者 黄威 石佳影 《现代计算机》 2016年第5期20-25,共6页
目前,普通话与汉语方言语音识别主要采用的是三音素的隐马尔可夫模型,其语音识别率并不是很高。以Kaldi为测试平台,通过训练得到一个含有6个隐层的深度神经网络模型,利用该模型对普通话与四川话方言分别进行语音识别。实验结果表明,深... 目前,普通话与汉语方言语音识别主要采用的是三音素的隐马尔可夫模型,其语音识别率并不是很高。以Kaldi为测试平台,通过训练得到一个含有6个隐层的深度神经网络模型,利用该模型对普通话与四川话方言分别进行语音识别。实验结果表明,深度神经网络在普通话语料库中的语音识别性能要优于三音素的隐马尔可夫模型,词错率降低11.2%。而在四川话方言语料库训练集上的识别率与三音素的隐马尔可夫模型相当。 展开更多
关键词 深度神经网络 语音识别 隐马尔可夫
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部