-
题名基于深度神经网络的四川方言识别
被引量:4
- 1
-
-
作者
石佳影
黄威
-
机构
四川大学软件学院
-
出处
《现代计算机》
2016年第9期3-6,10,共5页
-
文摘
针对四川方言的发音以及音调的特点,提出一种新的基于深度神经网络(Deep Neural Network,DNN)的四川方言语音识别方法。该研究基于Kaldi平台提供的深度神经网络模型,利用梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficient,MFCC)对四川方言进行特征提取并构建四川话发音字典对四川方言进行识别研究,实现从四川方言对普通话的映射识别,并构建基于语音与普通话标签的四川方言语料库。实验结果表明,采用该方法进行四川方言识别,出错率随着训练集数据的增多有明显下降趋势,并保持在较低状态。
-
关键词
四川方言识别
深度神经网络
语音识别
-
Keywords
Sichuan Dialect Speech Recognition
Deep Neural Network
Speech Recognition
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于深度神经网络的语音识别研究
被引量:4
- 2
-
-
作者
黄威
石佳影
-
机构
四川大学软件学院
-
出处
《现代计算机》
2016年第5期20-25,共6页
-
文摘
目前,普通话与汉语方言语音识别主要采用的是三音素的隐马尔可夫模型,其语音识别率并不是很高。以Kaldi为测试平台,通过训练得到一个含有6个隐层的深度神经网络模型,利用该模型对普通话与四川话方言分别进行语音识别。实验结果表明,深度神经网络在普通话语料库中的语音识别性能要优于三音素的隐马尔可夫模型,词错率降低11.2%。而在四川话方言语料库训练集上的识别率与三音素的隐马尔可夫模型相当。
-
关键词
深度神经网络
语音识别
隐马尔可夫
-
Keywords
Deep Neural Network
Speech Recognition
Hidden Markov Model
-
分类号
TN912.34
[电子电信—通信与信息系统]
TP183
[自动化与计算机技术—控制理论与控制工程]
-