期刊文献+

基于CTC-GRU模型的长沙方言识别

Changsha Dialect Recognition Based on CTC -GRU Model
下载PDF
导出
摘要 为了识别大词汇量下连续长沙话方言语音,提出了基于CTC算法的门控线性单元神经网络模型.先通过梅尔倒谱系数提取语音的特征参数,再把提取的特征参数输入门控线性单元神经网络,用CTC算法进行训练优化,得到输入序列整个的预测标签.最后在自建的长沙话方言语料库上,以词错率作为评价指标,对CTC模型、GRU模型和CTC-GRU模型进行对比,结果表明CTC-GRU模型相对于其他2个模型收敛速度更快,结果更精准. In order to recognize continuous speech in Changsha dialect with a large vocabulary,a gated linear element neural network model based on Connectionist Temporal Classification(CTC)algorithm is proposed.Firstly,the characteristic parameters of speech are extracted by Mel-scale Frequency Cepstral Coefficients(MFCC),and then the extracted characteristic parameters are input into gated linear unit neural network.CTC algorithm is used for training and optimization,and the whole prediction label of input sequence is obtained.Finally,the results of the CTC model,the GRU model and the CTC-GRU model are compared on the self-built corpus of Changsha dialect,and the Word Error Rate(WER)is taken as the evaluation index.The results show that the CTC-GRU model can achieve faster convergence and greater accuracy compared with the other two models.
作者 梁小林 沈湘菲 梁曌 邱海琳 LIANG Xiaolin;SHEN Xiangfei;LIANG Zhao;QIU Hailin(School of Mathematics and Statistics Science,Changsha University of Science and Technology,Changsha 410114,China)
出处 《吉首大学学报(自然科学版)》 CAS 2022年第2期45-52,共8页 Journal of Jishou University(Natural Sciences Edition)
基金 国家自然科学基金面上资助项目(61972055) 湖南省教育厅重点项目(17A003,18A145)。
关键词 CTC-GRU模型 梅尔倒谱系数 长沙话方言识别 词错率 CTC-GRU model MFCC Changsha dialect recognition WER
  • 相关文献

参考文献8

二级参考文献35

共引文献27

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部