基于双向改进门控循环单元维吾尔语语音识别被引量：2

Uyghur Speech Recognition Based on Bidirectional Improved Gated Recurrent Unit

下载PDF

导出

摘要为了能够提升语音识别的准确率,并有效降低训练模型的复杂度,提出了一种双向改进门控循环单元的声学模型语音识别方法。模型上移除重置门,在状态更新过程中采用ReLU激活函数并与前馈连接采用的BN算法有效结合,改进的模型可以降低模型的计算复杂度,加快模型收敛;采用双向的结构不仅可以有效帮助模型捕捉到过去和未来的语义时序信息,而且可以有效提升识别准确率。在THUYG-20维吾尔语数据集上实验结果表明,与基线传统深度神经网络进行对比,基于双向改进门控循环单元网络词错误率下降2.34%;与标准双向长短期记忆网络(LSTM)比较每个迭代周期平均训练时间减少13.4%。 In order to improve the accuracy of speech recognition and effectively reduce the complexity of training model,further in-depth research is needed in the model optimization.This paper presents an acoustic model based on bidirectional improved gated recurrent unit.The improved model can reduce the complexity of the model and accelerate the rapid convergence of the model.The bidirectional structure can not only effectively help the model capture the past and future time series information,but also effectively improve the recognition accuracy.The experimental results on thuyg-20 Uyghur corpus show that compared with the baseline traditional depth neural network,the absolute word error rate is reduced by 2.34%using bidirectional improved gated recurrent unit;the model can also reduces the per-epoch training time by 13.4%over standardb idirectional long short-term memory(LSTM)model.

作者李连振米吉提·阿不里米提郑方艾斯卡尔·艾木都拉 LI Lian-zhen;Mijit ABLIMIT;ZHENG Fang;Askar HAMDULLA(College of Information Science and Engineering,Xinjiang University,Urumqi Xinjiang 830046,China)

机构地区新疆大学信息科学与工程学院

出处《计算机仿真》北大核心 2022年第11期275-279,共5页 Computer Simulation

基金国家重点研发计划(2017YFC0820602)。

关键词维吾尔语语音识别声学模型门控循环单元 Uyghu Speech recognition Acoustic model Gated recurrent unit

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1其米克.巴特西,黄浩,王羡慧.基于深度神经网络的维吾尔语语音识别[J].计算机工程与设计,2015,36(8):2239-2244. 被引量：13
2麦麦提艾力.吐尔逊,戴礼荣.深度神经网络在维吾尔语大词汇量连续语音识别中的应用[J].数据采集与处理,2015,30(2):365-371. 被引量：12
3梁玉龙,屈丹,李真,张文林.基于卷积神经网络的维吾尔语语音识别[J].信息工程大学学报,2017,18(1):44-50. 被引量：11
4艾斯卡尔·肉孜,殷实,张之勇,王东,艾斯卡尔·艾木都拉,郑方.THUYG-20：免费的维吾尔语语音数据库[J].清华大学学报（自然科学版）,2017,57(2):182-187. 被引量：13
5Guo-Bing Zhou,Jianxin Wu,Chen-Lin Zhang,Zhi-Hua Zhou.Minimal Gated Unit for Recurrent Neural Networks[J].International Journal of Automation and computing,2016,13(3):226-234. 被引量：38

二级参考文献53

1蔡琴,吾守尔.斯拉木.基于HTK的维吾尔语连续数字语音识别[J].现代计算机,2007,13(4):14-16. 被引量：7
2那斯尔江·吐尔逊,吾守尔·斯拉木.基于HMM的维吾尔语连续语音识别系统[D].乌鲁木齐:新疆大学,2008:272-278.
3Andrew Ng, Jiquan Ngiam, Chuan Yu Foo, et al. Unsaper- vised feature learning and deep learning [R]. deeplearning. stanford, edu/wiki/inde php, 2013.
4YU D Deng L. Deep learning and its relevance to signal and information processing [J]. IEEE Signal Processing Magazine, 2011, 28 (1): 145 154.
5George Dahl, Yu D, Deng L, et al. Context-dependent Pre- trained deep neural networks to large vocabulary speech recogni- tion [J]. IEEE Transaction on Audio, Speech and Language Processing, 2012, 20 (1): 34-42.
6Glorot X, Bengio Y. Understanding the difficulty of training deep feed-forward neural networks [J]. JMLP WCP, 2010, 9: 249-256.
7Erhan D, Bengio Y, Courvelle A, et al. Why does unsuper vised pre-training help deep learning [J] Machine Learning Re-search, 2010, 12: 201-208.
8Hinton G. A practical guide to training restricted Boltzmann machines [G]. LNCS 7700: Neural Networks: Tricks of the Trade, 2010.
9Yu D, Deng L. Efficient and effective algorithms for training single-hidden-layer neural network [J]. Pattern Recognition Letters, 2012, 33 (5): 554-558.
10Salakhutdinov R, Hinton G. A better way to pretrain deep Boltzmann machines [ C ] //NIPS Proceedings, 2012.. 2456-2464.

共引文献75

1李零,杨捷,段明明.基于长短时记忆网络的电力故障维修效果情感分析[J].云南大学学报（自然科学版）,2020,42(S02):44-48. 被引量：2
2袁松范.中国进入世贸组织的前景[J].中国医药情报,2000,6(1):34-37. 被引量：3
3高薇,曾健民.基于卷积神经网络算法的图像识别应用研究[J].西安文理学院学报（自然科学版）,2019,22(1):10-14. 被引量：8
4卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：564
5黄威,石佳影.基于深度神经网络的语音识别研究[J].现代计算机,2016,22(5):20-25. 被引量：4
6梁玉龙,屈丹,李真,张文林.基于卷积神经网络的维吾尔语语音识别[J].信息工程大学学报,2017,18(1):44-50. 被引量：11
7刘学杰,赵晖.改进参数控制的可视语音合成方法[J].计算机工程与设计,2017,38(4):989-995.
8黄玉蕾,罗晓霞,刘笃仁.MFSC系数特征局部有限权重共享CNN语音识别[J].控制工程,2017,24(7):1507-1513. 被引量：9
9赵慧琼,姜强,赵蔚.教育大数据深度学习的价值取向、挑战及展望——在技术促进学习的理解视域中[J].现代远距离教育,2018(1):17-25. 被引量：26
10胡文君,傅美君,潘文林.基于Kaldi的普米语语音识别[J].计算机工程,2018,44(1):199-205. 被引量：12

同被引文献17

1王一鸣,陈恳,萨阿卜杜萨拉木·艾海提拉木.基于SDBN和BLSTM注意力融合的端到端视听双模态语音识别[J].电信科学,2019,35(12):79-89. 被引量：3
2俞建强,颜雁,刘葳,孙一鸣.基于改进门控单元神经网络的语音识别声学模型研究[J].长春理工大学学报（自然科学版）,2020,43(1):104-111. 被引量：1
3孙艺聪,田润澜,王晓峰,董会旭,戴普.基于改进CLDNN的辐射源信号识别[J].系统工程与电子技术,2021,43(1):42-47. 被引量：9
4吴雪颖,吴才硕,黄文聪,覃舒琳.基于Viola-Jones框架人脸检测算法的汽车疲劳驾驶检测[J].广西科技大学学报,2021,32(1):49-54. 被引量：4
5刘生.智能语音机器人前端语音处理系统的设计及实现[J].现代计算机,2021,27(3):106-110. 被引量：2
6黄小奇,范晟,陈光文,许卓伟,彭锴,方志丹,王烁.基于Viterbi解码技术的智能语音交互算法研究[J].电子设计工程,2021,29(10):37-41. 被引量：5
7加米拉·吾守尔,吴迪,王路路,古丽尼格尔·阿不都外力,买合木提·买买提,吐尔根·依布拉音.基于多卷积核DPCNN的维吾尔语文本分类联合模型[J].中文信息学报,2021,35(7):63-71. 被引量：7
8张军,符杰林,林基明.基于CLDNN的调制信号识别方法[J].计算机应用与软件,2021,38(10):216-220. 被引量：12
9杜限,田才林.基于Win10的Tensorflow+CUDA深度学习环境搭建及应用实例[J].西部广播电视,2021,42(18):204-209. 被引量：3
10马晗,唐柔冰,张义,张巧灵.语音识别研究综述[J].计算机系统应用,2022,31(1):1-10. 被引量：31

引证文献2

1陈浩,柴鹏鑫,卓嘎.常用藏语词汇语音评价关键技术研究和仿真实现[J].信息与电脑,2023,35(2):177-180.
2张晋宁.基于神经网络的视觉语音识别系统[J].电声技术,2023,47(11):101-104.

1孙玉红,李云,黎淑贞,黎平.血脂异常对非肥胖不孕患者IVF/ICSI妊娠结局的影响[J].生殖医学杂志,2022,31(12):1706-1711.
2齐兵,田晓,王静,王屹山,司金海,汤洁.射频/直流驱动大气压氩气介质阻挡放电的一维仿真研究[J].物理学报,2022,71(24):298-311. 被引量：1

计算机仿真

2022年第11期

浏览历史

内容加载中请稍等...

基于双向改进门控循环单元维吾尔语语音识别被引量：2

参考文献5

二级参考文献53

共引文献75

同被引文献17

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于双向改进门控循环单元维吾尔语语音识别 被引量：2

参考文献5

二级参考文献53

共引文献75

同被引文献17

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于双向改进门控循环单元维吾尔语语音识别被引量：2