基于循环神经网络的汉语语言模型并行优化算法被引量：7

Parallel Optimization of Chinese Language Model Based on Recurrent Neural Network

下载PDF

导出

摘要计算复杂度高导致循环神经网络语言模型训练效率很低,是影响实际应用的一个瓶颈.针对这个问题,提出一种基于批处理(mini-batch)的并行优化训练算法.该算法利用GPU的强大计算能力来提高网络训练时的矩阵及向量运算速度,优化后的网络能同时并行处理多个数据流即训练多个句子样本,加速训练过程.实验表明,优化算法有效提升了RNN语言模型训练速率,且模型性能下降极少,并在实际汉语语音识别系统中得到了验证. High computational complexity leads to low efficiency in training a recurrent neural network （RNN） language model. This becomes a major bottleneck in practical ap- plications. To deal with this problem, this paper proposes a parallel optimization algorithm to speed up matrix and vector operations by taking the advantage of CPU＇s computational capability. The optimized network can handle multiple data streams in parallel and train several sentence samples simultaneously so that the training process is significantly acceler- ated. Experimental results show that the model training of RNN is speeded up effectively without noticeable sacrifice of model performance. The algorithm is verified in an actual Chinese speech recognition system.

作者王龙杨俊安陈雷林伟刘辉

机构地区电子工程学院安徽省电子制约技术重点实验室安徽科大讯飞公司

出处《应用科学学报》 CAS CSCD 北大核心 2015年第3期253-261,共9页 Journal of Applied Sciences

基金国家自然科学基金(No.60872113) 安徽省自然科学基金(No.1208085MF94)资助

关键词语音识别循环神经网络语言模型并行优化 speech recognition, recurrent neural network, language model, parallel opti-mization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1倪崇嘉,刘文举,徐波.汉语大词汇量连续语音识别系统研究进展[J].中文信息学报,2009,23(1):112-123. 被引量：39
2Xu W, RUDNICKY A. Can artificial neural networks learn models? [C]// International Confer- ence on Statistical Language Processing, 2000.
3MIKOLOV T, KARAFfAT M, BURGET L, CERNOCKr J, KHUDANPUR S. Recurrent neural network based language model [C]// Proceedings of Interspeech, 2010: 1045-1048.
4MIKOLOV W. Statistical language models based on neural networks [D]. Brno University of Tech- nology, Czech Republic, 2012.
5MIKOLOV T, DEORAS A, POVERY D. Strategies for training large scale neural network language models [C]// Automatic Speech Recognition and Understanding, 2011: 196-201.
6KOMBRINK S, MIKOLOV T, KARAFAT M, BURGET L. Recurrent neural network based language modeling in meeting recognition [C]// Proceedings of Interspeech, 2011: 2877-2880.
7YAO K S, ZWEIG G, HWANG M Y, SHI Y Y, Yu D. Recurrent neural network for language understanding [C]//Proceedings of Interspeech, 2013.
8MNIH V. Cudamat: a CUDA-based matrix class for python [R]. UTML TR 2009-004, Depart- ment of Computer Science, University of Toronto, November 2009.
9SHALEV-SHWARTZ S, ZHANG T. Accelerated mini-batch stochastic dual coordinate ascent, axXiv, 2013.
10DEKEL O, GILAD-BACHRACH R, SHAMIR 0, XIAO L. Optimal distributed online prediction using mini-batches [J]. The Journal of Machine Learning Research, 2012, 13: 165-202.

二级参考文献80

1钱跃良,林守勋,刘群,刘宏.2005年度863计划中文信息处理与智能人机接口技术评测回顾[J].中文信息学报,2006,20(B03):1-6. 被引量：4
2Zhang, B., S. Matsoukas and R. Schwartz. Discrimina tively trained region dependent teature transforms for speech recognition [C]// Proc. ICASSP, Vol. 1-13, 2006: 313-316.
3Beyerlein, P., et al., Large vocabulary continuous speech recognition of Broadcast News - The Philips/ RWTH approach[J]. Speech Communication, 2002, 37(1-2): 109- 131.
4Hain, T., et al., Automatic transcription of conversational telephone speech [C]// IEEE Transactions on Speech and Audio Processing, 2005, 13(6): 1173-1185.
5Zhang, B. and S. Matsoukas, Minimum phoneme error based heteroscedastic linear discriminant analy sis for speech recognition[C]// Proc. ICASSP, Vol. 1-5, 2005: 1925-1928.
6Hirsimaki, T., et al., Unlimited vocabulary speech recognition with morph language models applied to Finnish[J]. Computer Speech and Language, 2006, 20(4) : 515-541.
7Odell, J.J., The Use of Context in Large Vocabulary Speech Recognition[D]. 1995, University of Cambridge :Cambridge
8Young, S.J., J.J. Odell, and P. C. Woodland. Tree-Based State Tying for High Accuracy Modelling [C]// Proceedings ARPA Workshop on Human Language Technology. 1994.
9Xu, B., et al., Integrating tone information in continuous Mandarin recognition[C]// Proc. ISSPIS, 1999.
10Seneff, C. W. a.S. A study of tones and tempo in continuous mandarin digit strings and their application in telephone quality speech recognition[C]// Proc. ICSLP. 1998.

共引文献38

1张威.口译语料库的开发与建设:理论与实践的若干问题[J].中国翻译,2009,30(3):54-59. 被引量：48
2孟莎,刘加.汉语语音检索的集外词问题与两阶段检索方法[J].中文信息学报,2009,23(6):91-97. 被引量：8
3张田,李嵩,高畅,邱荣发,李海峰.基于音频的数字媒体内容分析及其可视化[J].燕山大学学报,2010,34(2):100-105.
4郭瑞.基于ASR的呼叫中心系统设计与可靠性研究[J].环境技术,2010,28(2):34-38.
5黄子君,张亮.语音识别技术及应用综述[J].江西教育学院学报,2010,31(3):44-46. 被引量：10
6陈焱.基于直觉模糊推理方法的相关方向研究热点等级判断研究[J].情报杂志,2010,29(10):54-58.
7李伟,吴及,吕萍.基于查询扩展的中文语音高效检索[J].模式识别与人工智能,2011,24(4):561-566. 被引量：1
8李冠宇.基于HTK的藏语拉萨话大词表连续语音识别的研究与实现[J].西北民族大学学报（自然科学版）,2011,32(3):19-23. 被引量：3
9李冠宇.隐马尔可夫模型及其在语音识别中的应用[J].科技风,2011(23):89-90.
10严新华.语音控制计算器的设计与实现[J].商洛学院学报,2013,27(2):19-21. 被引量：1

同被引文献61

1王娟,慈林林,姚康泽.特征选择方法综述[J].计算机工程与科学,2005,27(12):68-71. 被引量：64
2王晓峰,黄德双,杜吉祥,张国军.叶片图像特征提取与识别技术的研究[J].计算机工程与应用,2006,42(3):190-193. 被引量：114
3曹勇刚,曹羽中,金茂忠,刘超.面向信息检索的自适应中文分词系统[J].软件学报,2006,17(3):356-363. 被引量：48
4李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
5王灿辉,张敏,马少平.自然语言处理在信息检索中的应用综述[J].中文信息学报,2007,21(2):35-45. 被引量：50
6牟永敏,李美贵,梁琦.入侵检测系统中模式匹配算法的研究[J].电子学报,2006,34(B12):2488-2490. 被引量：20
7陈友,程学旗,李洋,戴磊.基于特征选择的轻量级入侵检测系统[J].软件学报,2007,18(7):1639-1651. 被引量：78
8孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1070
9肖宇,于剑.基于近邻传播算法的半监督聚类[J].软件学报,2008,19(11):2803-2813. 被引量：165
10陈振华,余永权,张瑞.模糊模式识别的几种基本模型研究[J].计算机技术与发展,2010,20(9):32-35. 被引量：27

引证文献7

1王敏,曾浩.循环神经网络语言模型定点化优化算法研究[J].软件导刊,2017,16(2):63-66. 被引量：1
2刘畅,张一珂,张鹏远,颜永红.基于改进主题分布特征的神经网络语言模型[J].电子与信息学报,2018,40(1):219-225. 被引量：10
3李梦洁,董峦.基于PyTorch的机器翻译算法的实现[J].计算机技术与发展,2018,28(10):160-163. 被引量：15
4王乾铭,李吟.基于深度学习的个性化聊天机器人研究[J].计算机技术与发展,2020,30(4):79-84. 被引量：11
5窦征立,王亚刚.基于Elman神经网络的联合循环机组燃烧室温度模型建模[J].电子科技,2021,34(3):60-64. 被引量：5
6穆凯代姆罕·伊敏江,艾斯卡尔·艾木都拉,米吉提·阿不里米提.基于CNN-HMM和RNN的维吾尔语语音识别[J].现代电子技术,2021,44(11):172-176. 被引量：3
7产院东,郭乔进,梁中岩,胡杰.基于深度学习的入侵检测综述[J].信息化研究,2021,47(4):1-7. 被引量：2

二级引证文献47

1韩庆生.TensorFlow与Pytorch环境的搭建[J].计算机产品与流通,2020,0(5):124-124. 被引量：3
2石国庆,刘守仁,杨永林,倪健宏,皮文辉,王志杰.毛质优秀的美利奴“U”系羊新类群[J].中国草食动物,2000,2(1):24-25.
3徐萍,吴超,胡峰俊,吴凡,林建伟,刘静静.基于迁移学习的个性化循环神经网络语言模型[J].南京理工大学学报,2018,42(4):401-408. 被引量：7
4汤鲲,陈思思.基于GRU+LDA的群聊主题挖掘[J].计算机与现代化,2018(12):72-76. 被引量：1
5郑晓琼,汪晓,江海升,樊培培,张超.基于RNN和WFST译码的自动语音识别研究[J].信息技术,2019,43(6):115-120. 被引量：3
6钟琪,冯亚琴,王蔚.跨语言语料库的语音情感识别对比研究[J].南京大学学报（自然科学版）,2019,55(5):765-773. 被引量：3
7杨志杰,张梅,李冠龙,黄昌达.基于长短时记忆元的语音智能识别系统设计[J].电子设计工程,2020,28(1):55-58. 被引量：4
8林克全,吴石松.NLP中序列到序列深度学习模型设计[J].自动化与仪器仪表,2020(6):95-97. 被引量：2
9李帆,程云章,边俊杰,耿晓斌.基于PPG信号的LSTM网络同步动脉血压预测[J].软件导刊,2020,19(8):44-48. 被引量：10
10张晶晶,刘烨.基于在线评论和改进LDA模型的新闻传播推荐技术研究[J].现代电子技术,2020,43(19):115-117. 被引量：2

1王玉芬,贾燕茹,郭晓娟.遗传算法的改进及在自动组卷系统中的应用[J].信阳师范学院学报（自然科学版）,2009,22(1):130-133. 被引量：5
2曲卫民,张俊林,孙乐.基于主题的汉语语言模型的研究[J].计算机研究与发展,2003,40(9):1368-1374. 被引量：3
3吴谨,王绍纯.神经网络在汉语语音识别中的应用[J].北京科技大学学报,1998,20(4):372-375.
4陈善广,姜淇远,俞铁城.人的因素对汉语语音识别系统性能的影响[J].航天医学与医学工程,1996,9(4):235-240.
5徐士林,樊懋.基于知识的汉语语音识别系统[J].模式识别与人工智能,1993,6(1):49-54. 被引量：1
6肖镜辉,王晓龙,刘秉权.一种基于相似度的汉语语言模型平滑技术及其在音字转换中的应用[J].高技术通讯,2006,16(2):127-132.
7王龙,杨俊安,刘辉,陈雷,林伟.基于RNN汉语语言模型自适应算法研究[J].火力与指挥控制,2016,41(5):31-34. 被引量：4
8徐雪松.基于克隆选择的车间调度算法研究[J].计算机工程与应用,2005,41(25):11-12. 被引量：1
9杨琳,张建平,颜永红.特定领域的汉语语言模型平滑算法比较研究[J].计算机工程与应用,2006,42(32):14-16. 被引量：5
10罗印升,李人厚,张维玺.基于免疫机理的多峰值函数并行优化算法[J].系统仿真学报,2005,17(2):319-322. 被引量：13

应用科学学报

2015年第3期

浏览历史

内容加载中请稍等...

基于循环神经网络的汉语语言模型并行优化算法被引量：7

参考文献11

二级参考文献80

共引文献38

同被引文献61

引证文献7

二级引证文献47

相关作者

相关机构

相关主题

浏览历史

基于循环神经网络的汉语语言模型并行优化算法 被引量：7

参考文献11

二级参考文献80

共引文献38

同被引文献61

引证文献7

二级引证文献47

相关作者

相关机构

相关主题

浏览历史

基于循环神经网络的汉语语言模型并行优化算法被引量：7