基于LSTM RNNLM的N-best重打分算法被引量：4

N-Best Rescoring Algorithm Based on Long Short-Term Memory Recurrent Neural Network Language Model

下载PDF

导出

摘要首先采用长短时记忆单元替换递归神经网络隐含层中的神经元,避免梯度消失问题。其次将LSTM RNNLM应用在二次解码过程中。在语音解码时,递归神经网络语言模型使Lattice的扩展次数过多,导致搜索空间太大而影响搜索速度,因此Lattice不适宜引入高级语言模型进行重打分。相比之下,N-best的线性结构更适合引入包含长距离信息的模型,因此采用N-best进行LSTM RNNLM重打分,并对识别结果进行重排序。最后在Penn Treebank语料库和WSJ语料库上分别进行困惑度和连续语音识别实验。实验表明该方法有效降低语言模型的困惑度,提高连续语音识别系统的性能。 Firstly, the neurons in the hidden layer of the recurrent neural network are replaced by longshort-term memory units to avoid gradient vanishing. Secondly, we use LSTM RNNLM in strategy. In decoding stage, Lattice is not suitable for rescoring of recurrent neural network languagemodel which expands the lattice too many times, leading to searching efficiency reduction witli a blo-wing up search space. On the contrary, N-best algoritiim witii linear structure is more fitting for mod-els using long distance information. Therefore, the paper adopts N-best algorithm for LSTM RNNLMrescoring. The experimental results show that tiie proposed metiiod can not only effectively guage model perjDlexity, but also improve the performance of continuous speech recognition.

作者李华屈丹范正光张文林

机构地区信息工程大学

出处《信息工程大学学报》 2017年第4期419-425,共7页 Journal of Information Engineering University

基金国家自然科学基金资助项目(61175017 61403415)

关键词 LSTM 递归神经网络语言模型 N-best重打分 LSTM recurrent neural network language model N-best rescoring

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1SI Yujing,LI Ta,PAN Jielin,YAN Yonghong.A Prefix Tree Based n-best List Re-scoring Strategy for Recurrent Neural Network Language Model[J].Chinese Journal of Electronics,2014,23(1):70-74. 被引量：3

二级参考文献17

1R. Rosenfeld, "Two decades of statistical language modeling: Where do we go from here?", Proceedings of the IEEE, Vol.88, No.8. D.1270--1278, 2000.
2I. Oparin, M. Sundermeyer, H. Ney, J.L. Gauvain, "Perfor- mance analysis of neural networks in combination with n-gram language models", Proceedings of ICASSPI2, Kyoto, Japan, pp.5005-5008, 2012.
3;F. Mikolov, M. Karafiat, L. Burget, J. Cernocky, S. Khudanpur, "Recurrent neural network based language model", Eleventh Annual Conference of the International Speech Communication Association, Chiba, Japan, pp.1045-1048, 2010.
4T. Mikolov, A. Deoras, S. Kombrink, L. Burget, J. Cernocky, "Empirical evaluation and combination of advanced language modeling techniques", Twelfth Annual Conference of the Iner- national Speech Communication Association, Florence, Italy, pp.605-608, 2011.
5S. Kombrink, T. Mikolov, M. Karafiat, L. Burget, "Recurrent neural network based language modeling in meeting recogni- tion", Twelfth Annual Conference of the International Speech Communication Association, Florence, Italy, pp.2877-2880, 2011.
6H. Schvcenk, "Continuous space language models", Computer Speech Language, Vol.21, No.3, pp.492-518, 2007.
7T. Mikolov, S. Kombrink, L. Burget, J. Cernocky, S. Khudan- pur, "Extensions of recurrent neural network language model", 2011 IEEE International Conference on. Acoustics, Speech and Signal Processing (ICASSP), IEEE, Prague, Czech Republic, pp.5528-5531, 2011.
8T. Mikolov, A. Deoras, D. Povey, L. Burget, "Strategies for training large scale neural network language models", ASRU 2011, Hawaii, USA, pp.196-201, 2011.
9K. Chen, W. Bao, H. Chi, "Speed up training of the recur- rent neural network based on constrained optimization tech- niques", Journal of Computer Science and Technology, Vol. 11, No.6, pp.581-588, 1996.
10G. Lecorve, P. Motlicek, "Conversion of recurrent neural net- work language models to weighted finite state transducers for automatic speech recognition", Eleventh Annual Conference of the International Speech Communication Association, Port- land, Oregon, USA, pp.5032-5035, 2012.

共引文献2

1于昕妍,沈艳霞,陈杰,纪志成.考虑概率区间的微电网短期负荷多目标预测方法[J].电子学报,2017,45(4):930-936. 被引量：5
2ZHANG Naimin,ZHANG Ting.Recurrent Neural Networks for Computing the Moore-Penrose Inverse with Momentum Learning[J].Chinese Journal of Electronics,2020,29(6):1039-1045. 被引量：1

同被引文献12

1翟永杰,王静娴,周黎辉.基于模糊支持向量机的电力系统中期负荷预测[J].华北电力大学学报（自然科学版）,2008,35(2):70-73. 被引量：12
2张金艳,郭鹏江.确定性时间序列模型及ARIMA模型的应用[J].西安邮电学院学报,2009,14(3):128-132. 被引量：8
3李钊年,陶凤玲,史旺旺,姜楠,李积花,倪三川.基于谱分析与LS-SVM的中期电力负荷预测[J].电力系统保护与控制,2011,39(9):88-90. 被引量：6
4段其昌,饶志波,黄大伟,林森.基于EMD和PSO-SVM的电力系统中期负荷预测[J].控制工程,2012,19(5):913-917. 被引量：11
5罗武骏,黄程韦,查诚,赵力.越南语语音情感特征分析与识别[J].信号处理,2013,29(10):1423-1432. 被引量：4
6刘斌,陶建华.联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法[J].信号处理,2017,33(3):268-272. 被引量：11
7梁玉龙,屈丹,李真,张文林.基于卷积神经网络的维吾尔语语音识别[J].信息工程大学学报,2017,18(1):44-50. 被引量：11
8向德军,王彬,郭文鑫,初祥祥,余志文.基于人工神经网络的电力系统精细化安全运行规则[J].电力系统保护与控制,2017,45(18):32-37. 被引量：18
9孙新程,孔建寿,刘钊.基于核主成分分析与改进神经网络的电力负荷中期预测模型[J].南京理工大学学报,2018,42(3):259-265. 被引量：28
10赵小强,宋昭漾.Adam优化的CNN超分辨率重建[J].计算机科学与探索,2019,13(5):858-865. 被引量：29

引证文献4

1刘江永,刘文翰,易灵芝.多时序协同中期负荷预测模型[J].电力系统及其自动化学报,2020,32(2):48-53. 被引量：13
2刘诚然,宋潇潇,屈丹,杨绪魁.维纳后置滤波DNN前端增强的远场语音识别[J].信息工程大学学报,2019,20(4):405-409.
3李响,张磊,刘媛媛.融合FAQ的任务型对话系统设计[J].信息工程大学学报,2019,20(4):473-479.
4刘佳文,屈丹,杨绪魁,张昊,唐君.基于Transformer的越南语连续语音识别[J].信息工程大学学报,2020,21(2):129-133. 被引量：2

二级引证文献15

1庞铄,罗政纯,王忠民,常天英,代广斌,于淼,吴崇坚,崔洪亮.用于海洋水位监测的干涉式光纤水位传感系统[J].光子学报,2019,48(9):67-74. 被引量：9
2易灵芝,张宗光,范朝冬,罗显光,李旺,刘文翰.基于EEMD-GSGRU的锂电池寿命预测[J].储能科学与技术,2020,9(5):1566-1573. 被引量：7
3田增垚,彭飞,孟庆东,王汉军,田长翼,陈志奎.基于降噪循环神经网络的风电功率预测[J].微电子学与计算机,2021,38(3):27-32. 被引量：1
4陶娟,邹红波,周冬.基于提升人工神经网络的短期负荷预测模型[J].电工材料,2021(2):53-56.
5曹东伟,李邵梅,陈鸿昶,张建朋,张桥.融合情感特征的虚假评论检测方法[J].信息工程大学学报,2021,22(3):326-330. 被引量：3
6林强,刘林鹏,邱剑洪,吕懿,李思凡,叶汉芳.基于误差补偿的电力负荷中长期预测模型[J].广东电力,2021,34(11):35-41. 被引量：2
7于军琪,聂己开,赵安军,侯雪妍.基于特征挖掘的ARIMA-GRU短期电力负荷预测[J].电力系统及其自动化学报,2022,34(3):91-99. 被引量：19
8殷林飞,刘东端.基于双三层深度神经网络的短期负荷预测[J].广西电力,2022,45(1):20-25. 被引量：3
9杨俊义,高骞,洪宇,朱殿超.基于改进粒子群算法的电力系统短期负荷预测[J].吉林大学学报（信息科学版）,2022,40(3):394-399.
10李晶晶,张永敏,田桂林,崔胜胜,严洁.基于LSTM神经网络的数据驱动空间负荷预测方法[J].电子设计工程,2022,30(22):154-157. 被引量：7

1《中国卫生经济》在线投稿、查稿说明[J].中国卫生经济,2017,36(9):8-8.
2Wayne Xin ZHAO,Chen LIU,Ji-Rong WEN,Xiaoming LI.Ranking and tagging bursty features in text streams with context language models[J].Frontiers of Computer Science,2017,11(5):852-862.
3葛瑞,王朝晖,徐鑫,季怡,刘纯平,龚声蓉.基于多层卷积神经网络特征和双向长短时记忆单元的行为识别（英文）[J].控制理论与应用,2017,34(6):790-796. 被引量：12
4曹晋其,蒋兴浩,孙锬锋.基于训练图CNN特征的视频人体动作识别算法[J].计算机工程,2017,43(11):234-238. 被引量：21
5麻杰,杜欣慧.配电网供电实时补偿稳定性优化控制研究[J].计算机仿真,2017,34(11):84-89. 被引量：1
6孙林檀,唐博麟,田举,李子乾.基于语音识别的智能故障报修系统的研究与应用[J].电子科学技术,2017,4(5):73-76.
7朱虎明,罗政,缑水平,田小林,焦李成,张小华.Android平台上基于卷积神经网络的手写数字识别实验[J].计算机教育,2017(11):159-162. 被引量：1
8Mo-meng LIU,Juliane KRAMER,Yu-pu HU,Johannes BUCHMANN.Quantum security analysis of a lattice-based oblivious transfer protocol[J].Frontiers of Information Technology & Electronic Engineering,2017,18(9):1348-1369. 被引量：2
9林韵.图式理论对小学英语阅读教学的启示[J].课程教育研究（学法教法研究）,2017,0(36):12-13.
10朱青田.基于设备开关报警控制器的组合逻辑电路设计与应用[J].信息记录材料,2017,18(11):73-74.

信息工程大学学报

2017年第4期

浏览历史

内容加载中请稍等...

基于LSTM RNNLM的N-best重打分算法被引量：4

参考文献1

二级参考文献17

共引文献2

同被引文献12

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于LSTM RNNLM的N-best重打分算法 被引量：4

参考文献1

二级参考文献17

共引文献2

同被引文献12

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于LSTM RNNLM的N-best重打分算法被引量：4