基于RNN-RBM语言模型的语音识别研究被引量：27

A Study of Speech Recognition Based on RNN-RBM Language Model

下载PDF

导出

摘要近年来深度学习兴起,其在语言模型领域有着不错的成效,如受限玻尔兹曼机(restricted Boltzmann machine,RBM)语言模型等.不同于N-gram语言模型,这些根植于神经网络的语言模型可以将词序列映射到连续空间来评估下一词出现的概率,以解决数据稀疏的问题.此外,也有学者使用递归神经网络来建构语言模型,期望由递归的方式充分利用所有上文信息来预测下一词,进而有效处理长距离语言约束.根据递归受限玻尔兹曼机神经网络(recurrent neural network-restricted Boltzmann machine,RNN-RBM)的基础来捕捉长距离信息;另外,也探讨了根据语言中语句的特性来动态地调整语言模型.实验结果显示,使用RNN-RBM语言模型对于大词汇连续语音识别的效能有相当程度的提升. In the recent years,deep learning is emerging as a new way of multilayer neural networks and back propagation training.Its application in the field of language model,such as restricted Boltzmann machine language model,gets good results.This language model based on neural network can assess the probability of the next word appears according to the word sequence which is mapped to a continuous space.This language model can solve the problem of sparse data.Besides,some scholars are constructing language model making use of recurrent neural network mode in order to make full use of the preceding text to predict the next words.From these models we can sort out the restriction of long-distance dependency in language.This paper attempts to catch the long-distance information based on RNN-RBM.On the other hand,the dynamic adjunction of language model ia analyzed and illustrated according to the language features.The experimental result manifests there are considerable improvement to the efficiency of expanding vocabulary continuing speech recognition using RNN_RBM language model.

作者黎亚雄张坚强潘登胡惮

机构地区湖北科技学院网络管理中心弗吉尼亚理工大学信息技术中心湖北科技学院外国语学院中南财经政法大学外国语学院

出处《计算机研究与发展》 EI CSCD 北大核心 2014年第9期1936-1944,共9页 Journal of Computer Research and Development

关键词语音识别语言模型神经网络递归神经网络-受限玻尔兹曼机关联信息 speech recognition language model neural network recurrent neural network-restricted Boltzmann machine relevance information

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Bottou L. Stochastic gradient learning in neural networks [C] //Proc of Neuro Nimes 91, Nimes: EC2, 1991: 687-699.
2Boulanger-Lewandowski N, Bengio Y, Vincent P. Modeling temporal dependencies in high-dimensional sequences Application to polyphonic music generation and transcription [C] //Proc of the 29th Int Conf on Machine Learning. New York: ACM, 2012:590-598.
3Xu W, Rundieky A. Can artificial neural networks learn language models? [C] //Proc of the 6th Int Conf on Spoken I,anguage Processing. Beijing, China: ISCA, 2000.
4Bengio Y, Simard P, Fraseoni P. Learning long-term dependencies with gradient descent is difficult [C]//Proe of IEEE Trans on Neural Networks. Piseataway, NJ: IEEE, 1994:157-166.
5Mikolov T, Kopecky J, Burger L, et al. Neural network based language models for highly inflective languages [C] // Proc of the 34th IEEE Int Conf on Acoustics, Speech and Signal. Piseataway, NJ: IEEE, 2009:4725-4728.
6Bengio Y, Ducharme R, Vincent P, et al. A neural probabilistic language model [J]. Journal of Machine Learning Research, 2003, 3(2): 1137-1155.
7Bengio Y, Frasconi P, Simard P. The problem of learning long-term dependencies in recurrent networks [C] //Proc of IEEE Int Conf on Neural Networks. Piscataway, NJ: IEEE, 1993: 1183-1188.
8Mikolov T, Kombrink S, Deoras A, el al. RNNLM- Recurrent neural network language modeling toolkit [C] // Proc of IEEE Workshop on Automatic Speech Recognition and Understanding. Piscataway, NJ: IEEE, 2011: 5528- 5531.

同被引文献173

1罗澍忻,麻敏华,蒋林,靳冰洁,林勇,刁旭昊,黎灿兵,杨波.考虑多时间尺度数据的中长期负荷预测方法[J].中国电机工程学报,2020,40(S01):11-19. 被引量：36
2周楠,艾剑良.基于HMM和RNN的无人机语音控制方案与仿真研究[J].系统仿真学报,2020,32(3):464-471. 被引量：12
3宋闯,赵佳佳,王康,梁欣凯.面向智能感知的小样本学习研究综述[J].航空学报,2020(S01):15-28. 被引量：15
4彭惠,王永瑞.C2C电子商务市场整体卖家信用分布研究[J].情报杂志,2012,31(5):122-127. 被引量：21
5熊亚军,廖晓农,李梓铭,张小玲,孙兆彬,赵秀娟,赵普生,马小会,蒲维维.KNN数据挖掘算法在北京地区霾等级预报中的应用[J].气象,2015,41(1):98-104. 被引量：52
6赵珂.时差法超声测距仪的研制[J].国外电子元器件,2005(1):65-67. 被引量：17
7刘晓明,覃胜,刘宗行,江泽佳.语音端点检测的仿真研究[J].系统仿真学报,2005,17(8):1974-1976. 被引量：21
8魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
9钱卫华,姚建刚,龙立波,张凯.基于短期相关性和负荷增长的中长期负荷预测[J].电力系统自动化,2007,31(11):59-64. 被引量：28
10马汉旷.楼宇空调混合控制系统研究[J].山西建筑,2007,33(19):186-187. 被引量：2

引证文献27

1周楠,艾剑良.基于HMM和RNN的无人机语音控制方案与仿真研究[J].系统仿真学报,2020,32(3):464-471. 被引量：12
2苏翎菲,化永朝,董希旺,任章.人与无人机集群多模态智能交互方法[J].航空学报,2022,43(S01):129-142. 被引量：2
3杨文帅.基于麦克风阵列的多说话人语音分离方法[J].武警工程大学学报,2018,34(6):15-19.
4陈蕾,赵霞,贾嫣,魏霖静.关于人的语音声调准确识别仿真[J].计算机仿真,2017,34(3):161-164. 被引量：2
5刘全,翟建伟,钟珊,章宗长,周倩,章鹏.一种基于视觉注意力机制的深度循环Q网络模型[J].计算机学报,2017,40(6):1353-1366. 被引量：20
6刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：446
7过馨露.人工智能技术及其应用探究[J].软件导刊,2018,17(2):35-37. 被引量：4
8李志义,黄子风,许晓绵.基于表示学习的跨模态检索模型与特征抽取研究综述[J].情报学报,2018,37(4):422-435. 被引量：20
9徐萍,吴超,胡峰俊,吴凡,林建伟,刘静静.基于迁移学习的个性化循环神经网络语言模型[J].南京理工大学学报,2018,42(4):401-408. 被引量：6
10梁天新,杨小平,王良,韩镇远.基于强化学习的金融交易系统研究与发展[J].软件学报,2019,30(3):845-864. 被引量：13

二级引证文献669

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：2
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：37
3李冉.基于语义图模型的跨语言网络信息检索方法研究[J].周口师范学院学报,2020(2):100-103. 被引量：3
4韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
5韩鹏飞,陈晓.基于MFCC-IMFCC和GA-SVM的鸟声识别[J].计算机系统应用,2022,31(11):393-399. 被引量：8
6李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：39
7周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：5
8周帆,陈晓蝶,钟婷,吴劲.面向金融科技的深度学习技术综述[J].计算机科学,2022,49(S02):20-36. 被引量：3
9李逊,李俊超,邓林忠,康旭云,欧启捷,劳恒辉.人工智能优化技术在钢筋混凝土结构的应用[J].建筑结构,2023,53(S02):1425-1430. 被引量：1
10王雪鉴,文永明,石晓荣,张宁宁,刘洁玺.多智能体多耦合任务混合式智能决策架构设计[J].航空学报,2023,44(S02):418-425.

1卢先宁,高泽华,高峰.Web日志挖掘中的会话识别技术研究[J].数据通信,2012(4):19-21.
2陆国丽,王小华,王荣波.最大词重降维算法与模拟退火算法相结合的文本聚类方法研究[J].现代图书情报技术,2008(12):43-47. 被引量：2
3桑农,张涛,李斌,吴翔.基于字典学习的背景建模[J].华中科技大学学报（自然科学版）,2013,41(9):28-31. 被引量：2
4程健,陈光昀,龚平华,朱小强.非线性多维时间序列模式分类的新方法[J].计算机工程与应用,2011,47(32):128-131. 被引量：2
5江铭虎,朱小燕,袁保宗.一种适应域的汉语N-gram语言模型平滑算法[J].清华大学学报（自然科学版）,1999,39(9):99-102. 被引量：9
6孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：602
7高妮,高岭,贺毅岳.面向入侵检测系统的Deep Belief Nets模型[J].系统工程与电子技术,2016,38(9):2201-2207. 被引量：23
8王敏,曾浩.循环神经网络语言模型定点化优化算法研究[J].软件导刊,2017,16(2):63-66. 被引量：1
9徐旭,梁艳春,时小虎.延时-回归神经网络及在超声马达控制中的应用[J].电子学报,2004,32(11):1918-1921. 被引量：2
10王龙,杨俊安,陈雷,林伟.基于循环神经网络的汉语语言模型建模方法[J].声学技术,2015,34(5):431-436. 被引量：5

计算机研究与发展

2014年第9期

浏览历史

内容加载中请稍等...

基于RNN-RBM语言模型的语音识别研究被引量：27

参考文献8

同被引文献173

引证文献27

二级引证文献669

相关作者

相关机构

相关主题

浏览历史

基于RNN-RBM语言模型的语音识别研究 被引量：27

参考文献8

同被引文献173

引证文献27

二级引证文献669

相关作者

相关机构

相关主题

浏览历史

基于RNN-RBM语言模型的语音识别研究被引量：27