基于词向量特征的循环神经网络语言模型被引量：38

Recurrent Neural Network Language Model Based on Word Vector Features

下载PDF

导出

摘要循环神经网络语言模型能解决传统N-gram模型中存在的数据稀疏和维数灾难问题,但仍缺乏对长距离信息的描述能力.为此文中提出一种基于词向量特征的循环神经网络语言模型改进方法.该方法在输入层中增加特征层,改进模型结构.在模型训练时,通过特征层加入上下文词向量,增强网络对长距离信息约束的学习能力.实验表明,文中方法能有效提高语言模型的性能. The recurrent neural network language model（ RNNLM） solves the problems of data sparseness and dimensionality disaster in traditional N-gram models. However, the original RNNLM is still lack of long dependence due to the vanishing gradient problem. In this paper, an improved method based on contextual word vectors is proposed for RNNLM. To improve the structure of models, a feature layer is added into the input layer. Contextual word vectors are added into the model with feature layer to reinforce the ability of learning long-distance information during the training. Experimental results show that the proposed method effectively improves the performance of RNNLM.

作者张剑屈丹李真

机构地区中国人民解放军信息工程大学信息系统工程学院

出处《模式识别与人工智能》 EI CSCD 北大核心 2015年第4期299-305,共7页 Pattern Recognition and Artificial Intelligence

基金国家863计划项目(No.2012AA011603) 国家自然科学基金项目(No.61175017)资助

关键词语音识别语言模型循环神经网络词向量 Speech Recognition Language Model Recurrent Neural Network Word Vector

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献17

1Schwenk H. Continuous Space Language Models. Computer Speech and Language, 2007, 21 (3) : 492-518.
2Bengio Y, Ducharme R, Vincent P, et al. A Neural Probabilistie Language Model. Journal of Machine Learning Research, 2003, 3 : 1137-1155.
3Mikolov T, Karafiett M, Burger L, et al. Recurrent Neural Network Based Language Model//Proc of the 11 th Annual Conference of the International Speech Communication Association. Makuhari, Japan, 2010:1045-1048.
4Mikolov T, Kombrink S, Burget L, et al. Extensions of Recurrent Neural Network Language Model// Proc of the IEEE International Conference on Acoustics , Speech and Signal Processing . Prague ,Czech Republic, 2011 : 5528-5531.
5Bengio Y, Simard P, Frasconi P. Learning Long-Term Dependen- cies with Gradient Descent Is Difficult. IEEE Trans on Neural Net- works, 1994, 5(2): 157-166.
6Son L H, Allauzen A, Yvon F. Measuring the Influence of Long Range Dependencies with Neural Network Language Models//Prec of the NAACL-HLT Workshop : Will We Ever Really Replace the N- gram Model.'? On the Future of Language Modeling for HLT. Man- treal, Canada, 2012:1-10.
7Martens J, Sutskever I. Learning Recurrent Neural Networks with Hessian-Free Optimization [ EB/OL ]. [ 2014 - 02 - 10 ]. http:// www. icml-2011, org/papers/532_icmlpaper, pdf.
8Sundermeyer M, Schltlter R, Ney H. LSTM Neural Networks for Lan- guage Modeling[EB/OL]. [2014-02-10]. http://www-i6, informatik. rwth- aachen, de/publications/download/820/Sundermeycr - 2012. pdf.
9Shi Y, Wiggers P, Jonker C M. Towards Recurrent Neural Networks Language Models with Linguistic and Contextual Features//Proe of the 13th Annual Conference of the International Speech Communica- tion Association. Portland, USA, 2012:1664-1667.
10Auli M, Galley M, Quirk C, et al. Joint Language and Translation Modeling with Recurrent Neural Networks // Proc of the Confe- rence on Empirical Methods in Natural Language Processing. Sea- ttle, USA, 2013:1044-1054.

同被引文献259

1冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：47
2万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：55
3张素香,高国洋,戚银城.基于条件随机场的中国人名识别方法[J].郑州大学学报（理学版）,2009,41(2):40-43. 被引量：7
4丛爽,戴谊.递归神经网络的结构研究[J].计算机应用,2004,24(8):18-20. 被引量：21
5姜小波,陈杰,仇玉林.一种简化的 SOVA算法[J].电子器件,2004,27(3):467-469. 被引量：1
6胡益锋,徐用懋,何细藕.石脑油裂解炉动态建模与仿真研究[J].石油学报（石油加工）,2004,20(6):51-57. 被引量：3
7胡文瑜,孙志挥,周晓云.基于最优K相异性的密度聚类算法研究[J].计算机工程与应用,2005,41(22):171-173. 被引量：2
8罗方芳,陈国龙,郭文忠.基于改进的Fish-search算法的信息检索研究[J].福州大学学报（自然科学版）,2006,34(2):184-188. 被引量：9
9苏祺,项锟,孙斌.基于链接聚类的Shark-Search算法[J].山东大学学报（理学版）,2006,41(3):139-143. 被引量：8
10周传清,余雷,陆培华,任秋实.准分子屈光手术中非球面系数对球差以及切削深度的影响[J].光学精密工程,2007,15(2):167-172. 被引量：14

引证文献38

1汪沛,线岩团,郭剑毅,文永华,陈玮,王红斌.一种结合词向量和图模型的特定领域实体消歧方法[J].智能系统学报,2016,11(3):366-375. 被引量：6
2路佳佳,李晓芳.神经语言模型在框架排歧中的应用[J].广西民族师范学院学报,2017,34(3):127-130. 被引量：1
3刘畅,张一珂,张鹏远,颜永红.基于改进主题分布特征的神经网络语言模型[J].电子与信息学报,2018,40(1):219-225. 被引量：10
4栾杰,刘利军,冯旭鹏,黄青松.面向微博博主的评论质量评估[J].小型微型计算机系统,2018,39(1):58-63. 被引量：1
5翟东升,胡等金,张杰,何喜军,刘鹤.专利发明等级分类建模技术研究[J].数据分析与知识发现,2017,1(12):63-73. 被引量：1
6程元堃,廖闻剑,程光.词向量聚类加权Shark-Search的主题爬虫策略研究[J].计算机与数字工程,2018,46(1):144-148. 被引量：6
7孔德江,汤斯亮,吴飞.时空嵌入式生成对抗网络的地点预测方法[J].模式识别与人工智能,2018,31(1):49-60. 被引量：10
8王嘉文,王传栋,杨雁莹.一种中文人名识别的训练架构[J].计算机技术与发展,2018,28(7):53-57. 被引量：1
9李峰,侯加英,曾荣仁,凌晨.融合词向量的多特征句子相似度计算方法研究[J].计算机科学与探索,2017,11(4):608-618. 被引量：14
10徐萍,吴超,胡峰俊,吴凡,林建伟,刘静静.基于迁移学习的个性化循环神经网络语言模型[J].南京理工大学学报,2018,42(4):401-408. 被引量：6

二级引证文献870

1吴煌,杨智成,李梦华.基于长短期记忆神经网络的矿井涌水量预测[J].中国水运（下半月）,2023,23(3):25-27.
2姚晨明,姚磊.基于智能感知与数据决策的疏浚与通航预警系统研发[J].中国水运（下半月）,2022,22(9):35-36. 被引量：1
3熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：1
4孙铭,魏守科,王莹洁,赵金东,袁梅雪.基于小波分解的LSTM水质预测模型[J].计算机系统应用,2020,29(12):55-63. 被引量：10
5马娜,张智雄,吴朋民.基于特征融合的术语型引用对象自动识别方法研究[J].数据分析与知识发现,2020,4(1):89-98. 被引量：7
6许昱旻,郭春.基于移动平均和神经网络的公路隧道运营通风折减率修正研究[J].现代隧道技术,2022,59(S01):121-127. 被引量：1
7安子栋,敬卿,郝志超,余奕.基于生成式AI技术的图书馆文献资源管理创新策略[J].图书馆工作与研究,2023(S01):9-16. 被引量：3
8史向明,骆成杰,刘勇,韩雪,于海山.常规载荷测试方法对油井载荷测试结果的影响分析[J].石油技师,2023(1):62-69.
9唐晓波,王琼赋,牟昊.基于词共现与词向量的概念层次关系自动抽取模型——以学术论文评价领域为例[J].情报科学,2022,40(10):3-11.
10秦帅波.中医知识智能诊断系统的研究[J].计算机产品与流通,2020,9(1):142-142.

1陈笑蓉,秦进.特征和语言模型结合的中文文本查错[J].计算机应用,2004,24(B12):259-261. 被引量：1
2鹿文鹏,黄河燕,吴昊.基于领域知识的图模型词义消歧方法[J].自动化学报,2014,40(12):2836-2850. 被引量：10
3谢旭东,丁晓青,彭良瑞,刘长松.一个基于混合语言模型的日文识别后处理系统[J].计算机工程与应用,2002,38(14):68-72.
4霍林,王力,黄俊文,潘英花.一种结合同义词典和词对共现距离的查询扩展方法[J].广西大学学报（自然科学版）,2010,35(2):303-309. 被引量：5
5宇缨,王晓龙,刘秉权.一种基于SVM／RS的中文机构名称自动识别方法[J].电子与信息学报,2006,28(5):895-900. 被引量：4
6孙广范,宋金平,袁琦,肖健,单玉秋.中英可比语料库中翻译等价对抽取方法研究[J].计算机工程与应用,2007,43(32):44-46. 被引量：9
7袁晓丰,邱锡鹏,吴立德,黄萱菁.基于短语检索和答案排序的列表问题回答方法[J].中文信息学报,2008,22(5):74-79.

模式识别与人工智能

2015年第4期

浏览历史

内容加载中请稍等...

基于词向量特征的循环神经网络语言模型被引量：38

参考文献17

同被引文献259

引证文献38

二级引证文献870

相关作者

相关机构

相关主题

浏览历史

基于词向量特征的循环神经网络语言模型 被引量：38

参考文献17

同被引文献259

引证文献38

二级引证文献870

相关作者

相关机构

相关主题

浏览历史

基于词向量特征的循环神经网络语言模型被引量：38