学习长短时记忆网络的紧密结构被引量：6

Learning the Compact Architecture of Long Short Term Memory Networks

下载PDF

导出

摘要近些年来,在语音识别任务上,前馈神经网络与长短时记忆网络等模型取得了突出的性能表现.然而,这些神经网络对其所要部署设备的内存资源与计算效率有较高的要求,这极大的阻碍了神经网络在移动设备上的应用.事实上大部分的神经网络都存在一定程度上的参数冗余,并由此带来了额外的计算量,因此压缩神经网络模型具有可行性与必要性.在这篇论文中,我们提出一种在网络训练过程中利用移动门来自动学习长短时记忆网络结构的方法,可以得到更加紧密的网络结构.在Sw itchboard上的实验结果显示我们提出的方法可以将长短时记忆网络的参数量减少到原来的58.7%,同时没有带来性能损失. In the last few years,Feed Forward Neural Networks and Long Short Term Memory Networks have achieved state-of-art performance on many speech recognition tasks.However,these neural networks have higher demands for memory resources and computational efficiency of the devices that they are deploying,which hinders the application of neural networks on mobile devices.In fact,most of the neural networks have a certain degree of parameter redundancy and bring additional computation,and therefore,it is feasible and necessary to compress neural network models.In this paper,we propose a method to automatically learn the architectures of Long Short Term Memory Networks with moving gate during training,which achieves more compact architectures.Experimental results on the Switchboard task have shown that our proposed method can reduce the number of parameters in Long Short Term Memory Networks to 58.7% without performance loss.

作者陈皇戴礼荣张仕良黄俊 CHEN Huang;DAI Li-rong;ZHANG Shi-liang;HUANG Jun(National Engineering Laboratory of Speech and Language Information Processing,University of Science and Technology of China,Hefei 230027,China)

机构地区中国科学技术大学语音与语言信息处理国家工程实验室

出处《小型微型计算机系统》 CSCD 北大核心 2018年第11期2409-2412,共4页 Journal of Chinese Computer Systems

基金国家重点研发计划项目(2017YFB1002200)资助

关键词长短时记忆网络语音识别模型压缩 long short term memory networks speech recognition model compression

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献34

1戴新宇,尹存燕,陈家骏,郑国梁.机器翻译研究现状与展望[J].计算机科学,2004,31(11):176-179. 被引量：28
2郭铁男.中国火灾形势与消防科学技术的发展[J].消防技术与产品信息,2005,18(11):3-10. 被引量：11
3刘钟宇,王雪峰,栾兰.RS485/232电平转换器电路研制[J].微处理机,2008,29(3):45-46. 被引量：5
4傅坚尧.智能火灾预警系统的研究与实践[J].消防科学与技术,2011,30(11):1038-1041. 被引量：10
5张玉杰,伍莹莹.基于STM32的消防设备故障报警系统[J].消防科学与技术,2013,32(10):1127-1129. 被引量：4
6余正红,伍永豪,邓娟,王俊.基于Hadoop与XMPP的云翻译系统的研究与实现[J].计算机与数字工程,2014,42(2):239-242. 被引量：2
7廖大强,印鉴.基于多分支RNN快速学习算法的混沌时间序列预测[J].计算机应用研究,2015,32(2):403-408. 被引量：6
8蒋锐滢,崔磊,何晶,周明,潘志庚.基于主题模型和统计机器翻译方法的中文格律诗自动生成[J].计算机学报,2015,38(12):2426-2436. 被引量：16
9蒋宁,杜玉晓.基于惯性传感器的穿戴式跌倒检测系统设计[J].电子世界,2016,0(5):147-149. 被引量：9
10孙金祥,曹银杰,张宁,王明红,霍林林.基于粉尘浓度传感器的火灾预警系统[J].消防科学与技术,2016,35(7):973-975. 被引量：12

引证文献6

1卫少洁,周永霞.一种结合Alphapose和LSTM的人体摔倒检测模型[J].小型微型计算机系统,2019,40(9):1886-1890. 被引量：14
2刘明,曹银杰.基于人工神经网络的火灾预警系统[J].现代计算机,2020,26(12):127-130. 被引量：4
3刘明,曹银杰,耿相珍,胡卫生.在微控制器芯片实现神经网络的方法[J].现代电子技术,2020,43(22):1-5. 被引量：1
4徐君怡.运用微控制器芯片实现神经网络的方法[J].电脑编程技巧与维护,2021(6):158-159.
5董斌.基于改进编码/解码模型的中英机器翻译方法[J].计算机与数字工程,2021,49(6):1253-1257. 被引量：5
6范颖,沈建京.动态队列下入侵肿瘤生长优化和BPNN的云计算任务调度新方法[J].计算机应用与软件,2021,38(7):281-288. 被引量：1

二级引证文献25

1卢道设,王瑾,谭晖涛,魏盈颖.移动互联环境下教学辅助系统的应用研究[J].福建电脑,2021,37(5):37-41. 被引量：2
2胡衍坤,王宁,刘枢,姜秋俚,张楠.时间序列模型和LSTM模型在水质预测中的应用研究[J].小型微型计算机系统,2021,42(8):1569-1573. 被引量：14
3徐淼鑫,王鑫.一种单片机的智能居家火灾报警系统研究[J].电子测试,2021,32(16):17-18. 被引量：2
4徐世文,王姮,张华,庞杰.一种基于关键点的红外图像人体摔倒检测方法[J].红外技术,2021,43(10):1003-1007. 被引量：3
5张鹏飞,叶哲江,杨嘉林,李家成.基于CNN的水表指针读数识别及STM32实现方案设计[J].电子测量技术,2021,44(23):61-67. 被引量：5
6刘耀,焦双健.ST-GCN在建筑工人不安全动作识别中的应用[J].中国安全科学学报,2022,32(4):30-35. 被引量：16
7王宗超,方江平.火灾预警系统的应用现状与发展趋势[J].今日消防,2022,7(4):32-34. 被引量：2
8刘渝.融合语言特征和神经网络的英语机器翻译研究[J].自动化与仪器仪表,2022(5):142-145. 被引量：3
9付敏.基于特征提取的英汉机器自动转换翻译系统设计[J].自动化与仪器仪表,2022(5):166-169. 被引量：1
10李建华.基于单片机的智能居家火灾报警系统研究[J].电脑编程技巧与维护,2022(7):118-120. 被引量：1

1李晓坤,郑永亮,刘磊,陈虹旭,邵娜,杨磊.LSTM与DeepLearning技术在疾病诊断中的应用[J].黑龙江大学工程学报,2018,9(3):67-72. 被引量：1
2杨扬,蓝章礼,陈巍.基于统计分析的卷积神经网络模型压缩方法[J].计算机系统应用,2018,27(8):49-55. 被引量：1
3陈欣,于俊洋,赵媛媛.基于CNN和B-LSTM的文本处理模型研究[J].轻工学报,2018,33(5):103-108. 被引量：6
4张小锋,刘红铮.基于卷积神经网络的花朵图片分类算法[J].计算机与现代化,2018(9):52-55. 被引量：7
5林哲聪,张江鑫.一种基于GMP-LeNet网络的车牌识别方法[J].计算机科学,2018,45(B06):183-186. 被引量：9
6陈斌.“一带一路”背景下建筑企业“走出去”的对策分析[J].纳税,2018,12(22):167-168. 被引量：1
7许宁,徐昌荣.改进型LSTM变形预测模型研究[J].江西理工大学学报,2018,39(5):45-51. 被引量：17
8李宣达.花样跳绳融入南方医科大学课程的可行性分析[J].文体用品与科技,2018,0(21):140-141.
9张凤娇,汪䶮,赵万忠.基于深度学习的极限工况下车辆的状态估计[J].重庆理工大学学报（自然科学）,2018,32(10):64-70. 被引量：4
10汪成龙,黄余凤,庄学敏,谢珩.基于深度学习的马铃薯畸形检测方法研究[J].惠州学院学报,2018,38(3):61-66. 被引量：1

小型微型计算机系统

2018年第11期

浏览历史

内容加载中请稍等...

学习长短时记忆网络的紧密结构被引量：6

同被引文献34

引证文献6

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

学习长短时记忆网络的紧密结构 被引量：6

同被引文献34

引证文献6

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

学习长短时记忆网络的紧密结构被引量：6