基于深度学习的移动端语音识别系统设计被引量：10

Mobile Speech Recognition System Design Based on Deep Learning

下载PDF

导出

摘要随着深度学习技术研究的深入,语音识别同样已经完成了从传统模型到深度学习的过渡,本文主要实现移动端离线状态下的语音识别并提高语音识别的精度。文中采用深度学习的方式,将在电脑上训练好的模型移植到树莓派3b+上进行语音识别操作。项目整体结构可以分为声学模型及语言模型两个部分,同语音识别中其他主流模型进行对比测试后,得到的结论是声学模型DFCNN和语言模型Transformer的编码器部分都适合移植于嵌入式端,在成本远低于市场上既有语音识别产品的情况下,识别效果和速度都非常接近。 With the research progress of deep learning technology,speech recognition has also completed the transition from traditional model to deep learning.The main purpose of this paper is to solve the speech recognition under the mobile offline state and improve the accuracy of speech recognition.In the paper,the method of deep learning is used to transplant the model trained on the computer to the Raspberry Pi 3b+for speech recognition.The overall structure of the project can be divided into two parts:acoustic model and language model.Comparing with other mainstream models in speech recognition,the conclusion is that the encoder part of the acoustic model DFCNN and the language model Transformer are suitable for transplantation on the embedded end.The recognition effect and speed are very close when the cost is much lower than that of the existing speech recognition products on the market.

作者谭磊余欣洋罗伟洋曾维代云强 Tan Lei;Yu Xinyang;Luo Weiyang;Zeng Wei;Dai Yunqiang(College of Information Science and Technology,Chengdu University of Technology,Chengdu 610059,China)

机构地区成都理工大学信息科学与技术学院

出处《单片机与嵌入式系统应用》 2020年第9期28-31,35,共5页 Microcontrollers & Embedded Systems

基金基于图像识别的主动式显示器支架(S201910616036) 一种应用于公共交通领域的人包联动管理系统(S201910616037) 基于WSN的楼宇灾难应急疏散系统(S201910616133)。

关键词深度学习嵌入式系统语音识别声学模型语言模型 deep learning embedded system speech recognition acoustic model language model

分类号 TP31 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1黄威,石佳影.基于深度神经网络的语音识别研究[J].现代计算机,2016,22(5):20-25. 被引量：4
2邢安昊,张鹏远,潘接林,颜永红.基于SVD的DNN裁剪方法和重训练[J].清华大学学报（自然科学版）,2016,56(7):772-776. 被引量：3
3莫媛媛,郭剑毅,余正涛,毛存礼,牛翊童.基于深层神经网络(DNN)的汉-越双语词语对齐方法[J].山东大学学报（理学版）,2016,51(1):77-83. 被引量：3

二级参考文献32

1LE H P, HOT V. A maximum entropy approach to sentence boundary detection of Vietnamese texts [ C ]//IEEE International Conference on Research, Innovation and Vision for the Future-RIVF 2008. New York: IEEE, 2008 : 1-6.
2HUYIN N T M, ROUSSANALY A, VINH H T. A hybrid approach to word segmentation of Vietnamese texts[J]. Language and Automata Theory and Applications, 2008:240-249.
3越南语词法分析系统[EB/OL].[2014-11-12].http://www.10ria.fr/-lehong/tools/vn-Tokenizer.php.
4BROWN P F, P1ETRA V J D, PIETRA S A D, et al. The mathematics of statistical machine translation:parameter estimation [ J ]. Computational Linguistics, 1993, 19 (2) : 263-311.
5Franz Josef Och, Hermann Ney. A systematic comparison of various statistical alignment models [ J ]. Computational Linguis- tics, 2003, 29(1):19-51.
6BLUNSOM P, COHN T. Discriminative word alignment with conditional random fields [ C ]//Proceedings of the 21 st Interna- tional Conference on Computational Linguistics and the 44th Annual Meeting of the Association for Computational Linguistics. Philadelphia:Association for Computational Linguistics, 2006:65-72.
7LIU Y, LIU Q, LIN S. Discriminative word alignment by linear modeling [ J ]. Computational Linguistics, 2010, 36 (3) :303- 339.
8HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets[ J]. Neural Computation, 2006, 18 (7) : 1527-1554.
9COLLOBERT R, WESTON J, BOTTOU L, et al. Natural language processing (almost) from scratch [ J]. The Journal of Machine Learning Research, 2011, 12:2493-2537.
10NIEHUES J, WAIBEL A. Continuous space language models using restricted boltzmann machines [ C ]//Proceedings of the 9th International Workshop on Spoken Language Translation (IWSLT). [ S. 1. ] :[ s. n. ], 2012:1-48.

共引文献7

1蒋久松,熊富强,毛文奇,张超峰.智能语音识别方法在电力移动作业平台中的应用[J].自动化应用,2017(11):124-127. 被引量：5
2刘琼.几种开源英语识别工具包的对比分析[J].计算技术与自动化,2018,37(4):123-127. 被引量：3
3陈亚豪,张亚飞,余正涛,文永华,朱俊国.基于英语枢轴的汉-越双语词典构建方法[J].小型微型计算机系统,2020,41(11):2303-2307. 被引量：1
4张威,刘晨,费鸿博,李巍,俞经虎,曹毅.基于DL-T及迁移学习的语音识别研究[J].工程科学学报,2021,43(3):433-441. 被引量：7
5王志祥,李建阁.基于DNN改性沥青中SBS含量的预测模型[J].建筑材料学报,2021,24(3):630-636. 被引量：3
6尹宝生,张斌斌,李绍鸣.融入线性句法信息的神经网络双语词对齐算法[J].计算机应用与软件,2023,40(9):278-282.
7李清,许冠中.浅析语音识别技术在电网中的应用[J].计算机产品与流通,2019,8(11):148-148. 被引量：4

同被引文献86

1王森.基于物联网的多功能智能家居系统设计[J].电子世界,2020,0(5):122-123. 被引量：7
2郑智聪,王红,齐林海.基于深度学习模型融合的电压暂降源识别方法[J].中国电机工程学报,2019,39(1):97-104. 被引量：46
3徐琳珊,唐祁南,姜林奇,靳韵泽,王彦.基于SPCE061A单片机的嵌入式语音识别系统的研究[J].电子技术（上海）,2018,47(12):37-38. 被引量：4
4黄光许,田垚,康健,刘加,夏善红.低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统[J].计算机应用研究,2017,34(2):392-396. 被引量：22
5汪志敏.基于树莓派的智能监控系统设计[J].科技广场,2017(3):89-91. 被引量：9
6王波.AVR单片机的高音质WAV播放器设计[J].单片机与嵌入式系统应用,2017,17(8):76-79. 被引量：2
7罗弦,冯浩,王逸兮,龙霏,邹澄澄.Web环境下大数据动态不良信息安全过滤系统设计[J].电子设计工程,2017,25(24):15-19. 被引量：9
8许秀富,吕小南.Android手机的智能家居语音控制系统设计[J].单片机与嵌入式系统应用,2018,18(1):48-51. 被引量：12
9黄玉金,杨越,薛伟,张天成.无线模块的AT指令UDP透传设计[J].电子产品世界,2018,25(1):34-36. 被引量：15
10王毅,谢娟,成颖.结合LSTM和CNN混合架构的深度神经网络语言模型[J].情报学报,2018,37(2):194-205. 被引量：19

引证文献10

1孙伟,李文俊,雷晖.一种基于树莓派的智能无线监控系统[J].电脑知识与技术,2021,17(1):61-62. 被引量：2
2李银树.基于视觉识别的机器人音频多模态情感识别系统设计[J].自动化与仪器仪表,2021(5):212-215.
3杜青,冯芳.基于树莓派的智能陪护机器人的设计[J].信息技术,2021,45(7):78-83. 被引量：2
4郭怡.基于人工智能的语音识别系统及应用研究[J].信息与电脑,2021,33(13):153-155. 被引量：3
5李青云.语音识别算法及其在嵌入式系统中的应用[J].电子技术与软件工程,2021(17):81-82. 被引量：2
6牛帅,张弛,董振华,何义.WM8978音频处理器的百度AI语音识别[J].单片机与嵌入式系统应用,2023,23(2):42-44. 被引量：5
7韩向阳.基于卷积神经网络的中文语音识别人机交互系统设计[J].自动化与仪器仪表,2023(7):201-204. 被引量：1
8王丽,涂冰花,王伟,陆俊,杨奚诚.长短期记忆循环神经网络在自动语音识别中的应用[J].单片机与嵌入式系统应用,2023,23(10):49-52. 被引量：4
9薛雅洁,贺红霞,杨祎.基于神经网络的语音信号识别与分类[J].现代电子技术,2023,46(24):79-84. 被引量：1
10陆心怡,卜朝晖.基于喉部振动的语音自动识别系统的设计[J].建模与仿真,2024,13(1):365-376.

二级引证文献20

1王彦斌.基于UWB定位技术的矿用智能电车系统设计[J].工矿自动化,2024,50(S01):53-56.
2王旭峰.基于深度学习的矿用车辆定位轨迹预测[J].工矿自动化,2024,50(S01):48-52.
3张泽宇,魏义,刘书磊,郭李雯,狄威.基于物联网的无人船水质采样系统[J].物联网技术,2022,12(1):99-100. 被引量：7
4赵炯,王苏桁,熊肖磊,周奇才.铁路隧道防护门远程监控系统设计研究[J].机械工程与自动化,2022(2):187-189.
5范永超,韩佳南.基于人工智能的语音识别系统设计与研究[J].数字通信世界,2022(5):55-57. 被引量：7
6谢灵洋,许春冬,刘晓涵.语音和射频遥控的多功能小车设计[J].福建电脑,2022,38(12):61-68. 被引量：2
7林燕.AI下的智能语音开放创新平台设计[J].信息与电脑,2022,34(18):182-185.
8张祖红.基于人工智能的语音识别处理过程缺陷分析[J].集成电路应用,2022,39(11):306-308.
9邢水红.人工智能与微信小程序实现天气实时查询[J].软件,2023,44(1):184-186. 被引量：1
10吴文志,李仲琼,黄伟锋,陆海键,王天雷.基于ROS的养老陪护机器人设计[J].科技创新与应用,2023,13(25):46-49. 被引量：1

1王立荣.超启发式组合时间序列预报模型[J].福建电脑,2020,36(8):27-32.
2玉雄侯,杨蓉,杨晓虎,黄俊明.基于DM642的车载浓雾天气识别系统研究[J].上海工程技术大学学报,2020,34(2):119-126. 被引量：1

单片机与嵌入式系统应用

2020年第9期

浏览历史

内容加载中请稍等...

基于深度学习的移动端语音识别系统设计被引量：10

参考文献3

二级参考文献32

共引文献7

同被引文献86

引证文献10

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于深度学习的移动端语音识别系统设计 被引量：10

参考文献3

二级参考文献32

共引文献7

同被引文献86

引证文献10

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于深度学习的移动端语音识别系统设计被引量：10