基于深度学习的语音识别技术现状与展望被引量：71

Deep Learning for Speech Recognition:Review of State-of-the-Arts Technologies and Prospects

下载PDF

导出

摘要首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍:声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基于深度学习的声学模型说话人自适应和基于深度学习的端到端语音识别。最后就基于深度学习的语音识别未来可能的研究方向进行展望。 In this paper,deep learning is briefly introduced.Then,a review of the research progress of deep learning based speech recognition is presented from the following five points：Training criterions for deep learning based acoustic models,different model architectures for deep learning based speech recognition acoustic modeling,scalable and distributed optimization methods for deep learning based acoustic model training,speaker adaptation for deep learning based acoustic model,and deep leaning based end-toend speech recognition.At the end of this paper,the future possible research points of deep learning based speech recognition are also proposed.

作者戴礼荣张仕良黄智颖 Dai Lirong Zhang Shiliang Huang Zhiying(National Engineering Laboratory of Speech and Language Information Processing, University of Science and Technology of China, Hefei, 230027, Chin)

机构地区中国科学技术大学语音与语言信息处理国家工程实验室

出处《数据采集与处理》 CSCD 北大核心 2017年第2期221-231,共11页 Journal of Data Acquisition and Processing

基金安徽省科技重大专项(15czz02007)资助项目国家重点研发计划(2016YFB1001300)资助项目

关键词深度学习深度神经网络语音识别说话人自适应 deep learning deep neural network speech recognition speaker adaptation

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

同被引文献470

1刘海涛,林燕妮.大数据时代语言研究的方法和趋向[J].新疆师范大学学报（哲学社会科学版）,2018,39(1):72-83. 被引量：26
2余鸿浩.视频图像处理技术在安防行业的应用[J].电子乐园,2019,0(1):394-394. 被引量：1
3刘爱琴.一种有效的聋人语言与思维形成的方法——格式化语言教学方法[J].中国特殊教育,2009(3):29-32. 被引量：5
4赵博,檀晓红.基于语音识别技术的英语口语教学系统[J].计算机应用,2009,29(3):761-763. 被引量：10
5周绍泉.徽州文书与徽学[J].历史研究,2000(1):51-60. 被引量：66
6史宝辉.我国语音学与音系学研究现状和发展方向[J].外语教学与研究,1996,28(2):20-28. 被引量：4
7井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13
8刘立波,周国民.基于多层感知神经网络的水稻叶瘟病识别方法[J].农业工程学报,2009,25(S2):213-217. 被引量：23
9柳红波.人工智能技术在智慧旅游中的应用[J].自动化与仪器仪表,2016(2):147-148. 被引量：10
10乔艳芳,李馨,孙鹏.食品光电色选技术装备设计及应用[J].农机化研究,2005,27(2):118-119. 被引量：14

引证文献71

1刘强强,刘恒霞,严家兴.高校智慧教室功能改进思考[J].中国教育技术装备,2021(2):1-2.
2范慧鹏,闪恒杰,房哲续,郭江川.用于故障诊断的深度学习分类模型及方法[J].河南电力,2023(S01):51-55. 被引量：2
3胡希颖,王大东,陈佳欣.基于NAO机器人的BLSTM-CTC的声学模型研究[J].智能计算机与应用,2021,11(3):76-79. 被引量：1
4杨灿.高职《深度学习》课程教学的实施[J].办公自动化,2021,26(16):37-38. 被引量：1
5杨毅,向辉,张琳.人工智能赋能文化产业融合创新:技术实践与优化进路[J].福建论坛（人文社会科学版）,2018(12):66-73. 被引量：21
6刘传忠.声纹识别及其在军事领域的应用研究[J].数码世界,2018,0(2):250-251.
7刘鹏程,袁三男,刘虹.基于深度学习的语音识别系统研究[J].新型工业化,2018,8(5):70-74. 被引量：5
8鲍日勤.人工智能时代的教与学变迁与开放大学2.0新探[J].远程教育杂志,2018,36(3):25-33. 被引量：40
9娄雪,闫德勤,王博林,王族.一种改进的邻域保持嵌入算法[J].计算机科学,2018,45(B06):255-258. 被引量：2
10叶硕,彭春堂,杜珍珍,贺娟.基于DTW的孤立词语音识别系统设计[J].长江大学学报（自然科学版）,2018,15(17):33-37. 被引量：5

二级引证文献347

1蒋云钟,冶运涛,赵红莉,梁犁丽,曹引,顾晶晶.水利大数据研究现状与展望[J].水力发电学报,2020,39(10):1-32. 被引量：88
2薛辉.基于语音识别的智能家居控制系统的研究与设计[J].微型电脑应用,2020,36(2):149-151. 被引量：11
3谢文武,胡胜,欧阳竟成.基于循环累积量和神经网络的调制识别算法[J].计算机应用研究,2020,37(S01):273-274. 被引量：2
4胡青云.人工智能背景下开放教育教学研究[J].吉林广播电视大学学报,2023(3):16-18.
5卢潇颖.老年英语远程教学模式研究[J].吉林广播电视大学学报,2022(6):49-51.
6齐骥,陈思.数字化文化消费新场景的背景、特征、功能与发展方向[J].福建论坛（人文社会科学版）,2022(12):35-43. 被引量：10
7詹绍文,梁洋.人工智能与文化产业融合发展研究[J].大众文艺（学术版）,2020(4):268-269. 被引量：3
8李宝平,魏坡.基于CWD谱图和改进CNN的无线电调制分类[J].电子测量技术,2023,46(5):50-56. 被引量：2
9陈文,向罗勇.深度学习关键技术在广电音视频节目制作中的运用探索[J].电声技术,2021,45(12):31-33. 被引量：1
10付志娟.“互联网+”时代背景下高职院校英语教学改革策略[J].教育科学论坛,2018(30):53-55. 被引量：5

1努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木.维吾尔语连续语音识别声学模型优化研究[J].计算机工程与应用,2013,49(2):145-147. 被引量：4
2杨大为,胡娟.5G无线传输的关键技术[J].电子技术与软件工程,2017(8):30-31. 被引量：2
3茅晓泉,胡光锐.基于最大互信息的离散隐马尔柯夫模型训练方法[J].上海交通大学学报,2001,35(11):1713-1716. 被引量：7
4王君,王冷晶.网络管理系统的基本应用及发展趋势[J].通信工程,2010(2):35-35.
5罗锦莉.无线充电接收器未来可能会内置入智能手机[J].金融科技时代,2013(3):18-18.
6关存太,陈永彬,吴伯修.全音节汉语语音识别系统的声学模型研究[J].声学学报,1994,19(5):321-330. 被引量：4
7肖凌,祝忠明,赖敏.UWB技术在无线传感器网络中的应用[J].信息通信,2007,20(2):77-80. 被引量：3
8茅晓泉,胡光锐.一种基于梯度的HMM参数重估方法[J].上海交通大学学报,2002,36(5):683-685. 被引量：2
9刘加,刘润生.语音识别技术及应用(上)[J].世界电子元器件,2001(11):21-23. 被引量：11
10徐丰,王海鹏,金亚秋.深度学习在SAR目标识别与地物分类中的应用[J].雷达学报（中英文）,2017,6(2):136-148. 被引量：73

数据采集与处理

2017年第2期

浏览历史

内容加载中请稍等...

基于深度学习的语音识别技术现状与展望被引量：71

同被引文献470

引证文献71

二级引证文献347

相关作者

相关机构

相关主题

浏览历史

基于深度学习的语音识别技术现状与展望 被引量：71

同被引文献470

引证文献71

二级引证文献347

相关作者

相关机构

相关主题

浏览历史

基于深度学习的语音识别技术现状与展望被引量：71