语音识别技术研究进展与挑战被引量：6

The Research Development and Challenge of Automatic Speech Recognition

下载PDF

导出

摘要【目的】本文对语音识别系统的主流技术框架及主要挑战进行了系统而全面的介绍,为语音识别领域的进一步技术研究提供参考。【方法】首先,介绍了端到端语音识别框架的主流方案;然后,提出了语音识别应用中的四大挑战性问题,即恶劣场景的识别问题、中英文混合识别问题、专业术语的识别问题以及低资源小语种识别问题。【结果】针对端到端框架稳定性不足的问题,提出了带有强化和过滤注意力机制的改进方案。针对语音识别中的挑战性难题,探讨了主流的解决方案及未来的发展方向。【结论】端到端框架的大规模商用仍存在较大挑战,四大挑战性问题的解决将对语音识别的行业应用推广起到关键的作用。 [Objective]This paper firstly introduces the start-of-art technical framework and main challenges of Automatic Speech Recognition(ASR)systems,then provides reference for further research in the field of ASR.[Methods]Firstly,the newest framework of end-to-end speech recognition is introduced,including the Connectionist Temporal Classification(CTC)and attention based framework.Secondly,four challenging problems in ASR applications are presented,including the recognition of noisy and distant field speech,the recognition of code-switching,the recognition of domain related terms,and minority language speech recognition with limited resources.[Results]For the problem of robustness of end-to-end ASR system,an improved enhancement method and filtering attention mechanism is proposed.The start-of-art methods and future development directions are discussed regarding to the challenging problems of ASR systems.[Conclusions]There is a major challenge for the commercialization of the end-to-end ASR systems,and the research on four challenging problems plays a key role in the application of ASR systems.

作者刘庆峰高建清万根顺 Liu Qingfeng;Gao Jianqing;Wan Genshun(IFLYTEK,Hefei,Anhui 230088,China)

机构地区科大讯飞股份有限公司

出处《数据与计算发展前沿》 2019年第2期26-36,共11页 Frontiers of Data & Computing

关键词语音识别端到端远场识别中英文混合专业术语 automatic speech recognition end-to-end distant filed speech code-switch domain related terms

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

同被引文献67

1高小平.中国智能家居的现状及发展趋势[J].低压电器,2005(4):18-21. 被引量：133
2简兆权,吴隆增,黄静.吸收能力、知识整合对组织创新和组织绩效的影响研究[J].科研管理,2008,29(1):80-86. 被引量：76
3孙冰.技术创新动因研究综述[J].华东经济管理,2010,24(4):143-147. 被引量：9
4童晓渝,房秉毅,张云勇.物联网智能家居发展分析[J].移动通信,2010,34(9):16-20. 被引量：174
5屠兴勇.组织知识定义及多维立体型分类框架研究[J].管理学家（学术版）,2012(2):16-30. 被引量：7
6王贤文,徐申萌,彭恋,胡志刚.基于专利共类分析的技术网络结构研究：1971—2010[J].情报学报,2013,32(2):198-205. 被引量：26
7禹琳琳.语音识别技术及应用综述[J].现代电子技术,2013,36(13):43-45. 被引量：58
8迟学芹,孙淑娴,魏雪艳,刘明霞.技术组合创新与检验医学[J].工企医刊,2013,26(3):276-276. 被引量：1
9曾大军,曹志冬.突发事件态势感知与决策支持的大数据解决方案[J].中国应急管理,2013(11):15-23. 被引量：41
10石勇.大数据与科技新挑战[J].科技促进发展,2014,10(1):25-30. 被引量：10

引证文献6

1张兮,李玉龙,成一航,祝恒书.数字化知识管理理论与应用研究综述[J].数据与计算发展前沿,2021,3(2):23-38. 被引量：11
2侯俊龙,潘文林.基于元度量学习的低资源语音识别[J].云南民族大学学报（自然科学版）,2021,30(3):272-278. 被引量：2
3黄友鹏.关于人工智能中远场语音识别技术的探究[J].科学大众（科技创新）,2021(6):111-111.
4陈晓红,滕华.基于深度机器学习的英语语音识别研究[J].贵阳学院学报（自然科学版）,2021,16(3):1-4. 被引量：3
5周潇,许银彪,史益.基于深度学习与语义挖掘的技术创新组合识别与追踪[J].图书情报工作,2022,66(10):33-44. 被引量：10
6朱益朋.智能家居系统中语音识别与控制研究[J].信息记录材料,2024,25(6):229-231.

二级引证文献26

1李林,张津鹏,付恩三,刘光伟.煤矿风险隐患评估系统[J].中国安全科学学报,2023,33(S02):1-6.
2刘恩棒,郭喜良,王艳娇,柳兆峰,高超.知识管理在放射性废物管理中的应用[J].环境工程,2023,41(S02):1203-1207.
3张茜,孙树森,武园浩,聂蓉梅,赵博.基于航天型号协同设计流程的资源共享模式研究[J].网信军民融合,2021(9):43-47.
4王娜,李辉,张玲.知识嵌入视角下智库专家评价框架的构建[J].智库理论与实践,2022,7(1):3-12. 被引量：6
5蓝泽如.基于人工智能深度学习的语音识别方法及发展趋势[J].新一代信息技术,2022,5(1):104-106. 被引量：1
6杨永杰,王晨阳.数字技术多维互动技术研发投入与数字平台商业模式创新的实证研究——基于资源编排的调节效应[J].武汉商学院学报,2022,36(1):34-44. 被引量：3
7杨雪晴.基于语音识别的英语翻译器设计[J].自动化与仪器仪表,2022(8):221-225. 被引量：4
8张玉环.数字化赋能企业知识管理的价值走向[J].企业改革与管理,2022(15):9-11. 被引量：3
9梁亚敏,李亚峰.基于语音识别的智能英语翻译机器人人机交互系统[J].自动化与仪器仪表,2022(9):196-200. 被引量：6
10屈丹,杨绪魁,闫红刚,陈雅淇,牛铜.低资源少样本连续语音识别最新进展[J].郑州大学学报（工学版）,2023,44(4):1-9. 被引量：3

1《国际眼科杂志·IES》约稿启事[J].国际眼科杂志,2019,19(12).
2《国际眼科杂志·IES》约稿启事[J].国际眼科杂志,2020,20(2).
3杜刚,朱艳云,张晨,杜雪涛.基于声学模型的不良语音识别技术研究[J].电信工程技术与标准化,2019,32(12):18-22. 被引量：1
4高健鑫.5G无线通信技术概念及相关应用分析[J].中国新通信,2019,21(22):19-19. 被引量：5
5谢进杰.基层司法改革存在的四大挑战及解决之道[J].人民论坛,2020(3):107-109.
6《国际眼科杂志·IES》约稿启事[J].国际眼科杂志,2020,20(3).
7魏笑,秦永彬,陈艳平.一种基于部件CNN的网络安全命名实体识别方法[J].计算机与数字工程,2020,48(1):106-111. 被引量：9
8《国际眼科杂志·IES》约稿启事[J].国际眼科杂志,2020,20(1).
9崔金栋,王胜文,辛业春.区块联盟链视角下智能电网数据管理技术框架研究[J].中国电机工程学报,2020,40(3):836-847. 被引量：72
10杨志杰,张梅,李冠龙,黄昌达.基于长短时记忆元的语音智能识别系统设计[J].电子设计工程,2020,28(1):55-58. 被引量：4

数据与计算发展前沿

2019年第2期

浏览历史

内容加载中请稍等...

语音识别技术研究进展与挑战被引量：6

同被引文献67

引证文献6

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

语音识别技术研究进展与挑战 被引量：6

同被引文献67

引证文献6

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

语音识别技术研究进展与挑战被引量：6