基于神经网络的中文语音识别技术被引量：10

An Chinese Voice Recognition Technology Based on Neural Network

下载PDF

导出

摘要研究一种基于神经网络的端到端中文语音识别算法.算法将语音信息处理为频谱图,基于频谱图,设计和实现一种基于卷积神经网络和循环神经网络的深度学习模型结构用于中文语音识别.模型以汉字作为标签样本,运用训练算法和序列损失函数进行模型迭代训练最终模型;采用开源数据集,通过实验验证网络结构对识别效果的影响,同时对比传统的语音识别算法,取得更加优异的识别效果,消耗更少的训练时间. A deep learning based end-to-end Chinese automatic voice recognition model is proposed in this paper. The raw voice signal is firstly converted to spectrogram. Then a convolutional neural network and recurrent neural network combined structure is designed and implemented to translate Chinese audio to texts. The label of our model is the single Chinese character, with the proper loss function and training algorithm applied to train the recognition model iteratively. Taking an open dataset as training samples to test the influence of neural network structure, we also do tests to compare with the traditional methods. The experimental results show that our proposed model obtains more accuracy recognition and consumes less time for the training procedure.

作者代伟刘洪 DAI Wei;LIU Hong(College of Artificial Intelligence,Neijiang Normal University,Neijiang 641112,Sichuan;College of Computer Science,Sichuan University,Chengdu 610065,Sichuan)

机构地区内江师范学院人工智能学院四川大学计算机学院

出处《四川师范大学学报（自然科学版）》 CAS 2022年第1期131-135,共5页 Journal of Sichuan Normal University（Natural Science）

基金国家自然科学基金(71573184)。

关键词语音识别频谱图卷积神经网络循环神经网络 voice recognition spectrogram convolutional neural network recurrent neural network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1杨洋,汪毓铎.基于改进卷积神经网络算法的语音识别[J].应用声学,2018,37(6):940-946. 被引量：26
2侯强,侯瑞丽.机器翻译方法研究与发展综述[J].计算机工程与应用,2019,55(10):30-35. 被引量：25
3王嘉伟.基于卷积神经网络的语音识别研究[J].科学技术创新,2019(31):71-73. 被引量：6
4王平,韩琦.陟槽型激活函数细胞神经网络稳定点研究[J].重庆大学学报（自然科学版）,2014,37(8):132-137. 被引量：1
5张捷,田袁,邓绍江.SA-PSO算法在CNN边缘提取模板设计中的应用[J].重庆大学学报（自然科学版）,2016,39(4):147-153. 被引量：6
6蔡坤宝,曹丁,段云孜,罗德成,刘宗行.脉象信号的特征提取与识别方法[J].重庆大学学报（自然科学版）,2011,34(10):119-123. 被引量：8
7艾斯卡尔·肉孜,殷实,张之勇,王东,艾斯卡尔·艾木都拉,郑方.THUYG-20：免费的维吾尔语语音数据库[J].清华大学学报（自然科学版）,2017,57(2):182-187. 被引量：13
8冯辉宗,王芸芳.语谱特征的身份认证向量识别方法[J].重庆大学学报（自然科学版）,2017,40(5):88-94. 被引量：4
9陈为真,汪秉文,胡晓娅.多因子预测模型在连续梁桥中的应用[J].重庆大学学报（自然科学版）,2009,32(3):353-356. 被引量：3
10田海江,甄岩.适用于语音业务的MANET机会路由机制[J].重庆大学学报（自然科学版）,2015,38(3):142-148. 被引量：1

二级参考文献92

1刘红星,戴蓓蒨,陆伟.基于共振峰谐波能量的语音端点检测[J].清华大学学报（自然科学版）,2008,48(S1):754-759. 被引量：11
2王巍,安友伟,黄展,丁锋,杨铿,白晨旭.基于CNN的红外图像边缘检测算法的FPGA实现[J].光子学报,2012,41(11):1354-1358. 被引量：7
3汪劲,耿立大.机器翻译及其基本概念和常用方法[J].情报科学,1988,9(2):31-38. 被引量：2
4何雄君,范立础,李丽平,邵吉林.大型桥梁施工预测控制系统研究[J].中国公路学报,2006,19(1):53-57. 被引量：19
5张继红,蔡坤宝,李玉韩.中医脉象信号的参数化双谱估计及其切片分析[J].重庆大学学报（自然科学版）,2006,29(6):47-50. 被引量：4
6王培金,盛洪飞,赵尚栋.大跨连续刚构桥预应力混凝土箱梁的长期挠度预测探讨[J].公路交通科技,2007,24(1):87-89. 被引量：42
7姚波,郑青青.大跨径预应力连续梁桥悬臂浇筑施工监控[J].山西建筑,2007,33(2):269-270. 被引量：6
8蔡琴,吾守尔.斯拉木.基于HTK的维吾尔语连续数字语音识别[J].现代计算机,2007,13(4):14-16. 被引量：7
9BAI X P, WANG H M. A new grey decision dynamic model based on cybernetics knowledge for complex system optimization analyzing and its practical application [J]. Kybernetes, 2008, 37(9/10):1218-1226.
10LIN Y H, LEE P C. Novel high-precision grey foreasting model [J ]. Automation in Construction, 2007 (16) :771-777.

共引文献78

1熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：3
2梁慧莹.机器翻译与人工翻译的碰撞与融合[J].现代英语,2021(19):34-36.
3李允,侯学敏.成语识别技术在机器翻译中的研究与实际应用[J].汉字文化,2024(11):175-177.
4陈学进,程智慧,滕林,赖琳玲.塑料大棚温光条件与番茄坐果数相关关系的模拟[J].西北农业学报,2009,18(6):197-200. 被引量：8
5袁向荣.结构工程施工虚实结合技术研究的依据和意义[J].广州建筑,2014,42(6):3-10. 被引量：1
6李振阳,邱鹏,刘江亭,曹慧.基于模式识别的虚拟中医正骨手法信号分类识别[J].青岛大学医学院学报,2015,51(1):51-52. 被引量：1
7王学民,孙飞,陆小左,于志峰,周鹏.基于机械加压方式的便携式脉象采集分析系统的研究[J].传感技术学报,2016,29(11):1631-1636. 被引量：2
8张宪红,张春蕊.一种改进的细胞神经网络图像边缘提取方法[J].暨南大学学报（自然科学与医学版）,2017,38(2):178-184. 被引量：4
9阿依先木.卡得尔,邱自成.维吾尔语三音素决策树的欠拟合调优[J].塔里木大学学报,2018,30(2):98-108.
10陈超,周灵运,刘佳,魏昊,尹俊县,张佳琪,汪南玥.脉诊信息分析方法研究进展[J].中国医药导报,2018,15(23):34-36. 被引量：9

同被引文献90

1谢璟捷.地铁运营调度关键业务数据特征分析及中台架构研究[J].交通科技与管理,2023(21):22-24. 被引量：1
2李荣.汉语方言的分区[J].方言,1989(4):241-259. 被引量：150
3林艳.语词音义联系及联系机制初探[J].西南民族大学学报（人文社会科学版）,2006,27(1):219-224. 被引量：5
4林艳.语词音义联系体现了语言符号的象似性[J].现代语文（下旬．语言研究）,2009(4):13-16. 被引量：3
5卢章平,董元轲.车载导航语音界面的可用性实验研究[J].包装工程,2013,34(8):28-34. 被引量：7
6沙强,孙婷婷.次任务驾驶中智能语音交互行为体验[J].设计,2016,29(11):22-23. 被引量：4
7崔建双,刘晓婵,杨美华,李雯燕.基于元学习推荐的优化算法自动选择框架与实证分析[J].计算机应用,2017,37(4):1105-1110. 被引量：8
8王逸,李芳芳.基于自动录播教室的微课视频制作[J].软件导刊.教育技术,2017,16(8):76-78. 被引量：5
9甘蓉.基于特征点匹配的视频分割算法研究[J].微型电脑应用,2018,34(1):70-73. 被引量：1
10钱勇,刘博,张彦龙,徐鹏,张彬彬.混凝土杆河堤小型护坡多点加固砌筑法[J].农村电气化,2018(5):60-61. 被引量：2

引证文献10

1曹美琳,邵申奥,马宏琳,王义超,余思娴.AI赋能云端新形态微课制作平台的设计与实现[J].科技传播,2022,14(14):126-129. 被引量：2
2林秀丽,李均利,田竟民,程小帆.基于卷积神经网络的算法选择研究[J].四川师范大学学报（自然科学版）,2022,45(6):830-838. 被引量：8
3李乐源,韩泱泱,吴彬星.语音唤醒词的结构及发音偏好的研究[J].人类工效学,2022,28(5):56-61.
4黄弋石.沪语语音识别合成数学建模[J].数字技术与应用,2023,41(5):58-60.
5范雪扬.基于语音识别技术的在线语言交互学习系统的设计与实现[J].自动化与仪器仪表,2023(7):187-190. 被引量：3
6唐冬来,杨平,刘秋辉,黄璞,杨俏,叶鸿飞.基于全卷积网络的配电线下鱼塘垂钓识别方法[J].电子设计工程,2023,31(18):149-153.
7胡宏梅,别玉霞.一种粒子群算法在语音识别中的应用[J].电子器件,2023,46(6):1634-1639.
8朱伟.未来调度业务融入语音识别技术应用的畅想[J].管理学家,2024(11):34-36.
9李瑾辉,张国梁,苏杨,朱晓鸿,王鑫.基于深度卷积神经网络的端到端语音识别方法研究[J].自动化技术与应用,2024,43(6):55-59.
10杨艺西,武志栋,袁洲,陈思平,何宇泽.改进遗传算法的电子会议汉语语音识别方法[J].电子设计工程,2024,32(18):132-135.

二级引证文献13

1刘金飞,彭旭初,刘四华,曾宪.基于深度数据挖掘的水电能源工程数据智能分析处理算法[J].电子设计工程,2023,31(10):44-48. 被引量：2
2孙孟姣,周斌,马金辉.基于轻量化深度学习的仪表数字识别研究[J].科技创新与生产力,2023,44(7):117-121. 被引量：1
3周琪明.微课在初中信息科技人工智能教学中的应用[J].中小学电教（下）,2023(10):10-12.
4陈典超,王晨.基于语义分析的恶意JavaScript检测技术[J].电子设计工程,2023,31(22):37-41.
5王宇,祝健杨,何雨旻,刘德宏,陈军健.基于CNN的多核芯片低功耗验证系统设计[J].电子设计工程,2023,31(22):125-129.
6高学勤,伍杰华.基于特征优化与融合型神经网络的入侵检测方法[J].网络安全技术与应用,2023(11):29-31.
7郭逸凡,裴瑄,王大寒,陈培芝.Hyper-SegUNet:基于超网络的超参自学习医学图像分割模型[J].四川师范大学学报（自然科学版）,2024,47(1):127-135.
8王谢,易其鑫,沈莉.在线同伴反馈不同干预策略对学习者批判性思维影响[J].四川师范大学学报（自然科学版）,2024,47(3):328-337.
9王晓康.基于语音情感识别的智能照明控制系统的研究[J].电声技术,2024,48(2):7-9.
10闵超,崔均熠,赵超超,乔华,刘凤珠.基于非线性搜索策略的改进灰狼优化算法及其应用[J].四川师范大学学报（自然科学版）,2024,47(4):537-547.

1刘源,刘胜全,刘艳.基于多任务联合学习的入侵检测方法[J].东北师大学报（自然科学版）,2022,54(1):72-78.
2童瑶,刘磊,朱书华.含分层复合材料层板压缩剩余强度分析[J].航空计算技术,2022,52(1):110-114. 被引量：3
3张薇,罗宏翔.市场潜力的地理空间效应与经济发展——以云南省为例[J].统计与决策,2022,38(4):138-143.
4于树会.快速康复外科在多发性肋骨骨折内固定手术中的应用研究[J].益寿宝典,2021(29):164-166.

四川师范大学学报（自然科学版）

2022年第1期

浏览历史

内容加载中请稍等...

基于神经网络的中文语音识别技术被引量：10

参考文献10

二级参考文献92

共引文献78

同被引文献90

引证文献10

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于神经网络的中文语音识别技术 被引量：10

参考文献10

二级参考文献92

共引文献78

同被引文献90

引证文献10

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于神经网络的中文语音识别技术被引量：10