基于神经网络的语音信号识别与分类

Speech signal recognition and classification based on neural network

下载PDF

导出

摘要针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。 End to end speech recognition technology based on deep neural network is researched,an end-to-end speech recognition system is built by means of the deep full convolutional neural network(DFCNN)acoustic model and Transformer language model.This system can complete the training of models and data,and realize the recognition of multi-character Chinese speech.The difficulty,principle differences,and recognition accuracy of system construction between hidden Markov speech recognition methods and deep neural network speech recognition methods are compared.The simulation results show that the proposed method can complete the effective recognition of continuous multi-character Chinese speech,and the recognition accuracy is more than 90%.

作者薛雅洁贺红霞杨祎 XUE Yajie;HE Hongxia;YANG Yi(School of Communication and Information Engineering,Xi’an University of Posts and Telecommunications,Xi’an 710061,China)

机构地区西安邮电大学电子工程学院

出处《现代电子技术》 2023年第24期79-84,共6页 Modern Electronics Technique

基金西安市科技计划项目(101/203010002)。

关键词语音信号识别深度全序列卷积神经网络隐马尔可夫链声学特征提取梅尔倒谱系数 CTC损失函数 speech signal recognition deep full convolutional neural network hidden Markov chain acoustic feature extraction Mel cepstrum coefficient CTC loss function

分类号 TN912-34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1谭磊,余欣洋,罗伟洋,曾维,代云强.基于深度学习的移动端语音识别系统设计[J].单片机与嵌入式系统应用,2020,20(9):28-31. 被引量：10
2王若平,房宇,陈达亮,王东,李仁仁,曾发林.基于小波包FBank图谱与CNN的车内异响识别研究[J].重庆理工大学学报（自然科学）,2020,34(7):1-9. 被引量：3
3刘颖,艾豪,张伟东.基于深度学习的多模态情感识别综述[J].西安邮电大学学报,2022,27(1):60-71. 被引量：2
4卢丽萌.基于微信号增强的机器人远距离语音识别仿真[J].辽宁大学学报（自然科学版）,2023,50(1):38-44. 被引量：1
5刘伟波,曾庆宁,卜玉婷,郑展恒.基于双微阵列与卷积神经网络的语音识别方法[J].计算机应用,2019,39(11):3268-3273. 被引量：12
6赵力瑾,高攀.基于连续隐马尔科夫模型的英语翻译机器人语音识别系统[J].自动化与仪器仪表,2022(6):191-194. 被引量：8
7刘尚旺,王培哲,张翰林,涂婉宇.人机交互系统多维语音信息识别方法[J].计算机仿真,2021,38(12):367-370. 被引量：3

二级参考文献53

1胡希颖,王大东,陈佳欣.基于NAO机器人的BLSTM-CTC的声学模型研究[J].智能计算机与应用,2021,11(3):76-79. 被引量：1
2施荣华,孟秋杰,董健,郭迎.一种基于对角载入的鲁棒MVDR波束形成算法[J].湖南大学学报（自然科学版）,2012,39(9):57-61. 被引量：3
3黄志钢,宋春雷,宋玉,吴庆涛.基于音频信号的汽车状态与故障分析[J].沈阳理工大学学报,2012,31(5):14-19. 被引量：4
4陈紫强,李欣阳,谢跃雷.结合相位谱补偿的调制域谱减法[J].信号处理,2015,31(4):468-473. 被引量：9
5孙凌云,何博伟,刘征,杨智渊.基于语义细胞的语音情感识别[J].浙江大学学报（工学版）,2015,49(6):1001-1008. 被引量：2
6张晴晴,刘勇,潘接林,颜永红.基于卷积神经网络的连续语音识别[J].工程科学学报,2015,37(9):1212-1217. 被引量：68
7莫媛媛,郭剑毅,余正涛,毛存礼,牛翊童.基于深层神经网络(DNN)的汉-越双语词语对齐方法[J].山东大学学报（理学版）,2016,51(1):77-83. 被引量：3
8黄威,石佳影.基于深度神经网络的语音识别研究[J].现代计算机,2016,22(5):20-25. 被引量：4
9邢安昊,张鹏远,潘接林,颜永红.基于SVD的DNN裁剪方法和重训练[J].清华大学学报（自然科学版）,2016,56(7):772-776. 被引量：3
10马金龙,曾庆宁,龙超,谢先明.多噪声环境下可懂度提升的助听器语音增强[J].计算机工程与设计,2016,37(8):2160-2164. 被引量：5

共引文献32

1付孟新,郭世伟,王泽兴,丁建明.基于一维卷积神经网络的列车异响识别系统研究[J].电子测量技术,2023,46(14):9-17.
2邓家斌.智能趣味陪护机器人系统设计[J].科学大众（科技创新）,2019,0(11):125-125.
3张国荣,刘炳君,付成丽.基于Python和CNN的数字验证码识别[J].太原师范学院学报（自然科学版）,2020,19(3):62-65. 被引量：5
4孙伟,李文俊,雷晖.一种基于树莓派的智能无线监控系统[J].电脑知识与技术,2021,17(1):61-62. 被引量：2
5陈林,洪志云.语音家电全双工对话技术测试方法研究[J].日用电器,2021(1):58-64. 被引量：1
6江昱欣,张红兵.语音信号增强技术在语音识别中的应用[J].电子技术与软件工程,2021(6):70-71. 被引量：2
7李银树.基于视觉识别的机器人音频多模态情感识别系统设计[J].自动化与仪器仪表,2021(5):212-215.
8徐浩,刘岳镭.基于深度学习的无人机声音识别算法[J].计算机科学,2021,48(7):225-232. 被引量：4
9刘红梅.基于音频指纹技术的乐曲节拍识别系统[J].微型电脑应用,2021,37(7):137-139. 被引量：1
10杜青,冯芳.基于树莓派的智能陪护机器人的设计[J].信息技术,2021,45(7):78-83. 被引量：2

1廖干洲.压缩神经网络在交通标志识别上的应用[J].中国科技信息,2023(23):77-80.
2张奇,笪良龙,王超,张延厚,禚江浩.基于深度学习的水声被动目标识别研究综述[J].电子与信息学报,2023,45(11):4190-4202.
3李文全,李梦琪,李晓琳,廖晓梦.突发公共卫生事件中应急物资配送服务效能提升标准化研究——以新冠疫情调研数据为样本[J].标准科学,2023(12):54-60.
4季坤,张晨晨,丁国成,刘锋,田宇,李坚林.粒子群优化算法在电力变压器声纹识别中的应用[J].沈阳工业大学学报,2023,45(6):643-648.
5陈基,王水兴,孔佰祥,陈树泓,赵少添,吴凌伟.崇仁麻鸡mtDNA D-loop区遗传结构与遗传多样性分析[J].中国家禽,2023,45(12):108-112.
6徐科,姚凌云,姚静怡,姚敦辉.基于改进VGG-16网络的交通声音事件分类方法研究[J].西南大学学报(自然科学版),2023,45(12):145-156.
7张清泓,吴中,邢玎.2023成都大运会跆拳道比赛音频公共信号制作分析[J].现代电视技术,2023(9):81-83.
8徐银波,姚树青,罗晓玲,毕彩芹.新疆三塘湖盆地石头梅地区芦草沟组油页岩测井响应特征及识别模型[J].地质通报,2023,42(11):1808-1817. 被引量：1
9杨启城,陈菊,杨涛,周一博,樊霞霞,李阳,温川飙.基于物联网的中医居家健康系统搭建[J].世界科学技术-中医药现代化,2023,25(5):1597-1607. 被引量：3
10梁瑾,陈宇飞,鲁少虎,陶雨晨,刘超,王洋.建筑工程全生命周期管理(PLM)平台应用——以湖北省疾病预防控制中心项目为例[J].绿色建造与智能建筑,2023(11):48-51.

现代电子技术

2023年第24期

浏览历史

内容加载中请稍等...

基于神经网络的语音信号识别与分类

参考文献7

二级参考文献53

共引文献32

相关作者

相关机构

相关主题

浏览历史