期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于CNN-DFSMN-CTC的语音识别模型
1
作者 梁宏涛 刘家旭 《计算机与数字工程》 2024年第10期2984-2990,共7页
针对现有语音识别模块在复杂环境中识别准确率较低,训练较为复杂的问题,论文提出将深度前馈序列神经网络(Deep Feedforword Sequential Memory Networks,DFSMN)和端到端的连接时序分类(Connectionist Temporal Classification,CTC)方法... 针对现有语音识别模块在复杂环境中识别准确率较低,训练较为复杂的问题,论文提出将深度前馈序列神经网络(Deep Feedforword Sequential Memory Networks,DFSMN)和端到端的连接时序分类(Connectionist Temporal Classification,CTC)方法相结合的方法对语音识别的声学模型进行改进;其次,针对现有的声学特征表示方法在深度神经网络中的表征能力较差的问题,论文在对数梅尔滤波组(Log Mel Filter-bank,Fbank)特征提取方法的基础上,利用卷积神经网络(Convolutional Neural Networks,CNN)对声学特征进行二次提取,解决了现有的声学特征表示方法在深度神经网络中的表征能力较差的问题。在Thchs-30数据集上,改进的CNN-DFSMN-CTC模型相对于CNN模型和LSTM型在测试集上的字错率(Character Error Rate,CER)分别相对降低了6.83%和7.96%。 展开更多
关键词 语音识别 DFSMN CTC CNN
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部