期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于CNN-BGRU的音素识别研究 被引量:1
1
作者 和丽华 江涛 +1 位作者 潘文林 杨皓然 《云南民族大学学报(自然科学版)》 CAS 2020年第5期493-500,共8页
音素是一个语言体系中最小的语音单位,音素识别在大词汇语音识别任务中不受词汇和语句的限制.因此,选择音素作为识别单元,建立基于CNN-BGRU的神经网络模型,实现音素语谱图的分类.首先,使用短时傅里叶变换生成音素语谱图作为模型的输入;... 音素是一个语言体系中最小的语音单位,音素识别在大词汇语音识别任务中不受词汇和语句的限制.因此,选择音素作为识别单元,建立基于CNN-BGRU的神经网络模型,实现音素语谱图的分类.首先,使用短时傅里叶变换生成音素语谱图作为模型的输入;其次建立CNN-BGRU模型,利用改进的VGGNet模型提取音素语谱图的特征,再使用双向门控循环单元(BGRU)实现音素语谱图的序列信息表示;最后,通过Softmax分类器实现音素语谱图的分类.实验使用TIMIT英语语音数据集进行音素语谱图识别,准确率达到98.6%,优于CNN(VGG16)、CNN-RNN、CNN-BRNN、CNN-BLSTM这4个模型. 展开更多
关键词 音素识别 卷积神经网络 双向门循环机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部