-
题名基于CNN-BGRU的音素识别研究
被引量:1
- 1
-
-
作者
和丽华
江涛
潘文林
杨皓然
-
机构
云南民族大学数学与计算机科学学院
-
出处
《云南民族大学学报(自然科学版)》
CAS
2020年第5期493-500,共8页
-
基金
国家自然科学基金(61363022)。
-
文摘
音素是一个语言体系中最小的语音单位,音素识别在大词汇语音识别任务中不受词汇和语句的限制.因此,选择音素作为识别单元,建立基于CNN-BGRU的神经网络模型,实现音素语谱图的分类.首先,使用短时傅里叶变换生成音素语谱图作为模型的输入;其次建立CNN-BGRU模型,利用改进的VGGNet模型提取音素语谱图的特征,再使用双向门控循环单元(BGRU)实现音素语谱图的序列信息表示;最后,通过Softmax分类器实现音素语谱图的分类.实验使用TIMIT英语语音数据集进行音素语谱图识别,准确率达到98.6%,优于CNN(VGG16)、CNN-RNN、CNN-BRNN、CNN-BLSTM这4个模型.
-
关键词
音素识别
卷积神经网络
双向门循环机制
-
Keywords
phoneme recognition
convolutional neural network
BGRU
-
分类号
TN912.34
[电子电信—通信与信息系统]
-