-
题名基于CTC-RNN的语音情感识别方法
被引量:5
- 1
-
-
作者
余华
颜丙聪
-
机构
江苏开放大学
东南大学信息科学与工程学院
-
出处
《电子器件》
CAS
北大核心
2020年第4期934-937,共4页
-
基金
国家自然科学基金项目(61673108)。
-
文摘
语音情感识别的主要目的是对语音信号按照不同的情感进行分类,比如生气、恐惧、厌恶、高兴等。探究语音情感识别的任务,使用的方法是在小的语音区间上计算的一系列声学特征训练的深度递归神经网络。同时,使用CTC损失函数考虑到了同时包含情绪化和中性成分的长话语。在IEMOCAP语料库上设置对照实验,验证了该方法的高性能。
-
关键词
递归神经网络
ctc损失函数
语音情感识别
-
Keywords
recurrent neural network
ctc loss function
Speech emotion recognition
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于神经网络的语音信号识别与分类
- 2
-
-
作者
薛雅洁
贺红霞
杨祎
-
机构
西安邮电大学电子工程学院
-
出处
《现代电子技术》
2023年第24期79-84,共6页
-
基金
西安市科技计划项目(101/203010002)。
-
文摘
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。
-
关键词
语音信号识别
深度全序列卷积神经网络
隐马尔可夫链
声学特征提取
梅尔倒谱系数
ctc损失函数
-
Keywords
speech signal recognition
deep full convolutional neural network
hidden Markov chain
acoustic feature extraction
Mel cepstrum coefficient
ctc loss function
-
分类号
TN912-34
[电子电信—通信与信息系统]
-