期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于注意力机制的多任务3D CNN-BLSTM情感语音识别 被引量:14
1
作者 姜特 陈志刚 万永菁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第4期534-542,共9页
语音情感识别广泛应用于车载驾驶系统、服务行业、教育以及医疗等各个领域。为了使计算机能更准确地识别出说话人的情感,提出了一种基于注意力机制的多任务三维卷积神经网络(ConvolutionNeuralNetwork,CNN)和双向长短期记忆网络(Bidirec... 语音情感识别广泛应用于车载驾驶系统、服务行业、教育以及医疗等各个领域。为了使计算机能更准确地识别出说话人的情感,提出了一种基于注意力机制的多任务三维卷积神经网络(ConvolutionNeuralNetwork,CNN)和双向长短期记忆网络(BidirectionalLong-Short Term Memory,BLSTM)相结合的情感语音识别方法(3D CNN-BLSTM)。基于多谱特征融合组图,利用三维卷积神经网络提取深层语音情感特征,结合性别分类的多任务学习机制提升语音情感识别准确率。在CASIA汉语情感语料库上的实验结果表明,该方法获得了较高的准确率。 展开更多
关键词 语音情感识别 注意力机制 多谱特征融合组图 卷积神经网络 多任务学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部