基于CTC-RNN的语音情感识别方法被引量：5

Speech Emotion Recognition Based on CTC-RNN

下载PDF

导出

摘要语音情感识别的主要目的是对语音信号按照不同的情感进行分类,比如生气、恐惧、厌恶、高兴等。探究语音情感识别的任务,使用的方法是在小的语音区间上计算的一系列声学特征训练的深度递归神经网络。同时,使用CTC损失函数考虑到了同时包含情绪化和中性成分的长话语。在IEMOCAP语料库上设置对照实验,验证了该方法的高性能。 The main purpose of speech emotion recognition is to classify speech signals according to different emotions,such as anger,fear,disgust,and happiness.In this paper the task of emotion recognition from speech is considered.Proposed approach uses deep recurrent neural network trained on a sequence of acoustic features calculated over small speech intervals.At the same time CTC loss function allows to consider long utterances containing both emotional and neutral parts.A control experiment was set up on the IEMOCAP Corpus to verify high performance of the method.

作者余华颜丙聪 YU Hua;YAN Bingcong(Jiangsu Open University,Nanjing 210065,China;School of Information Engineering,Southeast University,Nanjing Jiangsu 210096,China)

机构地区江苏开放大学东南大学信息科学与工程学院

出处《电子器件》 CAS 北大核心 2020年第4期934-937,共4页 Chinese Journal of Electron Devices

基金国家自然科学基金项目(61673108)。

关键词递归神经网络 CTC损失函数语音情感识别 recurrent neural network CTC loss function Speech emotion recognition

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献43

1刘晓.一种基于Vue的云管理平台前端优化方法[J].冶金自动化,2022,46(S01):214-218. 被引量：2
2周楠,艾剑良.基于HMM和RNN的无人机语音控制方案与仿真研究[J].系统仿真学报,2020,32(3):464-471. 被引量：12
3郭龙银,扎西多吉,尚慧杰,旦增.基于LSTM的藏语语音识别[J].电脑知识与技术,2020,0(4):154-155. 被引量：2
4万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：58
5李康顺,李凯,张文生.一种基于改进BP神经网络的PCA人脸识别算法[J].计算机应用与软件,2014,31(1):158-161. 被引量：50
6董春娇,邵春福,周雪梅,孟梦,诸葛承祥.基于交通流参数相关的阻塞流短时预测卡尔曼滤波算法[J].东南大学学报（自然科学版）,2014,44(2):413-419. 被引量：16
7邱敦国,兰时勇,杨红雨.基于时空特性的短时交通流预测模型[J].华南理工大学学报（自然科学版）,2014,42(7):49-54. 被引量：11
8陈闯,RYAD Chellali,邢尹.改进GWO优化SVM的语音情感识别研究[J].计算机工程与应用,2018,54(16):113-118. 被引量：12
9曾润华,张树群.改进卷积神经网络的语音情感识别方法[J].应用科学学报,2018,36(5):837-844. 被引量：12
10李慧,奚园园,马宇鑫,张瑞梅.融合PCA和ESN的交通流周期预测模型[J].西安电子科技大学学报,2019,46(1):20-26. 被引量：4

引证文献5

1乔栋,陈章进,邓良,屠程力.基于改进语音处理的卷积神经网络中文语音情感识别方法[J].计算机工程,2022,48(2):281-290. 被引量：14
2杨磊,赵红东,于快快.基于多头注意力机制的端到端语音情感识别[J].计算机应用,2022,42(6):1869-1875. 被引量：1
3侯越,崔菡珂,邓志远.横向相关性及参数影响下的车道级交通预测[J].公路交通科技,2022,39(5):122-130.
4邵武,李岩,于蛟.刑事案件现场移动勘查系统研究[J].辽宁警察学院学报,2024,26(1):89-93. 被引量：1
5崔丽霞,许利显.基于Bi LSTM-CTC的语音识别系统研究[J].自动化与仪器仪表,2023(10):90-94.

二级引证文献16

1孙俊东,刘喜,佘长超,刘思哲,王兆飞,于洋.基于IFA-CNN的新能源矿卡锂离子电池健康状态估算[J].煤炭工程,2023,55(S01):162-168.
2张会云,黄鹤鸣.基于异构并行神经网络的语音情感识别[J].计算机工程,2022,48(4):113-118. 被引量：9
3梁科晋,张海军,刘雅情,张昱,王月阳.混合多尺度卷积结合双层LSTM语音情感识别[J].计算机与现代化,2023(1):63-68.
4崔晨露,崔琳.面向数据增强的轻量化语音情感识别[J].计算机与现代化,2023(4):83-89. 被引量：2
5郭艳霞,金勇,唐宏,彭金枝.基于动态卷积与残差门控的多模态情感识别[J].计算机工程,2023,49(7):94-101.
6李凯,任炳昱,王佳俊,关涛,余佳.基于CEEMDAN-Transformer的灌浆流量混合预测模型[J].水利学报,2023,54(7):806-817. 被引量：2
7李可.面向语言对话场景的智能语音交互关键技术研究[J].自动化与仪器仪表,2023(8):295-299. 被引量：1
8包善书,车波,邓林红.基于双源域迁移学习的肺音信号识别[J].计算机工程,2023,49(9):295-302. 被引量：1
9叶汉民,李志波,程小辉,陶小梅.基于注意力机制的稀疏化剪枝方法[J].计算机工程与设计,2023,44(12):3642-3648.
10姚鑫.基于语音识别的多模态人机交互系统关键技术研究[J].自动化与仪器仪表,2023(11):222-225. 被引量：2

1刘文军,郭志民,吴春明,阮伟,周伯阳,周宁,吕卓.基于深度学习的配电网无线通信入侵检测系统[J].电子学报,2020,48(8):1538-1544. 被引量：14
2张标标,吴俊宏,马仕强,柯飚挺.基于LSTM递归神经网络医院门诊量预测方法[J].自动化应用,2020(7):91-92.
3刘宗宝,谭智敏,张力,李之乾,张琨.基于深度卷积神经网络的可见光舰船目标识别系统[J].舰船电子工程,2020,40(8):102-106. 被引量：1

电子器件

2020年第4期

浏览历史

内容加载中请稍等...

基于CTC-RNN的语音情感识别方法被引量：5

同被引文献43

引证文献5

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于CTC-RNN的语音情感识别方法 被引量：5

同被引文献43

引证文献5

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于CTC-RNN的语音情感识别方法被引量：5