-
题名基于语音节奏差异的情感识别方法
- 1
-
-
作者
张家豪
章昭辉
严琦
王鹏伟
-
机构
东华大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第4期262-269,共8页
-
基金
上海市科技创新行动技术高新技术领域项目(22511100700)。
-
文摘
语音情感识别在金融反欺诈等领域有着重要的应用前景,但是语音情感识别的准确率提升变得越来越困难。现有基于语谱图的语音情感识别等方法难以捕捉节奏差异特征,从而影响识别效果。文中基于语音节奏特征的差异性,提出了能量帧时频融合的语音情感识别方法。其关键是,针对语音中高能量区域进行频谱筛选,以高能语音帧的分布和时频变化来体现个体的语音节奏差异。在此基础上建立基于卷积神经网络(CNN)和循环神经网络(RNN)的情感识别模型,实现对频谱的时域和频域变化特征的提取与融合。在公开数据集IEMOCAP上进行实验,结果表明,该基于语音节奏差异的语音情感识别与基于语谱图的方法相比,在加权准确率WA和非加权准确率UA指标上分别平均提升了1.05%和1.9%;同时也表明个体的语音节奏差异对提升语音情感识别效果具有重要作用。
-
关键词
语音情感识别
能量帧
频域谱线
时频融合
语音节奏差异
-
Keywords
Speech emotion recognition
Energy frames
Spectrum
Time-frequency fusion
Voice rhythm difference
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-