摘要
语音情感识别(speech emotion recognition,SER)是人机交互的重要组成部分,具有着非常广泛的研究和应用价值,可是在藏语语音情感识别领域的研究成果却不多。为了研究藏语SER领域,在构建了一个有着六千条拉萨话方言的藏语情感语音数据库TSED基础上,提出一种以MFCC特征和谱对比度特征相结合的双向GRU情感识别模型,通过对比不同实验的识别效果,用于判断模型的可行性。最后的实验结果表明,所提出的模型在藏语语音情感识别中可以达到87.22%的识别效果。
作者
蔡优新
边巴旺堆
CAI Youxin;BIANBA Wangdui
出处
《信息技术与信息化》
2023年第10期209-213,共5页
Information Technology and Informatization