基于深度神经网络的语音情感识别方法被引量：13

Method of Speech Emotion Recognition Method Based on Deep Neural Networks

下载PDF

导出

摘要语音情感识别是人机交互的重要方向,可广泛应用于人机交互和呼叫中心等领域,有很大应用价值。近年来,深度神经网络在识别情感方面取得了巨大成功,但现有方法对高层语音特征提取会丢失大量原始信息并且识别准确率不高。提出了一种新的语音情感识别方法,由卷积神经网络从原始信号中提取特征;并在其堆叠一个2层长短时记忆神经网络,最终识别准确率达到91. 74%,显著优于基于柏林语音情感数据库(EMO-DB)等其他方法。 Speech emotion recognition is an important direction of human-computer interaction.It can be widely used in human-computer interaction and call center fields,and has great application value.In recent years,deep neural networks have achieved great success in recognizing emotions.However,the existing methods for high-level speech feature extraction will lose a lot of original information and the recognition accuracy is not high.A new speech emotion recognition method was proposed.The convolutional neural network extracts features from the original signal and stacks a 2-layer long-term memory neural network.The final recognition accuracy is 91.74%.This method is significantly better than other methods based on Berlin database of emotional speech(EMO-DB).

作者杨明极张家彬 YANG Ming-ji;ZHANG Jia-bin(School of Measure-control Technology and Communications Engineering,Harbin University of Science and Technology,Harbin 150080,China)

机构地区哈尔滨理工大学测控技术与通信工程学院

出处《科学技术与工程》北大核心 2019年第8期127-131,共5页 Science Technology and Engineering

关键词语音情感识别深度学习卷积神经网络长短时记忆神经网络 speech emotion recognition deep learning convolutional neural network long short term memory network

分类号 TN912.34 [电子电信—通信与信息系统] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1张雪英,孙颖,张卫,畅江.语音情感识别的关键技术[J].太原理工大学学报,2015,46(6):629-636 643. 被引量：18
2尹文昊.基于卷积神经网络的语音情感识别研究[J].科技创新与应用,2018,8(13):40-41. 被引量：2
3韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
4陶勇森,王坤侠,杨静,李廉.融合信息增益与和声搜索的语音情感特征选择[J].小型微型计算机系统,2017,38(5):1164-1168. 被引量：7
5查诚,陶华伟,张昕然,周琳,赵力,杨平.A novel speech emotion recognition algorithm based on combination of emotion data field and ant colony search strategy[J].Journal of Southeast University(English Edition),2016,32(2):158-163. 被引量：3
6赵涓涓,马瑞良,张小龙.基于决策树和改进SVM混合模型的语音情感识别[J].北京理工大学学报,2017,37(4):386-390. 被引量：16

二级参考文献58

1赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
2蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：38
3王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
4淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：83
5林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007,12(1):90-98. 被引量：33
6张石清.基于模糊支持向量机的语音情感识别[J].台州学院学报,2006,28(6):52-55. 被引量：3
7徐燕,李锦涛,王斌,孙春明.基于区分类别能力的高性能特征选择方法[J].软件学报,2008(1):82-89. 被引量：83
8高维深.基于HMM/ANN混合模型的非特定人语音识别研究[D].电子科技大学2013
9尤鸣宇.语音情感识别的关键技术研究[D].浙江大学2007
10郅菲菲.字词认知N170成分发展的人工语言训练研究[D].浙江师范大学2013

共引文献57

1韩文静,李海峰.基于韵律语段的语音情感识别方法研究[J].清华大学学报（自然科学版）,2009(S1):1363-1368. 被引量：8
2陆捷荣,詹永照,毛启容.基于D-S证据的多语段融合语音情感识别[J].计算机工程,2010,36(18):205-207. 被引量：3
3黄程韦,赵艳,金赟,于寅骅,赵力.实用语音情感的特征分析与识别的研究[J].电子与信息学报,2011,33(1):112-116. 被引量：33
4屠彬彬,于凤芹.基于样本熵与MFCC融合的语音情感识别[J].计算机工程,2012,38(7):142-144. 被引量：7
5屠彬彬,于凤芹.基于EMD的改进MFCC的语音情感识别[J].计算机工程与应用,2012,48(18):119-122. 被引量：6
6张石清,李乐民,赵知劲.人机交互中的语音情感识别研究进展[J].电路与系统学报,2013,18(2):440-451. 被引量：30
7张卫,张雪英,孙颖.EMD结合Teager能量用于语音情感识别[J].科学技术与工程,2013,21(24):7240-7243. 被引量：5
8魏平杰,樊兴华.语音倾向性分析中的特征抽取研究[J].计算机应用研究,2014,31(12):3580-3583. 被引量：1
9金赟,宋鹏,郑文明,赵力.半监督判别分析的跨库语音情感识别[J].声学学报,2015,40(1):20-27. 被引量：6
10杜昭慧,司玉娟.基于层次支持向量机的脉搏信号情感识别[J].吉林大学学报（信息科学版）,2017,35(1):37-42. 被引量：7

同被引文献167

1单悦影,祁凯.网络社群网民情绪感染研究综述[J].新媒体研究,2022,8(18):6-9. 被引量：2
2周鑫,田兵,许爱东,张斌,黄伟,魏文潇,于力,董旭柱.基于CYMDIST的配电网运行优化技术及算例分析[J].电网与清洁能源,2015,31(2):91-97. 被引量：21
3马得勇,张蕾.测量治理:国外的研究及其对中国的启示[J].公共管理学报,2008,5(4):101-108. 被引量：35
4张永皋,赵庆国,马青玉.语音情感在教育中的应用探究[J].软件导刊.教育技术,2009,8(3):77-78. 被引量：1
5陈超美（著）,陈悦（译）,侯剑华（译）,梁永霞（译）.CiteSpaceⅡ：科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,28(3):401-421. 被引量：1392
6芦何秋,杨泽亚.公共事件中微博意见领袖的话语策略与文本框架——基于新浪微博的实证研究[J].湖北大学学报（哲学社会科学版）,2013,40(5):142-147. 被引量：11
7谷川,周宏宇,于江德.融合多特征的中文产品命名实体识别[J].科学技术与工程,2013,21(31):9417-9421. 被引量：7
8韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：169
9赵大海,胡伟.中国大城市公共服务公众满意度的测评与政策建议[J].上海行政学院学报,2014,15(1):23-29. 被引量：33
10李高玲,帖云,齐林.基于随机森林分类优化的多特征语音情感识别[J].微电子学与计算机,2019,36(1):70-73. 被引量：12

引证文献13

1李鹤,冉妮,王蔚.基于知识图谱的语音情感识别研究分析[J].计算机技术与发展,2020,30(6):135-140. 被引量：2
2高英宁,崔艳荣,孙存威.生成对抗网络下小样本语音情感识别方法[J].计算机工程与设计,2020,41(12):3550-3556. 被引量：2
3王静,刘洪岩,刘芳芳,王青青.基于随机森林和卷积特征学习的人机交互语音情感识别[J].系统仿真学报,2020,32(12):2388-2400. 被引量：3
4姜同强,王岚熙.基于双向编码器表示模型和注意力机制的食品安全命名实体识别[J].科学技术与工程,2021,21(3):1103-1108. 被引量：12
5朱龙珠,田诺,张全.基于语义分析的语音情感在线识别方法研究[J].电子设计工程,2021,29(11):151-154. 被引量：1
6秦浩,赵永生,江和顺,梅战旗,魏希文,吴少雄.基于NLP技术实现停电原因智能分析的方法[J].计算技术与自动化,2021,40(2):81-85.
7孙颖,马浩杰,张雪英.PAD维度下的深度情感关联模型研究[J].电子设计工程,2022,30(7):47-52.
8汪兰兰,蔡昌新.基于改进线性预测基音频率的语音情感识别系统[J].科学技术与工程,2022,22(26):11524-11532. 被引量：4
9吴志游,付晓峰.结合TCN和双向GRU的多模态融合情感空间标注[J].工业控制计算机,2023,36(4):109-111. 被引量：1
10张英杰,谢云.基于CNN-LSTM的脑电情感四分类研究[J].科学技术与工程,2023,23(24):10437-10444. 被引量：3

二级引证文献28

1王凯平,吴昊龙,王兴宇.多媒体技术在邮轮导识设计中的应用[J].设计艺术研究,2020(3):41-46. 被引量：1
2杨泉.基于随机森林的N1+N2结构语法关系判定方法研究[J].重庆理工大学学报（自然科学）,2021,35(7):125-130. 被引量：5
3邹蕾,崔斌,樊超,孙豫峰.基于双向编码文本摘要-长短期记忆-注意力的检察建议文本自动生成模型[J].科学技术与工程,2021,21(25):10780-10788. 被引量：9
4沈同平,俞磊,金力,黄方亮,许欢庆.基于BERT-BiLSTM-CRF模型的中文实体识别研究[J].齐齐哈尔大学学报（自然科学版）,2022,38(1):26-32. 被引量：9
5侯启真,袁天一,王罗平.机场不正常事件实体检测与识别方法研究[J].计算机测量与控制,2022,30(7):62-69. 被引量：2
6李娅,马琳.基于语音识别的日语机器翻译系统设计[J].自动化与仪器仪表,2022(7):229-232. 被引量：1
7李洋,蔡红珍,邢林林,苏展鹏.基于对抗迁移的复合材料检测领域命名实体识别[J].科学技术与工程,2022,22(30):13370-13377. 被引量：1
8房小绵.基于语音识别的英语智能对话机器人人机交互系统设计[J].自动化与仪器仪表,2023(4):225-228. 被引量：6
9刘浩,张建业,吕张成,陈哲钥.面向数控机床设计知识图谱构建的实体识别[J].科学技术与工程,2023,23(13):5655-5661. 被引量：3
10林松,孙连山,赵娟宁,吴彦锦.基于生成对抗网络的小样本颜色空间转换方法[J].包装工程,2023,44(11):309-316. 被引量：1

1罗相林,秦雪佩,贾年.基于MFCC及其一阶差分特征的语音情感识别研究[J].现代计算机,2019,25(11):20-24. 被引量：6
2缪裕青,邹巍,刘同来,周明,蔡国永.基于参数迁移和卷积循环神经网络的语音情感识别[J].计算机工程与应用,2019,55(10):135-140. 被引量：30
3Tashpolat Nizamidin,Zhao Li,Zhang Mingyang,Xu Xinzhou,Askar Hamdulla.Emotion recognition of Uyghur speech using uncertain linear discriminant analysis[J].Journal of Southeast University(English Edition),2017,33(4):437-443.
4王静一,靳乔乔,赵豪越,陈思琪.基于数据挖掘技术的语音情感识别[J].数码世界,2019,0(2):42-42.
5金升菊.基于层次集成稀疏表示在语音感情计算中的应用[J].福建电脑,2018,34(9):55-56.
6刘振焘,徐建平,吴敏,曹卫华,陈略峰,丁学文,郝曼,谢桥.语音情感特征提取及其降维方法综述[J].计算机学报,2018,41(12):2833-2851. 被引量：30
7李婉玲,张秋菊.基于HMM/SVM的抗噪语音特征提取及优化[J].传感器与微系统,2019,38(4):55-58. 被引量：9
8金升菊.基于稀疏表示的语音感情计算研究[J].电脑知识与技术,2018,14(9Z):171-172.
9赵荣珍,李霁蒲,邓林峰.EWT多尺度排列熵与GG聚类的轴承故障辨识方法[J].振动．测试与诊断,2019,39(2):416-423. 被引量：19
10刘鑫,滕欢,梁梦可,滕德云.奇异值差分谱理论及其在行波固有频率提取中的应用[J].电测与仪表,2019,56(9):8-14. 被引量：1

科学技术与工程

2019年第8期

浏览历史

内容加载中请稍等...

基于深度神经网络的语音情感识别方法被引量：13

参考文献6

二级参考文献58

共引文献57

同被引文献167

引证文献13

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于深度神经网络的语音情感识别方法 被引量：13

参考文献6

二级参考文献58

共引文献57

同被引文献167

引证文献13

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于深度神经网络的语音情感识别方法被引量：13