生成对抗网络下小样本语音情感识别方法被引量：1

Speech emotion recognition method of small sample based on generative adversarial networks

下载PDF

导出

摘要为解决小样本下语音情感识别准确度低的问题,提出一种生成对抗网络模型下的小样本语音情感识别方法。使用生成器和判别器对抗训练学习样本特征,利用生成器生成高质量的模拟样本以扩充数据集;迁移判别器参数到情感识别网络,加快网络训练速度;连接长短时记忆网络(LSTM),进一步提取时序情感特征,提高情感识别率;选用德语语音库(EMODB)的535条语音样本进行训练、测试,其结果表明,与传统的语音情感识别方法、卷积神经网络(CNN)、CNN-LSTM相比,该方法将语音情感识别率提高了4.54%-25.31%,验证了该方法的有效性。 To solve the problem of low speech emotion recognition rate under small samples,a method of small sample speech emotion recognition based on generative adversarial networks was proposed.Generators and discriminators were used to learn sample features in combat and generators were used to generate high quality simulation samples to augment the data set.The discriminator model parameters were migrated to speed up the model training.The long short-term memory neural network(LSTM)was connected to further extract temporal emotion features and improve the emotion recognition rate.The 535 speech samples of the German speech library(EMODB)were used for training and testing.Results show that the proposed method is compared with traditional speech emotion recognition method,convolutional neural network(CNN),and CNN-LSTM,its emotion recognition rate is increased by 4.54%-25.31%,which verifies the effectiveness of the proposed method.

作者高英宁崔艳荣孙存威 GAO Ying-ning;CUI Yan-rong;SUN Cun-wei(School of Computer Science,Yangtze River University,Jingzhou 434023,China;School of Computer Science and Engineering,University of Electronic Science and Technology,Chengdu 611731,China)

机构地区长江大学计算机科学学院电子科技大学计算机科学与工程学院

出处《计算机工程与设计》北大核心 2020年第12期3550-3556,共7页 Computer Engineering and Design

关键词生成对抗网络语音情感识别小样本数据增强长短时记忆网络迁移学习 generative adversarial networks speech emotion recognition small sample data augmentation long short-term memory networks transfer learning

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1曹仰杰,贾丽丽,陈永霞,林楠,李学相.生成式对抗网络及其计算机视觉应用研究综述[J].中国图象图形学报,2018,23(10):1433-1449. 被引量：65
2王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃.生成式对抗网络GAN的研究进展与展望[J].自动化学报,2017,43(3):321-332. 被引量：317
3韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：167
4李靓,孙存威,谢凯,贺建飚.基于深度学习的小样本声纹识别方法[J].计算机工程,2019,45(3):262-267. 被引量：17
5舒帆,屈丹,张文林,周利莉,郭武.采用长短时记忆网络的低资源语音识别方法[J].西安交通大学学报,2017,51(10):120-127. 被引量：20
6卢官明,袁亮,杨文娟,闫静杰,李海波.基于长短期记忆和卷积神经网络的语音情感识别[J].南京邮电大学学报（自然科学版）,2018,38(5):63-69. 被引量：23
7杨明极,张家彬.基于深度神经网络的语音情感识别方法[J].科学技术与工程,2019,19(8):127-131. 被引量：11

二级参考文献108

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：322
3王飞跃.计算实验方法与复杂系统行为分析和决策评估[J].系统仿真学报,2004,16(5):893-897. 被引量：147
4王飞跃.关于复杂系统的建模、分析、控制和管理[J].复杂系统与复杂性科学,2006,3(2):26-34. 被引量：63
5van Bezooijen R,Otto SA,Heenan TA. Recognition of vocal expressions of emotion:A three-nation study to identify universal characteristics[J].{H}JOURNAL OF CROSS-CULTURAL PSYCHOLOGY,1983,(04):387-406.
6Tolkmitt FJ,Scherer KR. Effect of experimentally induced stress on vocal parameters[J].Journal of Experimental Psychology Human Perception Performance,1986,(03):302-313.
7Cahn JE. The generation of affect in synthesized speech[J].Journal of the American Voice Input/Output Society,1990.1-19.
8Moriyama T,Ozawa S. Emotion recognition and synthesis system on speech[A].Florence:IEEE Computer Society,1999.840-844.
9Cowie R,Douglas-Cowie E,Savvidou S,McMahon E,Sawey M,Schro. Feeltrace:An instrument for recording perceived emotion in real time[A].Belfast:ISCA,2000.19-24.
10Grimm M,Kroschel K. Evaluation of natural emotions using self assessment manikins[A].Cancun,2005.381-385.

共引文献596

1卫星,杨国强,李佳,陆阳,石雷.结合多尺度条件生成对抗网络的井下轨道检测[J].中国图象图形学报,2020,25(2):282-293. 被引量：2
2郑成杰,郑之.基于最大分类器差异域适应方法的3维点云分类[J].信息与控制,2023,52(5):588-597.
3熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：1
4宁宁,金鑫,张晓昆,李艳楠.基于GAN的人脸图像光照迁移[J].北京电子科技学院学报,2019(4):33-41.
5于德山.人工智能时代的视觉真相及其反思[J].社会科学战线,2020(1):224-233. 被引量：3
6罗国强,梁奂晖,方斌.计算机视觉结构组成分析与应用途径研究[J].计算机产品与流通,2020,0(3):13-13.
7李可,祁阳,宿磊,顾杰斐,苏文胜.基于改进ACGAN的钢表面缺陷视觉检测方法[J].机械工程学报,2022,58(24):32-40. 被引量：2
8宋宇,李治霖,程超.基于CNN-BILSTM的工业控制系统ARP攻击入侵检测方法[J].计算机应用研究,2020,37(S02):242-244. 被引量：10
9支双双,赵庆会,金大海,唐琎.基于CNN和DLTL的步态虚拟样本生成方法[J].计算机应用研究,2020,37(1):291-295. 被引量：1
10张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2

同被引文献6

1孙秀如,林志定,张家英,林仲贤,荆其诚.中国人眼对非彩色系表色色差辨别的实验研究[J].心理学报,1995,27(3):231-240. 被引量：7
2洪亮,李予,楚高利,王娜.RBF神经网络在显示器色空间转换中的应用[J].包装工程,2014,35(23):134-137. 被引量：1
3万泽慧.图像再现中合理运用色彩管理的方法探析[J].无线互联科技,2016,13(3):83-85. 被引量：1
4疏颖,毛龙彪,陈思,严严.结合自监督学习和生成对抗网络的小样本人脸属性识别[J].中国图象图形学报,2020,25(11):2391-2403. 被引量：8
5杨金锴,李鹏飞,苏泽斌,景军锋.基于改进极限学习机的数码印花颜色空间转换方法[J].激光与光电子学进展,2021,58(5):335-340. 被引量：2
6于浩洋,尹良,李书芳,吕顺.生成对抗网络小样本雷达调制信号识别算法[J].西安电子科技大学学报,2021,48(6):96-104. 被引量：7

引证文献1

1林松,孙连山,赵娟宁,吴彦锦.基于生成对抗网络的小样本颜色空间转换方法[J].包装工程,2023,44(11):309-316. 被引量：1

二级引证文献1

1李学深,朱勇.基于机器视觉的织物色差检测方法研究进展[J].毛纺科技,2024,52(5):134-141.

1吴俊清,倪建成,魏媛媛.语音情感识别中面向小数据集的CGRU方法[J].计算机技术与发展,2020,30(12):77-82. 被引量：1
2李彦艳,张建伟.论祁韵士西域纪行诗[J].名作欣赏（学术版）（下旬）,2020(12):29-32.
3刘文开,伍俊谦,焦飞.基于语音识别的智慧教室构建与探讨[J].电脑知识与技术,2020,16(33):182-184. 被引量：2
4纪雪梅,翟冉冉,王芳.突发公共事件政务微博回应方式对公众评论情感的影响研究[J].情报理论与实践,2020,43(12):126-132. 被引量：19
5龙曼仪,李茂军,张辉,刘芾.基于轻量型卷积神经网络的交通标志识别[J].计算技术与自动化,2020,39(4):112-118. 被引量：4
6杨志坚,陈曦,杨辽,王伟胜,曹强.遥感时序光谱重构的耕地信息提取方法[J].测绘科学,2020,45(11):59-67. 被引量：3
7林济铿,任怡睿,闪鑫,李俊,翟明玉,王波.基于Logistic回归深层神经网络的电力系统故障概率诊断[J].天津大学学报（自然科学与工程技术版）,2021,54(2):186-195. 被引量：16

计算机工程与设计

2020年第12期

浏览历史

内容加载中请稍等...

生成对抗网络下小样本语音情感识别方法被引量：1

参考文献7

二级参考文献108

共引文献596

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

生成对抗网络下小样本语音情感识别方法 被引量：1

参考文献7

二级参考文献108

共引文献596

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

生成对抗网络下小样本语音情感识别方法被引量：1