基于特征迁移学习方法的跨库语音情感识别被引量：13

Cross-corpus speech emotion recognition based on a feature transfer learning method

导出

摘要在实际语音情感识别系统中,训练语音和测试语音往往来自不同的语料库,识别率下降显著。针对这一问题,该文提出一种有效的基于特征迁移学习的跨库语音情感识别方法。引入最大均值差异（maximum mean discrepancy,MMD）来描述不同数据库情感特征分布之间的相似度,并通过最大均值差异嵌入（maximum mean discrepancy embedding,MMDE）算法及特征降维算法来寻找二者之间的邻近低维特征空间,并在此低维空间中训练得到情感分类器用于情感识别。同时为了更好地保证情感信息的类别区分度,进一步引入半监督判别分析（semi-supervised discriminant analysis,SDA）方法用于特征降维。最后在2个经典语音情感数据库上对提出的方法进行实验评价,实验结果表明：提出的方法可以有效提高跨库条件下的语音情感识别率。 Speech emotion recognition systems offen use training data and testing data from different corpora, so the recognition rates decrease drastically. This paper presents a feature transfer learning method for cross-corpora speech emotion recognition. The maximum mean discrepancy （MMD） is used to describe the similarities between the emotional feature distributions of the different corpora, then the latent close low dimensional feature space is obtained via the maximum mean discrepancy embedding （MMDE） and dimension reduction algorithms, with the classifiers then trained in this space for emotion recognition. A semi supervised discriminative analysis （SDA） algorithm is further used for dimension reduction to better ensure the class discrimination of the emotional features. Tests on two popular speech emotion datasets demonstrate that this method efficiently improves the recognition rates for cross-corpora speech emotion recognition.

作者宋鹏郑文明赵力

机构地区烟台大学计算机与控制工程学院东南大学儿童发展与学习科学教育部重点实验室

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2016年第11期1179-1183,共5页 Journal of Tsinghua University(Science and Technology)

基金山东省自然科学基金资助项目(ZR2014FQ016) 国家自然科学基金资助项目(61231002) 东南大学基本科研业务费资助项目(CDLS-2015-04)

关键词语音情感识别迁移学习特征降维半监督判别分析 speech emotion recognition transfer learning feature dimension reduction semi-supervised discriminative analysis

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：167
2庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：462

二级参考文献169

1van Bezooijen R,Otto SA,Heenan TA. Recognition of vocal expressions of emotion:A three-nation study to identify universal characteristics[J].{H}JOURNAL OF CROSS-CULTURAL PSYCHOLOGY,1983,(04):387-406.
2Tolkmitt FJ,Scherer KR. Effect of experimentally induced stress on vocal parameters[J].Journal of Experimental Psychology Human Perception Performance,1986,(03):302-313.
3Cahn JE. The generation of affect in synthesized speech[J].Journal of the American Voice Input/Output Society,1990.1-19.
4Moriyama T,Ozawa S. Emotion recognition and synthesis system on speech[A].Florence:IEEE Computer Society,1999.840-844.
5Cowie R,Douglas-Cowie E,Savvidou S,McMahon E,Sawey M,Schro. Feeltrace:An instrument for recording perceived emotion in real time[A].Belfast:ISCA,2000.19-24.
6Grimm M,Kroschel K. Evaluation of natural emotions using self assessment manikins[A].Cancun,2005.381-385.
7Grimm M,Kroschel K,Narayanan S. Support vector regression for automatic recognition of spontaneous emotions in speech[A].IEEE Computer Society,2007.1085-1088.
8Eyben F,Wollmer M,Graves A,Schuller B Douglas-Cowie E Cowie R. On-Line emotion recognition in a 3-D activation-valencetime continuum using acoustic and linguistic cues[J].Journal on Multimodal User Interfaces,2010,(1-2):7-19.
9Giannakopoulos T,Pikrakis A,Theodoridis S. A dimensional approach to emotion recognition of speech from movies[A].Taibe:IEEE Computer Society,2009.65-68.
10Wu DR,Parsons TD,Mower E,Narayanan S. Speech emotion estimation in 3d space[A].Singapore:IEEE Computer Society,2010.737-742.

共引文献627

1康文杰,田苗,林岚,孙珅,吴水才.深度卷积生成对抗网络对神经影像通用数据特征的学习[J].智慧健康,2020(31):1-4. 被引量：2
2郑成杰,郑之.基于最大分类器差异域适应方法的3维点云分类[J].信息与控制,2023,52(5):588-597.
3张政,严哲,顾汉明.基于残差网络与迁移学习的断层自动识别[J].石油地球物理勘探,2020(5):950-956. 被引量：23
4陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：13
5吴锐帆,代海洋,杨坦,江颖,蔡志杰.直肠癌淋巴结转移的智能诊断研究[J].数学建模及其应用,2019,8(4):30-37. 被引量：2
6刘世晶,刘阳春,钱程,郑浩君,周捷,张成林.基于CycleGAN和注意力增强迁移学习的小样本鱼类识别[J].农业机械学报,2023,54(S01):296-302. 被引量：1
7张璐,黄琳,李备备,陈鑫,段青玲.基于多尺度融合与无锚点YOLO v3的鱼群计数方法[J].农业机械学报,2021,52(S01):237-244. 被引量：16
8张红洋,田瑞盟.基于SOLO分类理论的科学思维学业质量评价[J].湖南中学物理,2021(2):1-4. 被引量：1
9张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
10林峰,郭鹏,刘旭斌.基于叶片表面污垢预处理与CNN的风电机组叶片表面损伤识别[J].动力工程学报,2020(12):975-981. 被引量：5

同被引文献55

1李爱军,邵鹏飞,党建武.情感表达的跨文化多模态感知研究[J].清华大学学报（自然科学版）,2009(S1):1393-1401. 被引量：6
2赵力,王治平,卢韦,邹采荣,吴镇扬.全局和时序结构特征并用的语音信号情感特征识别方法[J].自动化学报,2004,30(3):423-429. 被引量：15
3王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
4孙红进.基于GMM的语音情感信息识别[J].信息技术,2008,32(12):138-140. 被引量：1
5贺无名,王培良,沈万昌.基于LS-SVM的电梯制动器故障诊断[J].工矿自动化,2010,36(2):44-48. 被引量：3
6张石清,李乐民,赵知劲.基于一种改进的监督流形学习算法的语音情感识别[J].电子与信息学报,2010,32(11):2724-2729. 被引量：21
7秦海波,白延强,吴斌,王峻,刘学勇,景晓路.载人航天飞行中的情绪研究进展[J].航天医学与医学工程,2012,25(4):302-306. 被引量：11
8张石清,李乐民,赵知劲.人机交互中的语音情感识别研究进展[J].电路与系统学报,2013,18(2):440-451. 被引量：29
9韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：167
10赵小蕾,毛启容,詹永照.融合功能性副语言的语音情感识别新方法[J].计算机科学与探索,2014,8(2):186-199. 被引量：5

引证文献13

1张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.
2王惠.迁移学习研究综述[J].电脑知识与技术（过刊）,2017,23(11X):203-205. 被引量：19
3钟琪,冯亚琴,王蔚.跨语言语料库的语音情感识别对比研究[J].南京大学学报（自然科学版）,2019,55(5):765-773. 被引量：3
4李永盛,何佳洲,赵国清,刘义海.关于迁移学习中的负迁移方向研究[J].指挥控制与仿真,2020,42(4):28-33. 被引量：6
5张会云,黄鹤鸣,李伟,黄志东.基于AA-LSTM网络的语音情感识别研究[J].计算机仿真,2021,38(3):211-216. 被引量：2
6李晓坤,李洪亮.基于深度迁移学习的跨库语音情感识别[J].通信技术,2021,54(4):848-852.
7姜宇迪,胡晖,殷跃红.基于无监督迁移学习的电梯制动器剩余寿命预测[J].上海交通大学学报,2021,55(11):1408-1416. 被引量：4
8LIN Long,TAN Liang.Multi-Distributed Speech Emotion Recognition Based on Mel Frequency Cepstogram and Parameter Transfer[J].Chinese Journal of Electronics,2022,31(1):155-167.
9王继东,李慧琪.一种语音情感深度迁移识别算法[J].软件导刊,2022,21(2):53-57. 被引量：1
10李飞,冯强中,张雨晴,范文斌.基于迁移学习的小样本风险用户识别[J].中国新技术新产品,2022(3):26-28.

二级引证文献42

1吴菲,雷鸣.基于残差网络的智能轻微交通事故处理系统设计[J].软件,2019,40(7):185-191. 被引量：1
2刘嘉政.基于深度迁移学习模型的花卉种类识别[J].江苏农业科学,2019,47(20):231-236. 被引量：14
3李成卫.《伤寒论》对《金匮要略》课程的正负迁移作用及应用[J].中国中医药现代远程教育,2019,17(24):19-22. 被引量：1
4薛晨兴,张军,邢家源.基于GoogLeNet Inception V3的迁移学习研究[J].无线电工程,2020,50(2):118-122. 被引量：11
5黄炜,童青云,李岳峰.广度学习研究进展:基于情报学的视角[J].情报理论与实践,2020,43(4):177-185. 被引量：2
6朱应钊.异构迁移学习研究综述[J].电信科学,2020,36(3):100-110. 被引量：6
7崔文华,李东,唐宇波,柳少军.基于深度强化学习的兵棋推演决策方法框架[J].国防科技,2020,41(2):113-121. 被引量：12
8梁复台,李宏权,张晨浩.基于深度迁移学习的窄带雷达群目标识别方法[J].兵器装备工程学报,2020,41(4):143-147. 被引量：4
9段向军,王敏.迁移深度学习地基云图自动识别的网络微调学习过程[J].电子器件,2020,43(6):1257-1261. 被引量：5
10赵凯琳,靳小龙,王元卓.小样本学习研究综述[J].软件学报,2021,32(2):349-369. 被引量：134

1宋鹏,金赟,查诚,赵力.基于稀疏特征迁移的语音情感识别[J].数据采集与处理,2016,31(2):325-330. 被引量：3
2谭建平,刘波,肖燕珊.基于半监督的SVM迁移学习文本分类算法[J].无线互联科技,2016,13(4):71-75. 被引量：3
3刘杰,杜军平.一种基于迁移学习的文本—图像特征映射算法[J].北京邮电大学学报,2012,35(6):1-5. 被引量：1
4陈骏龙,刘亚洲,唐晓晴.大数据环境下基于迁移学习的人体检测性能提升方法[J].现代电子技术,2015,38(14):1-5. 被引量：1
5周夕良.语音情感识别的发展与展望[J].信息技术,2013,37(11):19-22. 被引量：1
6杨昌健,邓赵红,蒋亦樟,王士同.基于0阶TSK型迁移模糊系统的EEG信号自适应识别[J].计算机应用研究,2015,32(8):2276-2280. 被引量：3
7张雅俊,高陈强,李佩,刘江,程华.基于卷积神经网络的人流量统计[J].重庆邮电大学学报（自然科学版）,2017,29(2):265-271. 被引量：15
8张昕然,宋鹏,查诚,陶华伟,赵力.用于跨库语音情感识别的时频原子听觉注意模型（英文）[J].Journal of Southeast University(English Edition),2016,32(4):402-407.
9徐嘉明,张卫强,刘加,夏善红.基于无监督迁移分量分析的语种识别[J].清华大学学报（自然科学版）,2013,53(6):800-803.
10夏融,蒯伟.几种常见的声回声抵消的状态检测算法及其性能研究[J].通信与广播电视,2015,0(3):1-8.

清华大学学报（自然科学版）

2016年第11期

浏览历史

内容加载中请稍等...

基于特征迁移学习方法的跨库语音情感识别被引量：13

参考文献2

二级参考文献169

共引文献627

同被引文献55

引证文献13

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于特征迁移学习方法的跨库语音情感识别 被引量：13

参考文献2

二级参考文献169

共引文献627

同被引文献55

引证文献13

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于特征迁移学习方法的跨库语音情感识别被引量：13