轻量型胶囊网络语音情感识别方法被引量：2

A Speech Emotion Recognition Method Based on Lightweight Capsule Network

下载PDF

导出

摘要针对目前语音情感识别模型参数多、运算量大、训练速度慢等问题,提出了一种适用于小数据集、轻量型的网络模型。模型以胶囊网络为基础结构,引入深度可分离卷积模块代替胶囊网络中原有的卷积层以减少计算量。基于迁移学习提取普适的底层图像特征,利用语谱图来微调整个网络,减弱模型在小数据集上的过拟合现象。再利用夹角余弦来计算动态路由结构中向量的相似度,提高动态路由算法性能。实验结果表明,轻量型胶囊网络的识别率和运算速度均优于对比的7种深度学习网络模型。 Aiming at the problems of many parameters,large amount of computation and slow training speed of the current speech emotion recognition model,this paper proposes a lightweight network model suitable for small data sets.The model is based on the capsule network,and the deep separable convolution module is introduced to replace the original convolution layer in the capsule network to reduce the amount of calculation.Transfer learning is used to extract the universal underlying image features,and then spectrogram is used to finely tune the over fitting phenomenon of the whole network weakening model on small data sets.The angle cosine is used to calculate the vector similarity in the dynamic routing structure so as to improve the performance of the dynamic routing algorithm.The experimental results show that the recognition rate and operation speed of the lightweight capsule network are better than the seven deep learning network models.

作者王颖高胜 WANG Ying;GAO Sheng(School of Computer and Information Technology,Northeast Petroleum University,Daqing Heilongjiang 163318;School of Mechanical Science and Engineering,Northeast Petroleum University,Daqing Heilongjiang 163318)

机构地区东北石油大学计算机与信息技术学院东北石油大学机械科学与工程学院

出处《电子科技大学学报》 EI CAS CSCD 北大核心 2023年第3期423-429,共7页 Journal of University of Electronic Science and Technology of China

基金国家自然科学基金(61702093) 国家重点研发计划(2018YFE0196000) 黑龙江省自然科学基金(F2018003) 黑龙江省博士后专项(LBH-Q20077)。

关键词胶囊网络深度可分离卷积语音情感识别迁移学习 capsule network depth separable convolution speech emotion recognition transfer learning

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：169
2张晓宇,张华熊,高强.基于深度学习的多模式权重网络语音情感识别[J].大连理工大学学报,2022,62(5):526-534. 被引量：5
3李靓,孙存威,谢凯,贺建飚.基于深度学习的小样本声纹识别方法[J].计算机工程,2019,45(3):262-267. 被引量：19
4董建伟,王衍学.基于残差胶囊网络的滚动轴承故障诊断研究[J].机电工程,2021,38(10):1292-1298. 被引量：2
5孙岩,彭高亮.改进胶囊网络的滚动轴承故障诊断方法[J].哈尔滨工业大学学报,2021,53(1):23-28. 被引量：14
6杨平,苏燕辰,张振.基于卷积胶囊网络的滚动轴承故障诊断研究[J].振动与冲击,2020,39(4):55-62. 被引量：32
7张天柱,邹承明.使用模糊聚类的胶囊网络在图像分类上的研究[J].计算机科学,2019,46(12):279-285. 被引量：10
8张文风,周俊.基于Dropout-CNN的滚动轴承故障诊断研究[J].轻工机械,2019,37(2):62-67. 被引量：31
9缪裕青,邹巍,刘同来,周明,蔡国永.基于参数迁移和卷积循环神经网络的语音情感识别[J].计算机工程与应用,2019,55(10):135-140. 被引量：29
10赵小强,张和慧.基于交叉熵的改进NPE间歇过程故障检测算法[J].控制与决策,2021,36(2):411-417. 被引量：6

二级参考文献126

1van Bezooijen R,Otto SA,Heenan TA. Recognition of vocal expressions of emotion:A three-nation study to identify universal characteristics[J].{H}JOURNAL OF CROSS-CULTURAL PSYCHOLOGY,1983,(04):387-406.
2Tolkmitt FJ,Scherer KR. Effect of experimentally induced stress on vocal parameters[J].Journal of Experimental Psychology Human Perception Performance,1986,(03):302-313.
3Cahn JE. The generation of affect in synthesized speech[J].Journal of the American Voice Input/Output Society,1990.1-19.
4Moriyama T,Ozawa S. Emotion recognition and synthesis system on speech[A].Florence:IEEE Computer Society,1999.840-844.
5Cowie R,Douglas-Cowie E,Savvidou S,McMahon E,Sawey M,Schro. Feeltrace:An instrument for recording perceived emotion in real time[A].Belfast:ISCA,2000.19-24.
6Grimm M,Kroschel K. Evaluation of natural emotions using self assessment manikins[A].Cancun,2005.381-385.
7Grimm M,Kroschel K,Narayanan S. Support vector regression for automatic recognition of spontaneous emotions in speech[A].IEEE Computer Society,2007.1085-1088.
8Eyben F,Wollmer M,Graves A,Schuller B Douglas-Cowie E Cowie R. On-Line emotion recognition in a 3-D activation-valencetime continuum using acoustic and linguistic cues[J].Journal on Multimodal User Interfaces,2010,(1-2):7-19.
9Giannakopoulos T,Pikrakis A,Theodoridis S. A dimensional approach to emotion recognition of speech from movies[A].Taibe:IEEE Computer Society,2009.65-68.
10Wu DR,Parsons TD,Mower E,Narayanan S. Speech emotion estimation in 3d space[A].Singapore:IEEE Computer Society,2010.737-742.

共引文献296

1陈翔,刘勤明,胡家瑞.多源传感器数据下基于注意力机制与长短期记忆网络的轴承故障诊断与寿命预测[J].信息与控制,2024,53(2):211-225.
2郑成杰,郑之.基于最大分类器差异域适应方法的3维点云分类[J].信息与控制,2023,52(5):588-597.
3张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
4尹生阳,曾维,王胜,胡粒琪,余小平,李亚欣.基于声波信号的岩性智能分类方法[J].吉林大学学报（地球科学版）,2022,52(6):2060-2070. 被引量：4
5江楠,陈洁,肖潘,唐文强,林志泉.基于声纹识别的电力会议多角色语音的分离和识别研究[J].高电压技术,2023,49(S01):40-46. 被引量：1
6任训学.中学教师教学能力的调查报告[J].湖北大学学报（哲学社会科学版）,2000,27(2):99-103. 被引量：12
7李霞,卢官明,闫静杰,张正言.多模态维度情感预测综述[J].自动化学报,2018,44(12):2142-2159. 被引量：26
8李高玲,帖云,齐林.基于随机森林分类优化的多特征语音情感识别[J].微电子学与计算机,2019,36(1):70-73. 被引量：12
9张福泉.情感建模及情感识别技术研究[J].廊坊师范学院学报（自然科学版）,2014,14(5):23-26. 被引量：4
10孙凌云,何博伟,刘征,杨智渊.基于语义细胞的语音情感识别[J].浙江大学学报（工学版）,2015,49(6):1001-1008. 被引量：2

同被引文献20

1王健,韩志艳.基于正交实验设计的语音情感识别参数优化[J].计算机技术与发展,2013,23(3):109-111. 被引量：2
2杨巨成,韩书杰,毛磊,代翔子,陈亚瑞.胶囊网络模型综述[J].山东大学学报（工学版）,2019,49(6):1-10. 被引量：19
3吴朝晖.类脑研究:为人类构建超级大脑[J].浙江大学学报（工学版）,2020,54(3):425-426. 被引量：10
4崔浩阳,丁偕,张敬谊.基于细胞图卷积的组织病理图像分类研究[J].计算机工程与应用,2020,56(24):223-228. 被引量：2
5张会云,黄鹤鸣,李伟,康杰,无.语音情感识别研究综述[J].计算机仿真,2021,38(8):7-17. 被引量：18
6戴妍妍,金赟,马勇,杨子秀,俞佳佳.基于高效通道注意力机制的语音情感识别方法[J].信号处理,2021,37(10):1835-1842. 被引量：7
7谌鈫,陈兰岚,江润强.集成胶囊网络的脑电情绪识别[J].计算机工程与应用,2022,58(8):175-184. 被引量：3
8焦亚萌,周成智,李文萍,崔琳,董免.融合多头注意力的VGGNet语音情感识别研究[J].国外电子测量技术,2022,41(1):63-69. 被引量：11
9杨秀,蒋家富,刘方,田英杰,李凡,吴裔.基于注意力机制和卷积神经网络的配电网拓扑辨识[J].电网技术,2022,46(5):1672-1682. 被引量：25
10张静,张雪英,陈桂军,闫超.结合3D-CNN和频-空注意力机制的EEG情感识别[J].西安电子科技大学学报,2022,49(3):191-198. 被引量：11

引证文献2

1朱芳慧.融合注意力机制的人机交互儿童情感识别技术研究[J].自动化与仪器仪表,2024(7):251-255.
2刘悦,张雪英,陈桂军,黄丽霞,孙颖.基于多脑区注意力机制胶囊融合网络的EEG-fNIRS情感识别[J].浙江大学学报（工学版）,2024,58(11):2247-2257.

1宋羽凯,谢江.基于多任务学习的轻量级语音情感识别模型[J].计算机工程,2023,49(5):122-128. 被引量：3
2周毓.基于JAVA和Android的网络语音通信软件设计与实现[J].电子技术与软件工程,2023(6):50-53.
3刘继友.2022年全国联赛A2卷第6题解法赏析[J].高中数学教与学,2023(5):54-55.
4胡俊峰,朝鲁萌,廖文卓,廉晔.浅析车联网5G SA语音功能改造[J].长江信息通信,2023,36(4):200-205.
5张鑫,黄明娟,张淑英.LTE系统CSFB时延优化[J].中文科技期刊数据库（全文版）工程技术,2021(1):273-274.
6贾瑞霞.瑞典,欧盟创新和绿色发展的“领头羊”[J].世界知识,2023(9):62-63.
7张煜,王磊,卢麟,叶永平,万亮.基于累积前景理论和学识评级的PL-VIKOR群决策[J].系统工程与电子技术,2023,45(6):1762-1771. 被引量：1

电子科技大学学报

2023年第3期

浏览历史

内容加载中请稍等...

轻量型胶囊网络语音情感识别方法被引量：2

参考文献10

二级参考文献126

共引文献296

同被引文献20

引证文献2

相关作者

相关机构

相关主题

浏览历史

轻量型胶囊网络语音情感识别方法 被引量：2

参考文献10

二级参考文献126

共引文献296

同被引文献20

引证文献2

相关作者

相关机构

相关主题

浏览历史

轻量型胶囊网络语音情感识别方法被引量：2