基于注意力机制的语音情感识别非线性特征融合方法的研究被引量：2

A NONLINEAR FEATURE FUSION METHOD OF SPEECH EMOTION RECOGNITION BASED ON ATTENTION MECHANISM

下载PDF

导出

摘要为了解决语音情感识别中时空特征动态依赖问题,提出一种基于注意力机制的非线性时空特征融合模型。模型利用基于注意力机制的长短时记忆网络提取语音信号中的时间特征,利用时间卷积网络提取语音信号中的空间特征,利用注意力机制将时空特征进行非线性的融合,并将非线性融合后的高级特征输入给全连接层进行语音情感识别。实验在IEMOCAP数据集中进行评估,实验结果表明,该方法可以同时考虑时空特征的内在关联,相对于使用线性融合的方法,利用注意力机制进行非线性特征融合的网络可以有效地提高语音情感识别准确率。 In order to solve the problem of dynamic dependence of spatiotemporal features in speech emotion recognition, a nonlinear spatiotemporal feature fusion model based on attention mechanism is proposed. The model used the long short-term memory network based on the attention mechanism to extract the time features in the speech signal, used the time convolution network to extract the spatial features in the speech signal, and used the attention mechanism to nonlinearly merge the spatial-temporal features. The advanced features after fusion were input to the fully connected layer for speech emotion recognition. The experiment was evaluated on the IEMOCAP data set. The experimental results show that the method can simultaneously consider the internal correlation of the spatial-temporal features. Compared with the linear fusion method, the network that uses the attention mechanism for nonlinear feature fusion can effectively improve the accuracy of speech emotion recognition.

作者周伟东周后盘夏鹏飞 Zhou Weidong;Zhou Houpan;Xia Pengfei(College of Automation(Artificial Intelligence),Hangzhou Dianzi University,Hangzhou 310000,Zhejiang,China)

机构地区杭州电子科技大学自动化(人工智能)学院

出处《计算机应用与软件》北大核心 2023年第1期216-221,272,共7页 Computer Applications and Software

关键词语音情感识别长短时记忆网络时间卷积网络非线性融合 Speech emotion recognition Long short-term memory network Time convolutional network Nonlinear fusion

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1王立志,慕晓冬,刘宏岚.采用改进粒子群优化的SVM方法实现中文文本情感分类[J].计算机科学,2020,47(1):231-236. 被引量：19

二级参考文献1

1李荣雨,张卫杰,周志勇.改进的粒子群算法在轧制负荷分配中的优化[J].计算机科学,2018,45(7):214-218. 被引量：4

共引文献18

1陈清化,薛书琦,龚壮壮,曹润康.基于文本挖掘的物流服务水平评价方法[J].计算机应用,2023,43(S01):88-94. 被引量：1
2张素梅,张波涛.一种基于量子耗散粒子群的评估模型构建方法[J].计算机科学,2020,47(S01):84-88. 被引量：1
3薛丹,姚若侠.基于PSO算法的SOR最优松弛因子选取研究[J].计算机技术与发展,2020,30(12):15-20. 被引量：1
4陆春阳,郭天驹,李晓溪.基于大数据的事故舆情分析系统研究[J].电力大数据,2021,24(1):70-78. 被引量：2
5王海燕,陶皖,余玲艳,王鸣鹃.文本细粒度情感分析综述[J].河南科技学院学报（自然科学版）,2021,49(4):67-76. 被引量：6
6林振宇,解吉波,杨腾飞,刘战,赵静.旅游多主题情感词典的构建方法[J].地理与地理信息科学,2021,37(4):22-27. 被引量：7
7杨秀璋,武帅,张苗,李娜,于小民,范郁锋.基于TextCNN和Attention的微博舆情事件情感分析[J].信息技术与信息化,2021(7):41-46. 被引量：13
8张江江,崔志华.高维多目标集成算法研究综述[J].南昌工程学院学报,2021,40(4):67-76. 被引量：3
9王冰,毕新伟.基于SVM的文本情感倾向性智能分析方法[J].赤峰学院学报（自然科学版）,2021,37(10):16-19.
10徐新燕,张顺香.融合情感特征的卷积神经网络情感分类模型[J].阜阳师范大学学报（自然科学版）,2021,38(4):57-61. 被引量：2

同被引文献12

1黄振邦.基于TSN的化学实验室人员不安全行为模式识别[J].智能计算机与应用,2022,12(2):99-104. 被引量：4
2杨秀璋,武帅,张苗,李娜,于小民,范郁锋.基于TextCNN和Attention的微博舆情事件情感分析[J].信息技术与信息化,2021(7):41-46. 被引量：13
3郭师虹,井锦瑞,张潇丹,秦晓晖.基于改进的YOLOv4安全帽佩戴检测研究[J].中国安全生产科学技术,2021,17(12):135-141. 被引量：15
4刘凯源.基于C3D的化学实验室人员不安全行为模式识别[J].信息技术与网络安全,2022,41(3):71-77. 被引量：5
5蒯红权,吴建华,吴亮.基于注意力机制的深度循环神经网络的语音情感识别[J].电子器件,2022,45(1):139-142. 被引量：5
6安宇,郭子萌,王彪,杜红星.高校实验室事故致因分析与安全管理研究[J].安全,2022,43(8):34-39. 被引量：36
7杨秀璋,武帅,任天舒,刘建义,宋籍文,廖文婧.融合多头注意力机制和BiLSTM的电商评论情感分析研究[J].信息技术与信息化,2022(10):5-9. 被引量：1
8张玉莹,朱广丽,张友强,孙争艳,张顺香.基于情感信息预处理和Bi-GRU的虚假评论识别模型[J].广西科学,2023,30(1):169-176. 被引量：2
9李雯静,刘鑫.基于深度学习的井下人员不安全行为识别与预警系统研究[J].金属矿山,2023(3):177-184. 被引量：13
10丁邱,迟海洋,严馨,徐广义,邓忠莹.基于Transformer模型的问句语义相似度计算[J].计算机工程与设计,2023,44(3):887-893. 被引量：3

引证文献2

1徐浩钧,胡啸峰,吴建松.化学实验室动火实验无人值守行为识别方法研究[J].中国安全生产科学技术,2023,19(12):135-141. 被引量：2
2周毅勇.电子商务产品评论情感分析模型的研究与构建[J].网络安全技术与应用,2024(1):50-53. 被引量：1

二级引证文献3

1周奕,马汉杰,许永恩,宗佳敏,李少华.基于对抗训练和片段级别的双向情感三元组抽取模型[J].软件工程,2024,27(9):73-78.
2徐晓滨,孔俊杰,张泽辉,王坚,陈龙,何宏.基于计算机视觉的工业人员行为分析实验平台[J].实验技术与管理,2024,41(9):101-110.
3许云峰,雷海龙,韩永辉,崔建升.受限计算环境下的化工实验室安全检测模型[J].安全与环境学报,2024,24(10):3780-3787.

1王定美,张睿骁,赵龙.基于MMoE-TCN的综合能源系统短期多元负荷预测[J].电气传动自动化,2023,45(1):39-45. 被引量：2
2陈月月,李燕,帅亚琦,徐丽娜,钟昕妤.基于BERT-CRF的中文分词模型设计[J].电脑知识与技术,2022,18(35):4-6. 被引量：2
3赵莎莎,朱雅魁,王悦.基于大数据分析的综合能源系统负荷特性聚类分析[J].电测与仪表,2023,60(2):10-15. 被引量：5
4白玛仁增,顿玉多吉,德例归吉,德吉央宗,益西多吉,边巴次仁.星-地结合对水稻高温热害监测模型的研究[J].中国农学通报,2023,39(1):133-141.
5杨剑锋,霍雨佳,蔡静.屏蔽数据下带变点的软件可靠性增长模型[J].计算机应用与软件,2023,40(1):17-23.

计算机应用与软件

2023年第1期

浏览历史

内容加载中请稍等...

基于注意力机制的语音情感识别非线性特征融合方法的研究被引量：2

参考文献1

二级参考文献1

共引文献18

同被引文献12

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的语音情感识别非线性特征融合方法的研究 被引量：2

参考文献1

二级参考文献1

共引文献18

同被引文献12

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的语音情感识别非线性特征融合方法的研究被引量：2