基于DPCNN-SLSTM的中文儿童语音情感识别

Emotion Recognition of Chinese Children's Speech Based on DPCNN-SLSTM

下载PDF

导出

摘要针对中文儿童语音情感识别的准确性问题,提出了一种结合深度卷积神经网络(Deep Convolutional Neural Network,DPCNN)与堆叠长短时记忆(Stacked Long Short Term Memory,SLSTM)网络的融合模型,旨在提高中文儿童语音情感识别的准确性。通过DPCNN对语音信号中的长距离依赖关系进行提取,再利用SLSTM捕捉情感相关的序列依赖信息,最终通过softmax分类器实现情感状态的判别。实验结果显示,基于DPCNN-SLSTM的模型在中文儿童语音数据集上的情感识别准确率达到了92%,显著优于CNN、LSTM和CNN-LSTM模型。研究结果对于推动儿童语音情感识别技术的发展具有重要意义。 To address the accuracy problem of Chinese children’s speech emotion recognition,a fusion model combining DPCNN(Deep Convolutional Neural Network)and SLSTM(Stacked Long Short-Term Memory)network is proposed,which aims to enhance the accuracy of Chinese children’s speech emotion recognition.The long-distance dependencies in the speech signal are extracted by DPCNN,and then SLSTM is used to capture the emotion-related sequence dependency information,and finally the Softmax classifier is used to achieve the emotion state discrimination.The experimental results indicate that the DPCNNSLSTM-based model achieves 92%emotion recognition accuracy on the Chinese children’s speech dataset,which is significantly better than CNN,LSTM and CNN-LSTM models.The results of this study are of great significance in promoting the development of emotion recognition technology for children’s speech.

作者董胡彭高丰陈伟 DONG Hu;PENG Gaofeng;CHEN Wei(College of Information Science and Engineering,Changsha Normal College,Changsha Hunan 410100,China;College of Electronic Information and Electrical Engineering,Changsha College,Changsha Hunan 410022,China)

机构地区长沙师范学院信息科学与工程学院长沙学院电子信息与电气工程学院

出处《通信技术》 2024年第7期666-671,共6页 Communications Technology

基金湖南省教育科学“十四五”规划课题“基于深度学习的中文儿童语音情感识别及其社会情绪能力评测研究”(XJK23BXX003)。

关键词深度卷积神经网络堆叠长短时记忆网络融合模型中文儿童语音情感识别 deep convolutional neural network stacked long short-term memory network fusion model Chinese children’s speech emotion recognition

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献16

1史少寒,周晓彦,李大鹏.基于ARIMA算法特征补齐的语音情感识别[J].电子器件,2023,46(5):1333-1338. 被引量：4
2谷泽月,边巴旺堆,祁晋东.基于多特征融合的藏语语音情感识别[J].现代电子技术,2023,46(21):129-133. 被引量：3
3孙林慧,赵敏,王舜.基于深度域适应CNN决策树的跨语料库情感识别[J].数据采集与处理,2023,38(3):704-716. 被引量：2
4张家豪,章昭辉,严琦,王鹏伟.基于语音节奏差异的情感识别方法[J].计算机科学,2024,51(4):262-269. 被引量：1
5闫舒羽,李小光,顾天昊,徐冠华.基于多通道帧级筛选的LSTM网络脑电情感识别[J].国外电子测量技术,2023,42(12):94-101. 被引量：1
6余莉萍,梁镇麟,梁瑞宇.基于改进LSTM的儿童语音情感识别模型[J].计算机工程,2020,46(6):40-49. 被引量：11
7宋文婧.学前儿童心理健康智能机器人辅助监测系统设计[J].自动化与仪器仪表,2022(11):199-204. 被引量：3
8杨明极,张家彬.基于深度神经网络的语音情感识别方法[J].科学技术与工程,2019,19(8):127-131. 被引量：12
9胡黎,黄洪全,梁超,宋悦阳,陈延明.基于双通路CNN的端到端语音识别研究[J].传感器与微系统,2021,40(11):69-72. 被引量：7
10杨进才,曹元,胡泉.基于DPCNN模型与语句特征融合的汉语因果类复句关系自动识别[J].中文信息学报,2022,36(9):19-27. 被引量：2

二级参考文献89

1刘钊,崔珑献,李岩,刘文,刘敬贤.基于二维矩阵分解的船舶交通流预测[J].中国航海,2021,44(3):76-83. 被引量：6
2苗敏敏,徐宝国,胡文军,王爱民,宋爱国.基于自适应优化空频微分熵的情感脑电识别[J].仪器仪表学报,2021,42(3):221-230. 被引量：15
3孙凯丽,邓沌华,李源,李妙,李洋.基于句内注意力机制多路CNN的汉语复句关系识别方法[J].中文信息学报,2020(6):9-17. 被引量：10
4韩鹏宇,高盛祥,余正涛,黄于欣,郭军军.基于案件要素指导的涉案舆情新闻文本摘要方法[J].中文信息学报,2020,34(5):56-63. 被引量：8
5黄永庆,周强.基于CNN时-空卷积优化的EM-EEG识别方法研究[J].电子测量与仪器学报,2022,36(3):231-240. 被引量：2
6韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
7杜志然,周萍,景新幸,李杰.基于谱熵的耳语音增强研究[J].传感器与微系统,2012,31(6):69-72. 被引量：3
8陈建厦,李翠华.语音情感识别的研究进展[J].计算机工程,2005,31(13):35-37. 被引量：8
9杨士莪.研究海洋开发海洋——海洋环境及海洋资源调查、监测技术概述[J].舰船科学技术,2008,30(5):17-19. 被引量：12
10刘敬贤,张涛,刘文.船舶交通流组合预测方法研究[J].中国航海,2009,32(3):80-84. 被引量：23

共引文献72

1张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.
2孙继平,陈浜.基于CLBP和支持向量诱导字典学习的煤岩识别方法[J].煤炭学报,2017,42(12):3338-3348. 被引量：18
3董海军,耿宇.移动互联网+问卷的应用特点与发展[J].晋阳学刊,2018(3):104-110. 被引量：7
4李婉玲,张秋菊.基于HMM/SVM的抗噪语音特征提取及优化[J].传感器与微系统,2019,38(4):55-58. 被引量：9
5郭怀钰.人工智能在智能交通中的应用[J].电子制作,2019,27(6):73-74. 被引量：2
6缪裕青,邹巍,刘同来,周明,蔡国永.基于参数迁移和卷积循环神经网络的语音情感识别[J].计算机工程与应用,2019,55(10):135-140. 被引量：29
7胡同,朱国华,黄力乾.智能规范执法系统的设计实现[J].电脑编程技巧与维护,2019(6):131-132.
8张荣葳.基于SimHash与神经网络的网络异常检测方法研究[J].电脑知识与技术,2019,15(6X):224-226. 被引量：1
9高成吉.一种语言情绪识别方法的研究[J].计算机与数字工程,2019,47(7):1622-1626.
10史雨璇.基于改进VGG-13卷积神经网络的单脉冲信号分选[J].哈尔滨商业大学学报（自然科学版）,2019,35(4):419-425. 被引量：1

1翟倩.小学语文课堂教学有效性策略研究[J].学生·家长·社会,2022(17):0013-0015.
2王淑梅.如何让学生养成良好的写作习惯[J].作文成功之路（小学）,2021(6):50-50.
3张灶瑾.第三学段习作的情感表达教学策略[J].小学语文,2023(9):55-58.
4孟文煜.幼儿园幼小衔接存在的问题与优化方式探讨[J].课堂内外（初中版）,2024(28):143-145.
5张剑寅,尼凌飞,王汉白,谷尚铭,刘昱,刘景磊.面向星地融合的5G网络增强及关键技术研究[J].电信科学,2024,40(6):38-48. 被引量：1
6黄涛,程文博,王耿鑫.基于FNN和LSTM对挡土墙侧移的预测研究[J].安徽建筑,2024,31(8):122-123.
7李少君.以诗储情,构建心灵家园[J].中华诗词,2023(1):1-1.
8夏超鹏,洪宇,刘新山,周鑫.基于LSTM深度学习网络的中长期电力负荷预测[J].自动化与仪器仪表,2024(7):343-346.
9沈露露,黄晋浩,花敏,周雯.基于ARIMA-PSO-LSTM的太阳能预测[J].无线电通信技术,2024,50(4):771-778.
10蔡宁泊,张程,王伟.基于长短期记忆神经网络模型的多步滚动预测方法[J].科学技术与工程,2024,24(19):8356-8361.

通信技术

2024年第7期

浏览历史

内容加载中请稍等...

基于DPCNN-SLSTM的中文儿童语音情感识别

参考文献16

二级参考文献89

共引文献72

相关作者

相关机构

相关主题

浏览历史