基于残差网络改进的中文语音情感识别被引量：3

Improved Chinese speech emotion recognition network based on residual network

下载PDF

导出

摘要为解决小样本中文语音情感识别准确度低的问题,提出一种基于残差网络改进的中文语音情感识别网络结构AResnet。使用时域增强和频域增强生成更复杂的模拟样本扩充语音情感数据,将注意力机制引入至残差网络(residual networks)中,关注谱图中情感特征分布,提升情感识别率。在CASIA中文语音数据集上训练、测试,其结果显示,对比DCNN+LSTM、Trumpt-6网络结构,识别率分别提升约14.9%、3%,验证了AResnet在中文语音情感识别中的有效性。该方法也在英语语音数据集eNTERFACE’05上进行实验,识别准确率为92%,验证了AResnet有较好的泛化能力。 To solve the problem of low accuracy of Chinese speech emotion recognition with small sample,the improved Chinese speech emotion recognition network structure based on residual networks AResnet was presented.The speech emotion data were augmented with more complex simulated samples using time domain augmentation and frequency domain augmentation,and the attention mechanism was introduced into residual networks to focus on the distribution of emotion features in the spectrogram and improve the emotion recognition rate.The CASIA Chinese speech dataset was used for training and testing.Results show that compared with DCNN+LSTM and Trumpt-6 network structures,the emotion recognition rates of the proposed method increase by 14.9%and 3%respectively,which verifies the effectiveness of AResnet in Chinese speech emotion recognition.The method was also experimented on the English speech dataset eNTERFACE’05.Results show that the recognition accuracy is 92%.The proposed AResnet has good generalization ability.

作者贾婧雯蔡英尔古打机 JIA Jing-wen;CAI Ying;ERGU Daji(College of Electronic and Information,Southwest Minzu University,Chengdu 610000,China)

机构地区西南民族大学电子信息学院

出处《计算机工程与设计》北大核心 2023年第3期922-928,共7页 Computer Engineering and Design

基金西南民族大学研究生创新研究基金项目(CX2021SZ38)。

关键词语音情感识别深度学习残差网络注意力机制小样本数据增强语谱图 speech emotion recognition deep learning residual network attention mechanism small sample data enhancement spectrogram

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1张昕然,查诚,宋鹏,陶华伟,赵力.听觉注意模型的语谱图语音情感识别方法[J].信号处理,2016,32(9):1117-1125. 被引量：1
2宋鹏,郑文明,赵力.基于特征迁移学习方法的跨库语音情感识别[J].清华大学学报（自然科学版）,2016,56(11):1179-1183. 被引量：13
3林巧民,齐柱柱.基于HMM和ANN混合模型的语音情感识别研究[J].计算机技术与发展,2018,28(10):74-78. 被引量：9
4曾润华,张树群.改进卷积神经网络的语音情感识别方法[J].应用科学学报,2018,36(5):837-844. 被引量：12
5朱芳枚,赵力,梁瑞宇,王青云,邹采荣.面向中文语音情感识别的改进栈式自编码结构[J].东南大学学报（自然科学版）,2017,47(4):631-636. 被引量：6
6卢官明,袁亮,杨文娟,闫静杰,李海波.基于长短期记忆和卷积神经网络的语音情感识别[J].南京邮电大学学报（自然科学版）,2018,38(5):63-69. 被引量：23
7陈炜亮,孙晓.基于MFCCG-PCA的语音情感识别[J].北京大学学报（自然科学版）,2015,51(2):269-274. 被引量：16
8缪裕青,邹巍,刘同来,周明,蔡国永.基于参数迁移和卷积循环神经网络的语音情感识别[J].计算机工程与应用,2019,55(10):135-140. 被引量：29
9姜芃旭,傅洪亮,陶华伟,雷沛之.一种基于卷积神经网络特征表征的语音情感识别方法[J].电子器件,2019,42(4):998-1001. 被引量：22

二级参考文献55

1詹永照,曹鹏.语音情感特征提取和识别的研究与实现[J].江苏大学学报（自然科学版）,2005,26(1):72-75. 被引量：16
2蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：38
3叶庆云,蒋佳.基于语音MFCC特征的改进算法[J].武汉理工大学学报,2007,29(5):150-152. 被引量：9
4余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
5Minsk M L. The society of mind. New York: Touchstone, 1985:85-86.
6Picard R W. Affeetive computing. London: MIT Press, 1997:192-195.
7AIST. Successful development of a robot with appearance and performance similar to human [EB/OL]. (2009-05-13)[2014-02-12]. http://www.aist. go .jp/aist_e/latest research/2009/20090513/200905 13.html.
8Ganchev T, Fakotakis N, Kokkinakis G. Comparative evaluation of various MFCC implementations on the speaker verification task // 10th International Conference on Speech and Computer: Proceedings of the SPECOM-2005. Patras, 2005:191-194.
9李桂春,郑能恒,李泰.基于模糊隶属值加权的MFCC特征提取算法//第七届和谐人机环境联合学术会议(HHME2011)论文集.北京,2011:40-46.
10Tyagi V, Wellekens C. On desensitizing the Mel- cepstrum to spurious spectral components for robust speech recognition // ICASSP'05. Vancouver, 2005: 529-532.

共引文献102

1张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.
2余春艳,翁子林.音频情感感知与视频精彩片段提取[J].计算机辅助设计与图形学学报,2015,27(10):1890-1899. 被引量：4
3高文曦,孙小琪,镇丽华.基于遗传算法数据降维的汉语数字语音识别[J].计算机系统应用,2016,25(1):150-153. 被引量：2
4罗宪华,徐海明.基于特定人的语音情感识别系统构建[J].中国人民公安大学学报（自然科学版）,2015,21(4):72-75. 被引量：3
5王丰华,王邵菁,陈颂,袁国刚,张君.基于改进MFCC和VQ的变压器声纹识别模型[J].中国电机工程学报,2017,37(5):1535-1542. 被引量：80
6李文华,姜林.中文语音情感常用特征识别性能分析[J].智能计算机与应用,2017,7(2):56-58. 被引量：1
7任浩,叶亮,李月,沙学军.基于多级SVM分类的语音情感识别算法[J].计算机应用研究,2017,34(6):1682-1684. 被引量：25
8崔广新,李殿奎.基于自编码算法的深度学习综述[J].计算机系统应用,2018,27(9):47-51. 被引量：19
9李婉玲,张秋菊.基于HMM/SVM的抗噪语音特征提取及优化[J].传感器与微系统,2019,38(4):55-58. 被引量：9
10王惠.迁移学习研究综述[J].电脑知识与技术（过刊）,2017,23(11X):203-205. 被引量：19

同被引文献35

1杨志杰,张梅,李冠龙,黄昌达.基于长短时记忆元的语音智能识别系统设计[J].电子设计工程,2020,28(1):55-58. 被引量：4
2先正锴,甘刚.基于BPTT算法的webshell检测研究[J].计算机与数字工程,2020,48(2):372-377. 被引量：3
3谭磊,余欣洋,罗伟洋,曾维,代云强.基于深度学习的移动端语音识别系统设计[J].单片机与嵌入式系统应用,2020,20(9):28-31. 被引量：10
4张红.基于现实增强技术的数字绘本图像传感器设计[J].自动化与仪器仪表,2020(9):84-87. 被引量：2
5张艳.基于体感技术的人机交互游戏研究[J].自动化与仪器仪表,2021(2):207-211. 被引量：2
6山笑珂,张炳林.利用改进深度信念网络的人脸表情识别[J].计算机工程与设计,2021,42(7):2052-2060. 被引量：1
7潘红丽.基于RNN弱监督网络的英语语义分析技术研究[J].电子设计工程,2021,29(15):97-101. 被引量：4
8李静,莫思敏.基于改进遗传算法的深度神经网络优化研究[J].计算机工程与科学,2021,43(8):1503-1511. 被引量：10
9崔明珠,范丽亚.卷积运算对彩色图像质量的影响[J].聊城大学学报（自然科学版）,2021,34(6):29-42. 被引量：1
10周滟.基于深度学习网络的智能交通信号控制研究[J].单片机与嵌入式系统应用,2022,22(1):17-20. 被引量：3

引证文献3

1王丽,涂冰花,王伟,陆俊,杨奚诚.长短期记忆循环神经网络在自动语音识别中的应用[J].单片机与嵌入式系统应用,2023,23(10):49-52. 被引量：2
2许萌,韩鹏.面向学前教育对话机器人的多模态情感识别实现关键技术[J].自动化与仪器仪表,2023(9):137-141.
3倪璐.基于传感器技术的实时交互式音乐可视化研究[J].自动化与仪器仪表,2024(2):232-236. 被引量：1

二级引证文献3

1王雪宝,汤永涛,王青波,唐文龙.人工智能语音识别技术在国外军事领域的应用分析[J].电脑知识与技术,2024,20(5):21-23.
2张子元.基于小波信息处理的电子考试智能语音精准识别模块开发[J].信息记录材料,2024,25(4):97-99.
3林晨旭.音乐交互式编辑系统中的敏捷开发实践与案例分析[J].软件工程与应用,2024,13(3):392-397.

1耿磊,傅洪亮,陶华伟,卢远,郭歆莹,赵力.基于动态卷积递归神经网络的语音情感识别[J].计算机工程,2023,49(4):125-130. 被引量：2
2袁琼芳.基于深度学习的突发公共事件网络舆情情感识别研究[J].电脑知识与技术,2023,19(7):42-44.
3段爱华.探究情感教育在高中物理教学中的运用[J].中文科技期刊数据库（全文版）社会科学,2021(1):106-106.
4崔新霞,卢硕晨,孙敦凯.基于视觉感知的机器人工件识别方法研究[J].包装工程,2023,44(7):186-195. 被引量：1
5汪威,李琴锋,王冲,胡新宇.基于旋转框的电子元器件检测[J].仪表技术与传感器,2023(3):33-38. 被引量：2
6张鸿,黄保坤.拉曼光谱神经网络分类与样本扩充方法[J].福建电脑,2023,39(4):19-24. 被引量：1
7梁辉.浅谈初中美术教学中的情感教育及实施路径[J].中文科技期刊数据库（引文版）教育科学,2021(9):97-97.
8朱永华,冯天宇,张美贤,张文俊.基于增量方法的卷积语音情感识别网络[J].上海大学学报（自然科学版）,2023,29(1):24-40. 被引量：2
9张梦真,王庆芝,刘其朋.基于层次化可导航小世界网络改进的SeqSLAM算法[J].复杂系统与复杂性科学,2023,20(1):105-110.
10周福运.构建数学生长,筑梦学训融合——谈“生长数学”在体校数学教学中的应用[J].中国科技期刊数据库科研,2022(6):15-18.

计算机工程与设计

2023年第3期

浏览历史

内容加载中请稍等...

基于残差网络改进的中文语音情感识别被引量：3

参考文献9

二级参考文献55

共引文献102

同被引文献35

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于残差网络改进的中文语音情感识别 被引量：3

参考文献9

二级参考文献55

共引文献102

同被引文献35

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于残差网络改进的中文语音情感识别被引量：3