基于神经网络的语谱图情感分类算法被引量：4

Emotion classification algorithm of spectral map based on neural network

下载PDF

导出

摘要在语音情感分类算法中,目前大多数基于深度学习的方法存在没有考虑时域和频域的特征进行建模,且网络训练时间长、识别率不高的问题,提出了一种基于神经网络的语谱图情感分类算法。首先选取语谱图作为模型的输入,且为了减少语音情感特征提取过程中浅层特征和训练时上下文细节特征的损失,神经网络模型采用带有残差块的ResNet18网络和嵌入注意力机制的双向长短时记忆(BLSTM)网络的融合模型作为改进,利用ResNet18提取语谱图特征,然后使用注意力机制对其进行特征加权,在BLSTM网络中对加权后的特征进行训练和分类,最终该模型在CASIA数据集上的识别率分别为88.2%,与其他方法相比,所提算法有更好的语音情感分类效果,并且大幅度缩短了整体训练时间。 Aiming at the problem of low voice emotion recognition rate, an emotion classification algorithm based on neural network is proposed. Firstly, in order to reduce the loss of shallow features and contextual details during training of speech emotion feature extraction, this paper proposes a fusion model of ResNet18 network with residual blocks and a bi-directional long-term and short-term memory(BLSTM) network embedded with attention mechanism as an improvement. ResNet18 extracts the features and normalization of the spectrogram, and then uses the attention mechanism to weight the features, and trains and classifies the weighted features in the BLSTM network. In the end, the recognition rates of the model on the CASIA dataset dataset are 88.2%, respectively. The comparison with the existing literature recognition rates verifies the advantages of this algorithm.

作者金鹭张寿明 Jin Lu Zhang;Shouming(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China)

机构地区昆明理工大学信息工程与自动化学院

出处《电子测量技术》 2020年第24期57-63,共7页 Electronic Measurement Technology

关键词图像处理残差网络双向长短时记忆网络注意力机制深度学习 image processing residual network BLSM network attention mechanism deep learning

分类号 TP27 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献13

1刘艳,顾雪平,李军.用于暂态稳定评估的人工神经网络输入特征离散化方法[J].中国电机工程学报,2005,25(15):56-61. 被引量：24
2朱兆坤,李金宝.多特征信息融合LSTM-RNN检测OSA方法[J].计算机研究与发展,2020,57(12):2547-2555. 被引量：9
3周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1773
4程艳芬,陈垚鑫,陈逸灵,杨益.嵌入注意力机制并结合层级上下文的语音情感识别[J].哈尔滨工业大学学报,2019,51(11):100-107. 被引量：9
5陶华伟,张昕然,梁瑞宇,查诚,赵力,王青云.面向语音情感识别的改进可辨别完全局部二值模式[J].声学学报,2016,41(6):905-912. 被引量：9
6王恩德,齐凯,李学鹏,彭良玉.基于神经网络的遥感图像语义分割方法[J].光学学报,2019,39(12):85-96. 被引量：16
7李艳,彭春华,傅裕,孙惠娟.基于CNN-LSTM网络模型的风电功率短期预测研究[J].华东交通大学学报,2020,37(4):109-115. 被引量：15
8党宏社,王淼,张选德.基于深度学习的面部表情识别方法综述[J].科学技术与工程,2020,20(24):9724-9732. 被引量：12
9张旭东,杜家浩,黄宇方,石东贤,缪永伟.基于多尺度层级LSTM网络的时间序列预测分析[J].计算机科学,2019,46(S11):52-57. 被引量：15
10王飞,张莹,张东波,邵豪,成超鹏.基于捷径的卷积神经网络在人脸识别中的应用研究[J].电子测量与仪器学报,2018,32(4):80-86. 被引量：17

二级参考文献94

1谷建清,郭永彩,高潮,徐梅宣.二维Gabor小波在虹膜识别中的应用[J].仪器仪表学报,2005,26(z2):395-396. 被引量：6
2姚永强,易本顺,姚远.航空噪声背景下的语音端点检测和语音增强[J].电声技术,2006,30(1):36-39. 被引量：6
3苑玮琦,徐露,林忠华.一种基于人眼图像灰度分布特征的虹膜定位算法[J].光电子．激光,2006,17(2):226-230. 被引量：19
4JAIN A, BOLLE R, PAMKANTI S. Biometrics: personal identification in networked society[M]. Kluwer Academic Publishers, 1999: 1241.
5DAUGMAN J G. High confidence visual recognition of persons by a test of statistical independence[J]. IEEE Trans. Pattern Analysis and Machine Intelligence, 1993, 15(11):1148-1161.
6DAUGMAN J G. Statistical richness of visual phase information: Update on recognizing persons by iris patterns[J]. International Journal of Computer Vision, 2001, 45(1):25-38.
7DAUGMAN J G, The importance of being random: Statistical principles of iris recognition[J]. Pattern Recognitionm 2003, 36(2):279-291.
8WILDES R E Iris Recognition: An emerging biometric technology[J]. Proceedings of the IEEE, 1997, 85(9): 1348-1363.
9BOLES W W, BOASHAH B. A human identification technique using images of the iris and wavelet transform[J]. IEEE Trans. on Signal Processing, 1998, 46(4): 1185-1188.
10LIM S, LEE K, BYEON O, et al. Efficient iris recognition through improvement of feature vector and classifier[J]. ETRI Journal, 2001,23(2):61-8.5.

共引文献1916

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.

同被引文献31

1李响,李国正,邓明君,万平,严利鑫.基于语音频谱图像特征的人体疲劳检测方法[J].仪器仪表学报,2021,42(2):123-132. 被引量：17
2肖水芳,于萍,李五一,张亚梅,徐文,何膺远.论嗓音医学发展[J].中华耳鼻咽喉头颈外科杂志,2007,42(8):563-580. 被引量：7
3王修信,徐国钰,梁冬冬,潘永华,卢小春.艺术嗓音歌声客观评价初探[J].听力学及言语疾病杂志,2007,15(5):372-374. 被引量：9
4罗兰娥,许建明.歌唱艺术嗓音中声学参数的应用[J].山西电子技术,2009(2):32-33. 被引量：4
5吴媛,丁亚军,钱盛友,胡强,邹孝.基于神经网络的艺术嗓音客观评价方法[J].电声技术,2015,39(12):57-60. 被引量：2
6金晓航,李建华,孙毅.基于二元维纳过程的轴承剩余寿命预测[J].仪器仪表学报,2018,39(6):89-95. 被引量：22
7王俊,郑彤,雷鹏,魏少明.深度学习在雷达中的研究综述[J].雷达学报（中英文）,2018,7(4):395-411. 被引量：56
8冯浩然,阮怀林.时域欠采样线性调频信号参数估计方法[J].火力与指挥控制,2018,43(11):138-142. 被引量：2
9王小瑞,侯兴松,王生霄.基于YOLOv3网络的超宽带雷达生命信号检测[J].国外电子测量技术,2019,38(6):1-8. 被引量：9
10王赟,景博,焦晓璇,李振刚,李保军.基于自适应组合核函数的RVM剩余寿命预测研究[J].电子测量与仪器学报,2019,31(6):59-68. 被引量：7

引证文献4

1余晨,杨振泽,谷建星,景宁.雷达差拍信号的欠采样智能重建[J].国外电子测量技术,2021,40(9):143-148. 被引量：1
2李振曜,宋贺伦,应杰攀.应用机器学习对超晶格信号随机性的研究和评估[J].电子测量技术,2021,44(15):79-83.
3李延华,曹辉,张若雨,陈文韬,曹娜,范翔.一种新的艺术嗓音客观评价方法[J].电子设计工程,2023,31(2):156-159.
4张建飞,黄晋英,吕阳,赫婷,张毅.基于CBAM-ResNet的轴承剩余寿命预测[J].中北大学学报（自然科学版）,2023,44(4):360-365. 被引量：3

二级引证文献4

1薛安克,毛克成,张乐.多分类器联合虚警可控的海上小目标检测方法[J].电子与信息学报,2023,45(7):2528-2536. 被引量：4
2余江鸿,彭雄露,刘涛,杨文,叶帅.融合Inception V1-CBAM-CNN的轴承剩余寿命预测模型[J].机电工程,2024,41(1):107-114. 被引量：2
3王振环.基于长短期记忆神经网络的采煤机摇臂轴承剩余寿命预测[J].山东煤炭科技,2024,42(2):95-98.
4郭康,王志刚,徐增丙.基于AFF-Stablenet模型的小样本轴承故障诊断[J].现代制造工程,2024(9):144-151.

1郑艳,陈家楠,吴凡,付彬.基于CGRU模型的语音情感识别研究与实现[J].东北大学学报（自然科学版）,2020,41(12):1680-1685. 被引量：13
2王静,刘洪岩,刘芳芳,王青青.基于随机森林和卷积特征学习的人机交互语音情感识别[J].系统仿真学报,2020,32(12):2388-2400. 被引量：3
3尹良,李书芳,邓力.瀑布图及其在无线电信号观察中的应用[J].无线电,2021(3):62-66.
4史国荣,周琪,田宇.惯导系统转位条件下的误差特性分析[J].电子测试,2021,32(7):41-45. 被引量：1
5姜兆祯,韩裕生,任帅军,张延厚.基于改进PCNN模型的偏振图像融合算法[J].舰船电子工程,2021,41(3):33-36. 被引量：2
6邵凯,陈连成,刘胤.高移动性Jakes信道的学习与估计[J].系统工程与电子技术,2021,43(4):1119-1125. 被引量：4
7张军周,刘益辰,尹天宫.对抗相位编码末制导雷达有源干扰方法研究[J].舰船电子工程,2021,41(3):80-83. 被引量：2
8朱洲宗,徐晓华,罗佳.利用FY-3C折射率对大气边界层高度的反演与分析[J].武汉大学学报（信息科学版）,2021,46(3):395-401. 被引量：1

电子测量技术

2020年第24期

浏览历史

内容加载中请稍等...

基于神经网络的语谱图情感分类算法被引量：4

参考文献13

二级参考文献94

共引文献1916

同被引文献31

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于神经网络的语谱图情感分类算法 被引量：4

参考文献13

二级参考文献94

共引文献1916

同被引文献31

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于神经网络的语谱图情感分类算法被引量：4