基于改进语音处理的卷积神经网络中文语音情感识别方法被引量：15

Method for Chinese Speech Emotion Recognition Based on Improved SpeechProcessing Convolutional Neural Network

下载PDF

导出

摘要语音情感识别在人机交互中具有重要意义。为解决中文语音情感识别效率和准确率低等问题,提出一种基于Trumpet-6卷积神经网络模型的中文语音情感识别方法。在MFCC特征提取过程中,通过增加分帧加窗操作时采样点的个数,增添每个汉明窗内的特征及减少汉明窗个数,从而缩小MFCC特征图的像素尺寸,提高单次识别的处理效率。在此基础上,使用高斯白噪声对数据集进行数据增强处理,缓解训练过程中的过拟合问题。在CASIA语音情感数据集上的实验结果表明,该方法的测试准确率达95.7%,优于Lenet-5、RNN、LSTM等传统方法,且Trumpet-6卷积神经网络模型采用2048个采样点,仅需176550个待训练参数,与采用DCNN的ResNet34和循环神经网络模型相比,参数更少,结构更简单,处理速度更快。 Speech emotion recognition is essential in human-computer interaction.In this study,a Chinese speech emotion recognition method based on the Trumpt-6 convolutional neural network model was developed to solve the problem of low efficiency and accuracy of Chinese speech emotion recognition.During the process of extracting the Mel Frequency Cepstral Coefficient(MFCC)feature,the pixel size of the MFCC feature map was reduced to improve the processing efficiency of single recognition.This was achieved by increasing the number of sampling points in the frame windowing operation,adding the features in each Hamming window,and reducing the number of Hamming windows.Gaussian white noise was used to enhance the data set to minimize overfitting during the training process.The experimental results for the CASIA speech emotion data set show that the test accuracy of this method is 95.7%,which is better than those of traditional methods,such as Lenet-5,Recurrent Neural Network(RNN),and Long Short-Term Memory(LSTM).The Trump-6 convolutional neural network model uses 2048 sampling points and only 176550 parameters for training.This method has fewer parameters,a simpler structure,and faster processing than ResNet34 and the cyclic neural network model using deep convolutional neural networks.

作者乔栋陈章进邓良屠程力 QIAO Dong;CHEN Zhangjin;DENG Liang;TU Chengli(Microelectronics Research and Development Center,Shanghai University,Shanghai 200444,China;Computing Centre,Shanghai University,Shanghai 200444,China)

机构地区上海大学微电子研究与开发中心上海大学计算中心

出处《计算机工程》 CAS CSCD 北大核心 2022年第2期281-290,共10页 Computer Engineering

基金国家自然科学基金(61674100)。

关键词语音情感识别 MFCC特征高斯白噪声数据增强卷积神经网络 speech emotion recognition MFCC feature white Gaussian noise data set enhancement Convolution Neural Network(CNN)

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1余华,颜丙聪.基于CTC-RNN的语音情感识别方法[J].电子器件,2020,43(4):934-937. 被引量：6
2曾润华,张树群.改进卷积神经网络的语音情感识别方法[J].应用科学学报,2018,36(5):837-844. 被引量：12
3缪裕青,邹巍,刘同来,周明,蔡国永.基于参数迁移和卷积循环神经网络的语音情感识别[J].计算机工程与应用,2019,55(10):135-140. 被引量：31
4姜芃旭,傅洪亮,陶华伟,雷沛之.一种基于卷积神经网络特征表征的语音情感识别方法[J].电子器件,2019,42(4):998-1001. 被引量：24
5冯天艺,杨震.采用多任务学习和循环神经网络的语音情感识别算法[J].信号处理,2019,35(7):1133-1140. 被引量：19
6任杰,郭卉,姜囡.不同情感的语音声学特征分析[J].光电技术应用,2019,34(5):31-36. 被引量：2
7夏鼎,徐文涛.基于生成对抗网络合成噪声的语音增强方法研究[J].电子技术应用,2020,46(11):56-59. 被引量：5
8孔德廷.一种改进的基于对数谱估计的语音增强算法[J].声学技术,2020,39(2):208-213. 被引量：3
9薛珊,李广青,吕琼莹,毛逸维.基于卷积神经网络的反无人机系统声音识别方法[J].工程科学学报,2020,42(11):1516-1524. 被引量：11
10陈俊芬,赵佳成,韩洁,翟俊海.基于深度特征表示的Softmax聚类算法[J].南京大学学报（自然科学版）,2020,56(4):533-540. 被引量：13

二级参考文献40

1张立华,杨莹春.情感语音变化规律的特征分析[J].清华大学学报（自然科学版）,2008,48(S1):652-657. 被引量：14
2王晶,傅丰林,张运伟.语音增强算法综述[J].声学与电子工程,2005(1):22-26. 被引量：21
3姜晓庆,田岚,崔国辉.多语种情感语音的韵律特征分析和情感识别研究[J].声学学报,2006,31(3):217-221. 被引量：8
4余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
5曾志强,吴群,廖备水,高济.一种基于核SMOTE的非平衡数据集分类方法[J].电子学报,2009,37(11):2489-2495. 被引量：49
6钱向民.包含在语音信号中情感特征的分析[J].电子技术应用,2000,26(5):18-20. 被引量：4
7赵力,钱向民,邹采荣,吴镇扬.语音信号中的情感特征分析和识别的研究[J].通信学报,2000,21(10):18-24. 被引量：28
8王薇,杨丽萍,魏丽,刘艳.语音情感特征的提取与分析[J].实验室研究与探索,2013,32(7):91-94. 被引量：11
9韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：171
10赵力,黄程韦.实用语音情感识别中的若干关键技术[J].数据采集与处理,2014,29(2):157-170. 被引量：36

共引文献157

1郎巨林,郑晟.基于CNN-RNN集成的隧道事故异常声音识别[J].电子测量技术,2023,46(20):164-169. 被引量：5
2刘斌,贾浩强,杨一,申佳,盖美辰,宋天霖.基于改进OpenPose算法的矿工危险行为识别研究[J].电视技术,2023,47(2):20-23. 被引量：2
3丁胜男,李威,蔡立明,李蒙,胡常青.基于目标特征分布增强卷积神经网络的红外目标检测算法[J].导航与控制,2024,23(1):97-106.
4杨智伦,朱铮涛,陈树雄,李博,招祖炜.改进CNN的供水管道泄漏声音识别[J].国外电子测量技术,2023,42(1):153-158. 被引量：6
5王忠民,刘戈,宋辉.基于多核学习特征融合的语音情感识别方法[J].计算机工程,2019,45(8):248-254. 被引量：17
6廖小琴,徐杨.面向BSP-CNN的短文本情感倾向性分类研究[J].计算机工程与应用,2019,55(23):120-124. 被引量：6
7孙中皋,薛全德,王新军,黄晓理.基于脑电信号的情感识别方法综述[J].北京生物医学工程,2020,39(2):186-195. 被引量：11
8陈俊松,何自芬,张印辉.改进YOLOv3算法的筷子毛刺缺陷检测方法[J].食品与机械,2020,36(3):133-138. 被引量：2
9蒋桂黎.基于数据挖掘与智能计算的情感数据分析与心理预警系统[J].电子设计工程,2020,28(7):45-49. 被引量：5
10孙晓虎,李洪均.语音情感识别综述[J].计算机工程与应用,2020,56(11):1-9. 被引量：16

同被引文献94

1翟水丽.地铁车站环境下智能语音识别技术和方案分析[J].电声技术,2022,46(8):92-94. 被引量：2
2许雪琼,余小清,李昌莲,万旺根.改进波形相似叠加算法的音频时长调整[J].应用科学学报,2009,27(5):514-519. 被引量：2
3王胜.基于隐马尔可夫模型的语音情感识别[J].黑龙江科技信息,2010(28):2-2. 被引量：2
4黄永明,章国宝,李雄,达飞鹏.全局特征及弱尺度融合策略的小样本语音情感识别[J].声学学报,2012,37(3):330-338. 被引量：9
5李翔,李昕,胡晨,卢夏衍.面向智能机器人的Teager语音情感交互系统设计与实现[J].仪器仪表学报,2013,34(8):1826-1833. 被引量：10
6韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：171
7周悦,曾上游,杨远飞,冯燕燕,潘兵.基于分组模块的卷积神经网络设计[J].微电子学与计算机,2019,36(2):68-72. 被引量：4
8胡鑫磊,王春雨,张国毅,田润澜.积分二次相位函数和傅里叶变换的多相码参数估计[J].火力与指挥控制,2016,41(3):62-66. 被引量：1
9张朝柱,韩吉南,燕慧智.高速高精度固定角度旋转CORDIC算法的设计与实现[J].电子学报,2016,44(2):485-490. 被引量：24
10李学哲,张有东,封孝辉,胡兴志.基于内阻法的矿用锂电池高精度容量检测系统研究[J].煤炭工程,2016,48(9):127-129. 被引量：7

引证文献15

1孙俊东,刘喜,佘长超,刘思哲,王兆飞,于洋.基于IFA-CNN的新能源矿卡锂离子电池健康状态估算[J].煤炭工程,2023,55(S01):162-168. 被引量：1
2张会云,黄鹤鸣.基于异构并行神经网络的语音情感识别[J].计算机工程,2022,48(4):113-118. 被引量：9
3梁科晋,张海军,刘雅情,张昱,王月阳.混合多尺度卷积结合双层LSTM语音情感识别[J].计算机与现代化,2023(1):63-68. 被引量：3
4崔晨露,崔琳.面向数据增强的轻量化语音情感识别[J].计算机与现代化,2023(4):83-89. 被引量：5
5郭艳霞,金勇,唐宏,彭金枝.基于动态卷积与残差门控的多模态情感识别[J].计算机工程,2023,49(7):94-101. 被引量：1
6李可.面向语言对话场景的智能语音交互关键技术研究[J].自动化与仪器仪表,2023(8):295-299. 被引量：2
7包善书,车波,邓林红.基于双源域迁移学习的肺音信号识别[J].计算机工程,2023,49(9):295-302. 被引量：2
8叶汉民,李志波,程小辉,陶小梅.基于注意力机制的稀疏化剪枝方法[J].计算机工程与设计,2023,44(12):3642-3648.
9姚鑫.基于语音识别的多模态人机交互系统关键技术研究[J].自动化与仪器仪表,2023(11):222-225. 被引量：3
10樊永红,黄鹤鸣,张会云.基于焦点损失的ATCN-GRU语音情感识别[J].计算机仿真,2024,41(2):249-254. 被引量：1

二级引证文献27

1唐永军.基于深度学习的智能语音助手研究[J].现代信息科技,2021,5(12):75-79. 被引量：5
2孙韩玉,黄丽霞,张雪英,李娟.基于双通道卷积门控循环网络的语音情感识别[J].计算机工程与应用,2023,59(2):170-177. 被引量：5
3梁科晋,张海军,刘雅情,张昱,王月阳.混合多尺度卷积结合双层LSTM语音情感识别[J].计算机与现代化,2023(1):63-68. 被引量：3
4耿磊,傅洪亮,陶华伟,卢远,郭歆莹,赵力.基于动态卷积递归神经网络的语音情感识别[J].计算机工程,2023,49(4):125-130. 被引量：6
5欧志刚,刘玉屏,李若琳,覃可.国际中文课堂中的教师语音情感识别研究[J].现代教育技术,2023,33(8):87-95. 被引量：6
6吕亚荣.主流大数据并行计算系统性能优化研究[J].自动化与仪器仪表,2023(8):100-104.
7许萌,韩鹏.面向学前教育对话机器人的多模态情感识别实现关键技术[J].自动化与仪器仪表,2023(9):137-141.
8张会云,黄鹤鸣.面向网络舆情分析的多任务学习策略时间卷积网络[J].计算机工程,2023,49(10):89-96. 被引量：1
9黄雪英.行政治理中的情感计算技术应用及其风险预防[J].环球法律评论,2023,45(6):114-128. 被引量：2
10李伟,黄鹤鸣.基于双交叉熵的自适应残差卷积图像分类算法[J].计算机工程与设计,2023,44(12):3670-3676. 被引量：3

1艾旭升,盛胜利,李春华.一种随机平均分布的集成学习方法[J].计算机应用与软件,2022,39(2):180-187.
2Liang Jinyan.New Chapter in the Construction of the Cultural and Ecological Protection Areas in Guangxi[J].China & The World Cultural Exchange,2021,87(9):44-48.
3曾凡智,邹磊,周燕,邱腾达.条件GAN去模糊算法在人脸识别中的应用[J].小型微型计算机系统,2021,42(12):2607-2613. 被引量：1
4卢文峰,汪飞,周建江,张阳泉.机载机会阵雷达目标跟踪的最小驻留时间优化[J].电光与控制,2021,28(11):74-78. 被引量：1
5谷凤伟,陆军,夏桂华.facenet皮尔森判别网络的人脸识别方法[J].智能系统学报,2022,17(1):107-115. 被引量：10
6Hong Hu,Junfeng Gao,Jie Wu,Yijin Mao,Jingzhu Lu,Qingtao Li.Effects of mechanical operation-induced root injury on maize growth and yield[J].International Journal of Agricultural and Biological Engineering,2021,14(6):47-53.
7Koichi Nakamura,Kunihiro Asanuma,Akira Shimamoto,Shinji Kaneda,Keisuke Yoshida,Yumi Matsuyama,Tomohito Hagi,Tomoki Nakamura,Motoshi Takao,Akihiro Sudo.Spontaneous pneumothorax in a 17-year-old male patient with multiple exostoses:A case report and review of the literature[J].World Journal of Orthopedics,2021,12(11):945-953.
8余鹏程,谭平宇,高丽,贾桂霞.OT百合杂交育种历程中的花色演变分析[J].园艺学报,2021,48(10):1885-1894. 被引量：4
9Celia De La Mora-Orozco,José Germán Flores Garnica,Irma Julieta González Acuña,Juan De Dios Benavides Solorio,César S. Magaña Martínez,Laura Izascum Pérez Valencia.Soil Carbon Storage in Experimental Forest Plantations with Tropical Species[J].Open Journal of Forestry,2022,12(1):1-18. 被引量：1

计算机工程

2022年第2期

浏览历史

内容加载中请稍等...

基于改进语音处理的卷积神经网络中文语音情感识别方法被引量：15

参考文献11

二级参考文献40

共引文献157

同被引文献94

引证文献15

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于改进语音处理的卷积神经网络中文语音情感识别方法 被引量：15

参考文献11

二级参考文献40

共引文献157

同被引文献94

引证文献15

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于改进语音处理的卷积神经网络中文语音情感识别方法被引量：15