基于语谱图和卷积神经网络的语音情感识别被引量：8

Speech emotion recognition based on spectrogram and CNNs

下载PDF

导出

摘要针对语音情感识别的特征提取和分类模型构建问题,首先提出了一种基于语谱图的特征提取方法,将语谱图进行归一灰度化后,利用Gabor滤波器进行纹理特征提取,并采用主成分分析(principal component analysis,PCA)对特征矩阵进行降维;然后分析了卷积神经网络(convolutional neural networks,CNNs)并把其作为情感识别分类器;最后在Emo DB和CASIA库进行了不同的比对实验.实验结果取得了较高情感识别率,表明了所提特征提取方法的有效性以及CNNs用作情感分类的可行性. To solve the problem of feature extraction and classification in speech emotion recognition,first a feature extraction method based on spectrogram was proposed,the method uses Gabor filter to extract the texture feature from the normalized spectrum gray image,and reduce these feature matrix dimension using the PCA.Then the convolutional neural networks was used as an emotion recognition classifier.Finally the performance of this system was assessed by computer simulations and a higher recognition rates were achieved respectively on the Emo DB and CASIA database through comparative experiment in different conditions,the results showed that the method proposed in this paper is effective and the CNNs can be used successfully for emotion recognition as a classifier.

作者田熙燕徐君鹏杜留锋

机构地区河南科技学院信息工程学院南京邮电大学通信与信息工程学院

出处《河南科技学院学报（自然科学版）》 2017年第2期62-68,共7页 Journal of Henan Institute of Science and Technology(Natural Science Edition)

基金国家青年科学基金资助项目(61501260) 河南省教育厅重点项目(5201029140111)

关键词语音情感识别语谱图 GABOR滤波器 PCA CNNS speech emotion recognition spectrogram Gabor filter PCA CNNs

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：169
2陶华伟,査诚,梁瑞宇,张昕然,赵力,王青云.面向语音情感识别的语谱图特征提取算法[J].东南大学学报（自然科学版）,2015,45(5):817-821. 被引量：17

二级参考文献98

1van Bezooijen R,Otto SA,Heenan TA. Recognition of vocal expressions of emotion:A three-nation study to identify universal characteristics[J].{H}JOURNAL OF CROSS-CULTURAL PSYCHOLOGY,1983,(04):387-406.
2Tolkmitt FJ,Scherer KR. Effect of experimentally induced stress on vocal parameters[J].Journal of Experimental Psychology Human Perception Performance,1986,(03):302-313.
3Cahn JE. The generation of affect in synthesized speech[J].Journal of the American Voice Input/Output Society,1990.1-19.
4Moriyama T,Ozawa S. Emotion recognition and synthesis system on speech[A].Florence:IEEE Computer Society,1999.840-844.
5Cowie R,Douglas-Cowie E,Savvidou S,McMahon E,Sawey M,Schro. Feeltrace:An instrument for recording perceived emotion in real time[A].Belfast:ISCA,2000.19-24.
6Grimm M,Kroschel K. Evaluation of natural emotions using self assessment manikins[A].Cancun,2005.381-385.
7Grimm M,Kroschel K,Narayanan S. Support vector regression for automatic recognition of spontaneous emotions in speech[A].IEEE Computer Society,2007.1085-1088.
8Eyben F,Wollmer M,Graves A,Schuller B Douglas-Cowie E Cowie R. On-Line emotion recognition in a 3-D activation-valencetime continuum using acoustic and linguistic cues[J].Journal on Multimodal User Interfaces,2010,(1-2):7-19.
9Giannakopoulos T,Pikrakis A,Theodoridis S. A dimensional approach to emotion recognition of speech from movies[A].Taibe:IEEE Computer Society,2009.65-68.
10Wu DR,Parsons TD,Mower E,Narayanan S. Speech emotion estimation in 3d space[A].Singapore:IEEE Computer Society,2010.737-742.

共引文献181

1朱梦帆,汪志成,戴诗柏.基于语谱图与稠密卷积神经网络的性别与年龄识别研究[J].仪表技术,2022(1):66-70. 被引量：3
2郑成杰,郑之.基于最大分类器差异域适应方法的3维点云分类[J].信息与控制,2023,52(5):588-597.
3张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
4李霞,卢官明,闫静杰,张正言.多模态维度情感预测综述[J].自动化学报,2018,44(12):2142-2159. 被引量：26
5李高玲,帖云,齐林.基于随机森林分类优化的多特征语音情感识别[J].微电子学与计算机,2019,36(1):70-73. 被引量：12
6张福泉.情感建模及情感识别技术研究[J].廊坊师范学院学报（自然科学版）,2014,14(5):23-26. 被引量：4
7孙凌云,何博伟,刘征,杨智渊.基于语义细胞的语音情感识别[J].浙江大学学报（工学版）,2015,49(6):1001-1008. 被引量：2
8余春艳,翁子林.音频情感感知与视频精彩片段提取[J].计算机辅助设计与图形学学报,2015,27(10):1890-1899. 被引量：4
9孙颖,姚慧,张雪英,张奇萍.基于混沌特性的情感语音特征提取[J].天津大学学报（自然科学与工程技术版）,2015,48(8):681-685. 被引量：12
10陶华伟,査诚,梁瑞宇,张昕然,赵力,王青云.面向语音情感识别的语谱图特征提取算法[J].东南大学学报（自然科学版）,2015,45(5):817-821. 被引量：17

同被引文献56

1朱中华.抽油机常见故障分析与处理[J].化学工程与装备,2020(12):63-64. 被引量：5
2马义德,袁敏,齐春亮,刘悦,刘映杰.基于PCNN的语谱图特征提取在说话人识别中的应用[J].计算机工程与应用,2005,41(20):81-84. 被引量：23
3杨胜跃,陆汝华,周宴宇,何正明.轴承故障音频诊断系统设计与开发[J].计算机仿真,2008,25(4):335-338. 被引量：2
4田德财,张新卿.交互式语音应答系统在抑郁障碍筛查中的应用[J].中国神经精神疾病杂志,2010,36(11):695-697. 被引量：4
5胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：19
6肖纯智,孙大飞,高勇.一种基于语谱图分析的语音增强算法[J].电声技术,2012,36(9):44-48. 被引量：6
7蒋庆斌,包永强,王浩,赵力.基于改进GMM的耳语语音情感识别方法研究[J].计算机应用与软件,2012,29(11):73-74. 被引量：3
8王杰,耿丽红,朱晓东.一种改进的HMM/RBF情感语音识别方法[J].郑州大学学报（理学版）,2012,44(4):68-72. 被引量：5
9林建海,陆开,孙雨轩.基于均值-方差模型的Relief特征选择优化算法[J].系统仿真技术,2013,9(3):224-228. 被引量：7
10韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：169

引证文献8

1张雄,刘蓉,刘明.基于卷积特征提取与融合的语音情感识别研究[J].电子测量技术,2018,41(16):138-142. 被引量：3
2毕殿杰,魏苏林,赵涛,张子振.基于卷积神经网络的在线评论情感分析模型[J].河北科技师范学院学报,2019,33(2):41-47. 被引量：3
3刘虹,袁三男.基于多尺度残差深度卷积神经网络的语音识别[J].计算机应用与软件,2020,37(11):275-279. 被引量：11
4赵小蕾,许喜斌.融合浅层学习和深度学习模型的语音情感识别[J].计算机应用与软件,2020,37(12):108-112. 被引量：2
5张毅,秦小林,林远,李勇明,王品,张祖伟,李小飞.基于深层内嵌混合稀疏堆栈自动编码器和流形集成的精神病语音识别方法[J].生物医学工程学杂志,2021,38(4):655-662. 被引量：1
6焦亚萌,周成智,李文萍,崔琳,董免.融合多头注意力的VGGNet语音情感识别研究[J].国外电子测量技术,2022,41(1):63-69. 被引量：11
7李兴,朱苏青,刘松林.抽油机音频故障分析研究与应用[J].石油化工自动化,2022,58(5):82-86. 被引量：1
8司志梅,段志刚,赵庆婕.抽油机故障音频智能诊断技术应用研究[J].复杂油气藏,2022,15(4):113-116.

二级引证文献32

1张晋婧,刘双峰,丰雷,张瑜.融合注意力机制的人脸识别算法研究[J].国外电子测量技术,2023,42(2):107-113. 被引量：7
2占善华,张永平.一种公共法律服务智能语音数据管理系统的设计[J].电子技术与软件工程,2021(1):190-191.
3刘红梅.基于音频指纹技术的乐曲节拍识别系统[J].微型电脑应用,2021,37(7):137-139. 被引量：1
4王晰巍,贾若男,韦雅楠,张柳.多维度社交网络舆情用户群体聚类分析方法研究[J].数据分析与知识发现,2021,5(6):25-35. 被引量：8
5李怡菲,应娜,杨鹏.基于MD-CGAN的情感语音去噪算法[J].杭州电子科技大学学报（自然科学版）,2021,41(5):26-31. 被引量：1
6薛均晓,黄世博,王亚博,张朝阳,石磊.基于时空特征的语音情感识别模型TSTNet[J].郑州大学学报（工学版）,2021,42(6):28-33. 被引量：4
7张守叶.探究端到端的深度卷积神经网络语音识别[J].软件,2022,43(3):173-176. 被引量：1
8张浩然,谢云熙,张艳荣.基于TextCNN的文本情感分类系统[J].哈尔滨商业大学学报（自然科学版）,2022,38(3):285-292. 被引量：11
9尚丹.民族地区高校大学生信息素养状况调查与研究——以内蒙古民族大学调研数据为例[J].内蒙古民族大学学报（自然科学版）,2022,37(4):356-359.
10申玉杰,孙显彬,刘伦明,曾实现,井陆阳,姜云春.基于多源信息融合的刀具剩余寿命预测[J].组合机床与自动化加工技术,2022(9):143-146. 被引量：5

1曾召华,卢建军.基于Gabor滤波器的边缘检测方法[J].无线电工程,2000,30(3):31-34. 被引量：2
2田壮壮,占荣辉,胡杰民,张军.基于卷积神经网络的SAR图像目标识别研究.[J].雷达学报（中英文）,2016,5(3):320-325. 被引量：72
3张梦阳,孙学斌,李斌,周正,张梦阳,孙学斌,李斌,周正.基于非负矩阵分解的频谱感知技术研究[J].无线电工程,2013,43(11):1-3. 被引量：2
4于志明,周静.多腔薄膜梳状滤波器的透射峰随入射角的变化规律[J].激光与红外,2009,39(7):761-764.
5张晴晴,刘勇,潘接林,颜永红.基于卷积神经网络的连续语音识别[J].工程科学学报,2015,37(9):1212-1217. 被引量：70
6GPCA／SPCA举行“FPC水平沉铜最新解决方寨发布会”[J].印制电路资讯,2017,0(3):48-48.
7冯登国.线性码和Walsh谱[J].信息安全与通信保密,1994,0(2):60-62. 被引量：2
8GPCA／SPCA参加第五届中国电子信息博览会[J].印制电路资讯,2017,0(3):49-49.
9李红丽,马耀锋.粗糙集与神经网络的激光图像分类识别[J].激光杂志,2017,38(5):108-110. 被引量：1
10GPCA／SPCA会员企业贝加、迅捷兴获“深圳知名品牌”称号[J].印制电路资讯,2017,0(3):56-56.

河南科技学院学报（自然科学版）

2017年第2期

浏览历史

内容加载中请稍等...

基于语谱图和卷积神经网络的语音情感识别被引量：8

参考文献2

二级参考文献98

共引文献181

同被引文献56

引证文献8

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于语谱图和卷积神经网络的语音情感识别 被引量：8

参考文献2

二级参考文献98

共引文献181

同被引文献56

引证文献8

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于语谱图和卷积神经网络的语音情感识别被引量：8