基于聚合经验模态分解的情感语音特征提取被引量：4

Feature Extraction of Emotional Speech Based on Ensemble Empirical Mode Decomposition

下载PDF

导出

摘要特征提取是情感语音识别系统的关键过程,决定系统整体识别性能。传统特征提取技术假定语音信号是线性、短时平稳信号,不具有自适应性。为此,通过聚合经验模态分解(EEMD)算法以非线性的处理方式提取特征。情感语音信号经EEMD分解后得到一组固有模态函数(IMF),利用相关系数法筛选出有效分量集合,对集合函数计算得到IMF能量特征(IMFE)。选用德国柏林语音库作为实验数据来源,将IMFE特征、韵律特征、梅尔倒谱系数特征以及三者的融合特征分别输入到支持向量机中,通过比较不同特征的识别结果验证IM FE特征的有效性。实验结果表明,IM FE特征与声学特征融合后的平均识别率达到91.67%,可有效区分不同的情感状态。 Extracting features of emotional speech signal is particularly important in the emotional speech recognition systems, which determines the overall recognition performance. The traditional feature extraction techniques assume speech signal is linear and short-stationary, without self-adapability. By using the Ensemble Empirical Mode Decomposition（EEMD） algorithm, the features are extracted in a nonlinear way. First, the emotional speech signal is decomposed into a series of Intrinsic Mode Function（IMF） by EEMD and effective IMFs set is selected using correlation coefficient method. Then the IMF Energy （IMFE） characteristics are obtained through calculation of the function in the set. In the experiment, Berlin speech database is chosen as the data source. IMFE features, prosodic features, Mel- Fregurecy Cepstrum Coefficients（MFCC） features and the fusion features of the three are input inte SVM respectively. The recognition results of different feature combinations are compared to validate the performance of the IMFE features. The experimental results show that the average recognition rate of IMFE feature merging with acoustic feature can reach 91.67% ,and IMFE can effectively distingwish between different states.

作者张乐张雪英孙颖张卫

机构地区太原理工大学信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2017年第8期306-309,315,共5页 Computer Engineering

基金国家自然科学基金(61371193) 山西省回国留学人员科研基金(2013-034)

关键词特征提取聚合经验模态分解固有模态函数 Spearman Rank相关系数声学特征情感语音识别 feature extraction Ensemble Empirical Mode Decomposition （EEMD） Intrinsic Mode Function （IMF） Spearman Rank correlation coefficient acoustic feature emotional speech recognition

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1张汝波,刘冠群,吴俊伟,吕西宝.移动机器人语音控制技术研究与实现[J].华中科技大学学报（自然科学版）,2013,41(S1):348-351. 被引量：8
2赵力,黄程韦.实用语音情感识别中的若干关键技术[J].数据采集与处理,2014,29(2):157-170. 被引量：35
3秦娜,金炜东,黄进,李智敏,刘景波.基于EEMD的高速列车转向架故障诊断[J].计算机工程,2013,39(12):1-4. 被引量：11
4曾现巍,许凌云,江晓波.基于快速EEMD单通道混合信号分离算法的研究[J].电子设计工程,2015,23(14):20-22. 被引量：5
5张鑫瑜,李雪耀,张汝波,于桂芬.基于语音抑制的飞机识别研究[J].华中科技大学学报（自然科学版）,2011,39(S2):291-294. 被引量：1
6秦娜,金炜东,黄进,李智敏.高速列车转向架故障信号的聚合经验模态分解和模糊熵特征分析[J].控制理论与应用,2014,31(9):1245-1251. 被引量：12

二级参考文献87

1赵力,王治平,卢韦,邹采荣,吴镇扬.全局和时序结构特征并用的语音信号情感特征识别方法[J].自动化学报,2004,30(3):423-429. 被引量：15
2王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
3程道来,仪垂杰,姚红宇,郭健翔,周扬民.飞机舱音记录器声信息识别方法的初步研究[J].噪声与振动控制,2006,26(3):81-84. 被引量：15
4张守娟,周诠.基于加权小波分形的卫星遥感图像飞机类型识别[J].微电子学与计算机,2007,24(6):173-175. 被引量：4
5仪垂杰,程道来,郭健翔,姚红宇,杨琳.基于不同方法的飞机舱音背景声频谱特征的获取与分析[J].振动与冲击,2007,26(8):109-111. 被引量：9
6吴秋荣,杨万麟.基于NMFs-LDA的雷达目标距离像识别[J].现代电子技术,2007,30(19):63-65. 被引量：3
7Omar F K,Gaouda A M.Dynamic Wavelet-based Tool for Gearbox Diagnosis[J].Mechanical Systems and Signal Processing,2012,26:190-204.
8Kim E,Lee Y,Lee S.Health Monitoring of a Glass Transfer Robot in the Mass Production Line of Liquid Crystal Display Using Abnormal Operating Sounds Based on Wavelet Packet Transform and Artificial Neural Network[J].Journal of Sound and Vibration,2012,331(14):3412-3427.
9Lei Yaguo,He Zhengjia,Zi Yanyang.EEMD Method and WNN for Fault Diagnosis of Locomotive Roller Bearings[J].Expert Systems with Applications,2011,38(6):7334-7341.
10Zhang Jian,Yan Ruqiang.Performance Enhancement of Ensemble Empirical Mode Decomposition[J].Mechanical Systems and Signal Processing,2010,24(7):2104-2123.

共引文献66

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：14
2张霞,杨勇,赵力.基于复数帧段特征的语音情感识别方法[J].电子器件,2022,45(2):479-482.
3张明阳,查诚,塔什甫拉提.尼扎木丁,徐新洲,赵力.结合数据场情感空间和混合蛙跳算法的连续语音情感变化趋势检测[J].声学学报,2019,44(1):12-19. 被引量：5
4张美兰,孙永奎,金炜东,翟冰.高速列车振动监测数据的广义维数特征提取[J].计算机工程与设计,2014,35(9):3310-3314.
5奚吉,赵力,左加阔.基于改进多核学习的语音情感识别算法[J].数据采集与处理,2014,29(5):730-734. 被引量：7
6高静,邓甲昊.经验模态分解的理论研究及应用[J].科技导报,2015,33(2):108-112. 被引量：8
7赵力,张昕然,梁瑞宇,王青云.数字助听器若干关键算法研究现状综述[J].数据采集与处理,2015,30(2):252-265. 被引量：10
8俞伟丰,张文瑞.降低固定式架车机同步机械故障的技术改造[J].中国高新技术企业,2015(18):37-38. 被引量：2
9孙颖,姚慧,张雪英,张奇萍.基于混沌特性的情感语音特征提取[J].天津大学学报（自然科学与工程技术版）,2015,48(8):681-685. 被引量：12
10陈志,李天瑞,李明,杨燕.基于计算统一设备架构的高铁故障诊断方法[J].计算机应用,2015,35(10):2819-2823. 被引量：3

同被引文献34

1张君昌,李艳艳.基于小波包分析的鲁棒性语音识别[J].计算机工程与应用,2011,47(10):124-126. 被引量：2
2温万惠,刘光远,熊勰.基于生理信号的二分类情感识别系统特征选择模型和泛化性能分析[J].计算机科学,2011,38(5):220-223. 被引量：4
3孙长城,王春方,王勇军,杜金刚,徐强,綦宏志,万柏坤,明东.脑卒中后抑郁症静息脑电信号非线性特征提取与分析[J].国际生物医学工程杂志,2013,36(3):143-146. 被引量：7
4于俊婷,刘伍颖,易绵竹,李雪,李娜.国内语音识别研究综述[J].计算机光盘软件与应用,2014,17(10):76-78. 被引量：27
5谢勇,徐健学,杨红军,胡三觉.皮层脑电时间序列的相空间重构及非线性特征量的提取[J].物理学报,2002,51(2):205-214. 被引量：25
6胡占强,耿龙.基于相似图像检索与字典学习的图像去噪算法[J].现代计算机,2016,22(2):49-53. 被引量：1
7张严平,陆锐敏.一种改进的混沌扩频序列优选算法[J].计算机工程,2016,42(3):121-124. 被引量：5
8黄威,石佳影.基于深度神经网络的语音识别研究[J].现代计算机,2016,22(5):20-25. 被引量：4
9林静,杨继臣,张雪源,李新超.基于稀疏表示权重张量的音频特征提取算法[J].计算机应用,2016,36(5):1426-1429. 被引量：5
10张毅,谢延义,罗元,席兵.一种语音特征提取中Mel倒谱系数的后处理算法[J].智能系统学报,2016,11(2):208-215. 被引量：12

引证文献4

1蒋久松,熊富强,毛文奇,张超峰.智能语音识别方法在电力移动作业平台中的应用[J].自动化应用,2017(11):124-127. 被引量：5
2李才隆,叶宁,黄海平,王汝传.基于递归定量分析的生理信号情感识别[J].计算机技术与发展,2018,28(11):94-98. 被引量：3
3张红兵.Mel频率下语音信号深度频谱特征提取方法仿真[J].计算机仿真,2020,37(5):197-200. 被引量：6
4杨战社,孔晨再,荣相,魏礼鹏,史小军.基于EEMD能量熵与ANN的矿用异步电机故障诊断[J].微电机,2021,54(8):23-27. 被引量：10

二级引证文献24

1车敏诗,聂春燕,范如俊,杨承金,阮新磊.一种基于混沌特征及优化CHAID决策树的情绪识别方法[J].计算机应用研究,2020,37(S02):105-107. 被引量：3
2续珩.基于深度学习技术的智能语音识别应用研究[J].神州,2018,0(36):221-221. 被引量：1
3颜清,张海容,王柳乃,李金讯.电力巡检移动作业平台的设计探索[J].通信电源技术,2019,36(4):159-160.
4刘新怡,田维维,梁文茹,何凌,尹恒.基于递归图分析的腭裂语音鼻漏气自动识别算法[J].计算机科学,2020,47(2):95-101.
5高渝蓉,娄屹萍.高密度电子电路多通道频谱误差自动识别研究[J].通信电源技术,2020,37(22):34-35.
6许士锦,范展滔,邱生敏,张坤.基于语音识别及自然语言处理对话流的人机智能交互方法研究[J].机械与电子,2021,39(7):65-69. 被引量：7
7窦丽霞,周其龙.资源数据传输效率优化评估数学模型仿真[J].计算机仿真,2021,38(9):155-158.
8张大林,任萱,徐艺敏,笪涛,于晓蒙.企业内网系统语音识别技术的设计与实现[J].数字技术与应用,2021,39(12):169-172. 被引量：1
9唐琴.电子通信信号循环频率特征自提取方法研究[J].通信电源技术,2021,38(17):60-62.
10薛赛,贺青川,潘骏,黄晓诚.基于分形盒维数和GA-SVM的PMSM动态偏心故障诊断方法研究[J].微特电机,2022,50(5):1-6.

1张康锋.电视节目后期制作中视音频技术研究[J].西部广播电视,2017,38(13):200-200. 被引量：3
2胡健,罗迎,张群,孙玉雪,胡超.弹道目标宽带雷达干涉式三维成像与微动特征提取[J].电子与信息学报,2017,39(8):1865-1871. 被引量：8
3纪龙江.φ0.15mm以下微小孔线路板加工技术的研发与应用[J].印制电路信息,2017,25(7):23-25.
4田秀丽,黄亚丽.空间噪声下语音信号端点检测仿真研究[J].计算机仿真,2017,34(5):406-409. 被引量：3
5申金媛,李航,刘润杰,孔银亮,程仲记.基于相关系数的有效特征光谱筛选方法[J].郑州大学学报（理学版）,2017,49(3):28-31. 被引量：2
6黄孝宁.电容式多点触控芯片模拟前端接口设计[J].商业故事,2016,0(28):150-150.
7朱秋明,薛翠薇,杨颖,陈小敏.三维传播环境天线阵列空域相关性研究[J].系统工程与电子技术,2017,39(9):1936-1941. 被引量：3
8王运成.无线局域网指纹匹配身份认证仿真研究[J].计算机仿真,2017,34(7):244-247. 被引量：6
9朱艳,邵璐.《朗读者》栏目视觉识别系统的元素构建[J].西部广播电视,2017,38(14):122-123. 被引量：1
10张国玲,范颖.视频监控中的考生异常行为识别[J].控制工程,2016,23(4):512-516. 被引量：6

计算机工程

2017年第8期

浏览历史

内容加载中请稍等...

基于聚合经验模态分解的情感语音特征提取被引量：4

参考文献6

二级参考文献87

共引文献66

同被引文献34

引证文献4

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于聚合经验模态分解的情感语音特征提取 被引量：4

参考文献6

二级参考文献87

共引文献66

同被引文献34

引证文献4

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于聚合经验模态分解的情感语音特征提取被引量：4