基于样本熵与MFCC融合的语音情感识别被引量：7

Speech Emotion Recognition Based on Fusion of Sample Entropy and MFCC

下载PDF

导出

摘要提出一种基于样本熵与Mel频率倒谱系数(MFCC)融合的语音情感识别方法。利用支持向量机分别对样本熵统计量与MFCC进行处理,计算其属于高兴、生气、厌烦和恐惧4种情感的概率,采用加法规则和乘法规则对情感概率进行融合,得到识别结果。仿真实验结果表明,该方法的识别率较高。 This paper proposes a method of speech emotion recognition based on fusion of sample entropy and Mel-frequency Cepstral Coefficients（MFCC）.Sample entropy statistic and MFCC are modeled with Support Vector Machine（SVM） respectively to obtain the probabilities of happy,angry,bored and afraid.The sum and product rules are used to fuse the probabilities to gain the final decision.Simulation results demonstrate that the recognition rate obtained with the proposed method is high.

作者屠彬彬于凤芹

机构地区江南大学物联网工程学院

出处《计算机工程》 CAS CSCD 2012年第7期142-144,共3页 Computer Engineering

基金国家自然科学基金资助项目(61075008)

关键词语音情感识别样本熵 MEL频率倒谱系数支持向量机 speech emotion recognition sample entropy Mel-frequency Cepstral Coefficients（MFCC） Support Vector Machine（SVM）

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2Aditya B K,Aurobinda R,Tapan K B. Emotion Recognition from Assamese Speeches Using MFCC Features and GMM Classifier[A].Hyderabad,India,2008.
3周萍,唐李珍.基于信息融合的短语音说话人识别方法研究[J].计算机工程,2011,37(2):169-171. 被引量：3
4Richman J S,Moorman J R. Physiological Time-series Analysis Using Approximate Entropy and Sample Entropy[J].American Journal of Physiology-Heart and Circulatory Physiology,2000,(06):2039-2049.
5白冬梅,邱天爽,鲍海平.基于经验模式分解与样本熵的癫痫预测方法[J].中国生物医学工程学报,2006,25(5):527-531. 被引量：12
6董志峰,汪增福.基于动态MFCC的说话人识别算法[J].模式识别与人工智能,2005,18(5):596-601. 被引量：7
7Kittler J,Hatef M,Duin R P. On Combining Classifiers[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,(03):226-239.doi:10.1109/34.667881.

二级参考文献25

1蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：37
2王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
3林琳,王树勋,郭纲.短语音说话人识别新方法的研究[J].系统仿真学报,2007,19(10):2272-2275. 被引量：10
4Huang N E, Shen Zheng, Steven R L. The Empirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and Non-stationary Time Series Analysis[EB/OL]. (1998-03-08). http:/www.citeulike.org/user/elferdo/article/2681232.
5Delechelle E, Lemoine J, Oumar N. Empirical Mode Decomposition: An Analytical Approach for Sifting Process[J]. IEEE Signal Processing Letters, 2005, 12(11): 764-767.
6Young K H, et al. Pitch Detection with Average Magnitude Difference Function Using Adaptive Threshold Algorithm for Estimating Shimmer and Jitter. In: Proc of the 20th IEEE International Annual Conference on Engineering in Medicine and Biology Society. Hong Kong, China, 1998, Ⅵ:3162-3164.
7Wang Y R, Wong I J, Tsao T C. A Statistical Pitch Detection Algorithm. In.. Proc of the IEEE International Conference on Acoustics, Speech, and Signal Processing. Orlando, USA,2002,Ⅰ:13--17.
8Hung W W, Wang H C. On the Use of Weighted Filter Bank Analysis for the Derivation of Robust MFCCs. IEEE Signal Processing Letters, 2001, 8(3):70--73.
9Molau S, Pitz M, Schluter R, Ney H. Computing Mel-Frequency Cepstral Coefficients on the Power Spectrum. In: Proc of the IEEE International Conference on Acoustics, Speech, and Signal Processing. Salt Lake City, USA, 2001, Ⅰ: 73--76.
10Reynolds D A, Rose R C. Robust Text-Independent Speaker Ⅰ-dentification Using Gaussian Mixture Speaker Models. IEEE Trans on Speech and Audio Processing, 1995, 3(1): 72--83.

共引文献38

1韩文静,李海峰.基于韵律语段的语音情感识别方法研究[J].清华大学学报（自然科学版）,2009(S1):1363-1368. 被引量：8
2王晶,徐光华,张庆.经验模态分解和Kolmogorov测度的癫痫预测算法[J].西安交通大学学报,2007,41(11):1364-1367. 被引量：1
3张燕,唐振民,李燕萍.基于单字音特征提取的说话人识别方法[J].计算机工程,2009,35(10):188-189. 被引量：1
4卿湘运,王行愚.鲁棒贝叶斯混合分布的模型选择[J].南京大学学报（自然科学版）,2009,45(5):689-698. 被引量：1
5董红生,邱天爽,张爱华,郝晓弘.基于HHT边际谱熵和能量谱熵的心率变异信号的分析方法[J].中国生物医学工程学报,2010,29(3):336-344. 被引量：14
6陆捷荣,詹永照,毛启容.基于D-S证据的多语段融合语音情感识别[J].计算机工程,2010,36(18):205-207. 被引量：3
7黄程韦,赵艳,金赟,于寅骅,赵力.实用语音情感的特征分析与识别的研究[J].电子与信息学报,2011,33(1):112-116. 被引量：33
8吴虎胜,吕建新,吴庐山,敖云辉,朱玉荣.基于ISVD和小波降噪理论的轴承故障诊断[J].轴承,2011(2):48-51. 被引量：1
9姚红,谭敏,郭武.音素层特征超矢量的说话人识别性能及优化[J].计算机工程与应用,2011,47(26):140-142.
10汤丽平,刘剑.基于近似熵的心肌猝死预警诊断[J].计算机工程,2012,38(9):202-204. 被引量：2

同被引文献54

1柳长源,孙雨涵,李文强,兰朝凤.基于MAResnet的脑电情感识别研究[J].仪器仪表学报,2020,41(7):235-242. 被引量：5
2张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
3董志峰,汪增福.基于动态MFCC的说话人识别算法[J].模式识别与人工智能,2005,18(5):596-601. 被引量：7
4白冬梅,邱天爽,鲍海平.基于经验模式分解与样本熵的癫痫预测方法[J].中国生物医学工程学报,2006,25(5):527-531. 被引量：12
5雷雄国,曾以成,李凌.基于近似熵的语音端点检测[J].声学技术,2007,26(1):121-125. 被引量：11
6RICHMAN J S, MOORMAN J R. Physiological time - series analysis using approximate entropy and sample entropy [ J ]. American Journal of Physiology Heart and Circulatory Physi- ology ,2000,278 (6) :2039 -2049.
7Wolpaw J R,Birbaumer N,McFarland D J.Brain-computer interface for communication and control[J].Clinical Neuro-physiology,2002,113(6):767-791.
8Pincus S M.Approximate entropy as a measure of system complexity[J].Proceeding of the National Academy Sciences,1991,88(6):2297-2301.
9Richman J S,Moomaan J R.Physiologica time series analysis using approximate entropy and sample entropy[J].Am J Physio:Heart Circ Physio,2000,278(61):2039-2049.
10Feng Y H, Schlindwein F S. Normalized wavelet packets quantifiers for condition monitoring[J]. Mechanical Systems and Signal Processing,2009,23 ( 3 ) : 712 - 723.

引证文献7

1乔晓艳,彭佳卉.基于少次相干平均和样本熵的视听诱发脑电特征提取[J].测试技术学报,2014,28(3):203-208. 被引量：1
2景新幸,赵靖,杨海燕.一种自适应样本熵的语音端点检测方法[J].电声技术,2014,38(8):45-48. 被引量：2
3袁洪芳,秦桂林,王华庆.基于MFCCS和改进VPMCD的滚动轴承故障诊断[J].测控技术,2016,35(4):22-26. 被引量：1
4张前进,王华东.基于核典型相关分析和支持向量机的语音情感识别模型[J].南京理工大学学报,2017,41(2):191-197. 被引量：3
5龙英潮,丁美荣,林桂锦,刘鸿业,曾碧卿.基于视听觉感知系统的多模态情感识别[J].计算机系统应用,2021,30(12):218-225. 被引量：2
6房春英,张馨桐,王璞.基于脑网络的多特征融合情感识别方法[J].黑龙江科技大学学报,2023,33(3):470-474.
7骆雁雁.基于多特征融合的英语口语智能评价方法研究[J].外语电化教学,2023(2):49-55.

二级引证文献9

1奚琰.基于对比学习的细粒度遮挡人脸表情识别[J].计算机系统应用,2022,31(11):175-183. 被引量：3
2李倩玉.基于自动语音识别技术的媒资检索管理系统[J].电声技术,2015,39(8):58-62. 被引量：1
3胡春海,信思旭,刘斌,刘永红.基于小波变换和盲源分离的P300识别算法研究[J].计量学报,2017,38(2):242-246. 被引量：7
4田秀丽,黄亚丽.空间噪声下语音信号端点检测仿真研究[J].计算机仿真,2017,34(5):406-409. 被引量：3
5史一明,程健,陈自强.基于WLR和PSO-AFS-SVR的滚动轴承可靠度预测方法[J].测控技术,2019,38(3):4-10. 被引量：4
6高成吉.一种语言情绪识别方法的研究[J].计算机与数字工程,2019,47(7):1622-1626.
7沈葛亮,顾斌杰,潘丰.基于灰狼优化算法的孪生支持向量回归机[J].南京理工大学学报,2020,44(2):202-208. 被引量：7
8梅武松,陈科仲,李忠新.某小型地面无人作战平台控制手势识别方法研究[J].南京理工大学学报,2022,46(3):262-269. 被引量：3
9李牧,杨宇恒,柯熙政.基于混合特征提取与跨模态特征预测融合的情感识别模型[J].计算机应用,2024,44(1):86-93.

1吕达,刘文婧,陈肖洁.规则的多核学习支持向量回归算法[J].机械设计与制造,2016(12):53-56. 被引量：3
2张志坚,赵松,张培仁.增强典型相关分析及其在多模态生物特征识别特征层融合中的应用[J].中国科学技术大学学报,2010,40(8):790-795. 被引量：5
3叶斌.基于HMM和PNN的语音情感识别研究[J].青岛大学学报（工程技术版）,2011,26(4):53-56.
4吕达,刘文婧,陈肖洁.加法规则的多核学习在甲醇合成中的应用[J].机械设计与制造,2017(5):267-269.
5刘圣君,尤鑫.随机系统的噪声[J].科技视界,2012(26):16-17.
6吴云芳,王淼,金澎,俞士汶.多分类器集成的汉语词义消歧研究[J].计算机研究与发展,2008,45(8):1354-1361. 被引量：14
7宋群,张骏,邓正宏.基于偏斜数据流分类的入侵检测方法[J].西北工业大学学报,2009,27(6):859-862. 被引量：1
8蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：37
9李凯,王灵晓,崔丽娟.位平面分解的人脸识别集成方法研究[J].烟台大学学报（自然科学与工程版）,2009,22(4):286-290. 被引量：1
10龚雪慧,王成杰.基于c++三维数组实现大整数相乘的算法[J].电脑与信息技术,2016,24(4):16-18. 被引量：1

计算机工程

2012年第7期

浏览历史

内容加载中请稍等...

基于样本熵与MFCC融合的语音情感识别被引量：7

参考文献7

二级参考文献25

共引文献38

同被引文献54

引证文献7

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于样本熵与MFCC融合的语音情感识别 被引量：7

参考文献7

二级参考文献25

共引文献38

同被引文献54

引证文献7

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于样本熵与MFCC融合的语音情感识别被引量：7