语音情感识别的关键技术被引量：18

Key Technologies in Speech Emotion Recognition

下载PDF

导出

摘要语音信号中的情感信息是一种很重要的信息资源,仅靠单纯的数学模型搭建和计算来进行语音情感识别就显现出不足。情感是由外部刺激引发人的生理、心理变化,从而表现出来的一种对人或事物的感知状态,因此,将认知心理学与语音信号处理相结合有益于更好地处理情感语音。首先介绍了语音情感与人类认知的关联性,总结了该领域的最新进展和研究成果,主要包括情感数据库的建立、情感特征的提取以及情感识别网络等。其次介绍了基于认知心理学构建的模糊认知图网络在情感语音识别中的应用。接着,探讨了人脑对情感语音的认知机理,并试图把事件相关电位融合到语音情感识别中,从而提高情感语音识别的准确率,为今后情感语音识别与认知心理学交叉融合发展提出了构思与展望。 Emotional information in speech signal is an important information resource.When verbal expression is combined with human emotion,emotional speech processing is no longer a simple mathematical model or pure calculation.Fluctuations of the mood are controlled by the brain perception;speech signal processing based on cognitive psychology can capture emotion better.In this paper the relevance analysis between speech emotion and human cognition is introduced firstly.The recent progress in speech emotion recognition is summarized,including the review of speech emotion databases,feature extraction and emotion recognition networks.Secondly a fuzzy cognitive map network based on cognitive psychology is introduced into emotional speech recognition.In addition,the mechanism of the human brain for cognitive emotional speech is explored.To improve the recognition accuracy,this report also tries to integrate event-related potentials to speech emotion recognition.This idea is the conception and prospect of speech emotion recognition integrated with cognitive psychology in the future.

作者张雪英孙颖张卫畅江

机构地区太原理工大学信息工程学院

出处《太原理工大学学报》北大核心 2015年第6期629-636 643,共9页 Journal of Taiyuan University of Technology

基金国家自然科学基金资助项目(61376693) 山西省青年科技研究基金资助项目(2013021016-2) 山西省研究生教育创新项目(2015-24)

关键词语音情感识别语音自然度声学特征认知机理模糊认知图事件相关电位 emotional speech recognition speech naturalness acoustic features cognitive mechanism fuzzy cognitive map event related potential

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献26

1尤鸣宇.语音情感识别的关键技术研究[D].浙江大学2007
2郅菲菲.字词认知N170成分发展的人工语言训练研究[D].浙江师范大学2013
3高维深.基于HMM/ANN混合模型的非特定人语音识别研究[D].电子科技大学2013
4王魁.汉字视知觉左侧化N170-反映字形加工还是语音编码[D].西南大学2012
5聂聃.基于脑电的情感识别[D].上海交通大学2012
6赵仑,著.ERPs实验教程[M]. 东南大学出版社, 2010
7Nia Cason,Corine Astésano,Daniele Sch?n.Bridging music and speech rhythm: Rhythmic priming and audio-motor training affect speech perception[J]. Acta Psychologica . 2014
8Lauri Nummenmaa,Heini Saarim?ki,Enrico Glerean,Athanasios Gotsopoulos,Iiro P. J??skel?inen,Riitta Hari,Mikko Sams.Emotional speech synchronizes brains across listeners and engages large-scale dynamic brain networks[J]. NeuroImage . 2014
9K. Sreenivasa Rao,Shashidhar G. Koolagudi,Ramu Reddy Vempada.Emotion recognition from speech using global and local prosodic features[J]. International Journal of Speech Technology . 2013 (2)
10孙颖,V.Werner,张雪英.A robust feature extraction approach based on an auditory model for classification of speech and expressiveness[J].Journal of Central South University,2012,19(2):504-510. 被引量：5

二级参考文献22

1DEVILLERS L,VAUDABLE C,CHASTAGNOL C.Real-life emotion-related states detection in call centers:A cross-corpora study[C]//Proceedings of 11th Annual Conference of the International Speech Communication Association.Chiba Japan:ISCA,2010: 2350 -2353.
2BATLINER A,STEIDL S,SCHULLER B,SEPPI D,VOGT T, WAGNER J,DEVILLERS L,VIDRASCU L,AHARONSON V, KESSOUS L,AMIR N.Whodunnit- Searching for the most important feature types signalling emotion-related user states in speech[J].Computer Speech andLanguage,2011,25(1):4-28.
3VERVERIDIS D,KOTROPOULOS C.Emotional speech recognition:Resources,features,and methods[J].Speech Communication,2006,48 (9):1162-1181.
4YANG B,LUGGER M.Emotion recognition from speech signals using new harmony features[J].Signal Processing,2010,90(5): 1415- 1423.
5LUGGER M,YANG B.On the relevant of high-level features for speaker independent emotion recognition of spontaneous speech[C]//Proceedings of 10th Annual Conference of the International Speech Communication Association.Brighton,United Kingdom:ISCA,2009:1995-1998.
6BOUDRAA A,BENRAMDANE S,CEXUS J,CHONAVEL T.Some useful properties of cross-ψB-energy operator[J].AEU-InternationalJournal of Electronics and Communications,2009, 63(9):728-735.
7KIM D,LEE S,KIL R.Auditory processing of speech signal for robust speech recognition in real-world noisy environments [J].IEEE Transactions Speech and Audio Processing,1999,7(1):55-58.
8RAMACHANDRAN R P,MAMMONE R J.Modern methods of speech processing[M].Dordrecht:Kluwer Academic Publishers, 1994.
9FILLON T,PRADO J.Evaluation of an ERB frequency scale noise reduction for hearing aids:A comparative study[J].SpeechCommunication,2003,39(1/2):23-32.
10JIAO Zhi-ping.Research on improved ZCPA speech recognition feature extraction algorithm[D].Taiyuan:College of InformationEngineering,Taiyuan University of Technology,2005.(in Chinese).

共引文献5

1王晶,赵胜辉,谢湘,匡镜明.Mapping methods for output-based objective speech quality assessment using data mining[J].Journal of Central South University,2014,21(5):1919-1926. 被引量：2
2谢松县,王挺.Construction of unsupervised sentiment classifier on idioms resources[J].Journal of Central South University,2014,21(4):1376-1384. 被引量：2
3李晓宇,徐勇,张心蕊,汪倩,武雅利.语音情感识别研究进展分析[J].现代计算机,2020,26(20):44-47.
4GAO Wa,KAN Yue,ZHA Fu-sheng.Filter algorithm based on cochlear mechanics and neuron filter mechanism and application on enhancement of audio signals[J].Journal of Central South University,2021,28(6):1813-1828. 被引量：1
5马玉林,田香玉,曲金玉.汽车电动门窗的嵌入式语音控制系统设计[J].山东理工大学学报（自然科学版）,2015,29(6):75-78.

同被引文献80

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2张立华,杨莹春.情感语音变化规律的特征分析[J].清华大学学报（自然科学版）,2008,48(S1):652-657. 被引量：14
3赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
4马义德,袁敏,齐春亮,刘悦,刘映杰.基于PCNN的语谱图特征提取在说话人识别中的应用[J].计算机工程与应用,2005,41(20):81-84. 被引量：23
5王飞跃.社会计算——科学、技术与人文的数字化动态交融[J].中国基础科学,2005,7(5):5-12. 被引量：41
6姜晓庆,田岚,崔国辉.多语种情感语音的韵律特征分析和情感识别研究[J].声学学报,2006,31(3):217-221. 被引量：8
7林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007,12(1):90-98. 被引量：33
8余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
9李晓明,傅小兰,邓国峰.中文简化版PAD情绪量表在京大学生中的初步试用[J].中国心理卫生杂志,2008,22(5):327-329. 被引量：58
10韩一,王国胤,杨勇.基于MFCC的语音情感识别[J].重庆邮电大学学报（自然科学版）,2008,20(5):597-602. 被引量：24

引证文献18

1张雪英,张婷,孙颖,张卫,畅江.情感语音数据库优化及PAD情感模型量化标注[J].太原理工大学学报,2017,48(3):469-474. 被引量：14
2崔婧,刘永翔.智能电视的交互设计研究[J].设计,2018,31(2):140-141. 被引量：2
3任国凤,张雪英,李东,闫建政.普通话双模态情感语音数据库的设计与评价[J].现代电子技术,2018,41(14):182-186. 被引量：1
4金升菊.基于层次集成稀疏表示在语音感情计算中的应用[J].福建电脑,2018,34(9):55-56.
5张雪英,张婷,孙颖,张卫.基于PAD模型的级联分类情感语音识别[J].太原理工大学学报,2018,49(5):731-735. 被引量：8
6陈逸灵,程艳芬,陈先桥,王红霞,李超.PAD三维情感空间中的语音情感识别[J].哈尔滨工业大学学报,2018,50(11):160-166. 被引量：6
7任杰,郭卉,姜囡.不同情感的语音声学特征分析[J].光电技术应用,2019,34(5):31-36. 被引量：2
8李晓宇,徐勇,张心蕊,汪倩,武雅利.语音情感识别研究进展分析[J].现代计算机,2020,26(20):44-47.
9张会云,黄鹤鸣,李伟,黄志东.基于AA-LSTM网络的语音情感识别研究[J].计算机仿真,2021,38(3):211-216. 被引量：2
10胡德生,张雪英,张静,李宝芸.基于主辅网络特征融合的语音情感识别[J].太原理工大学学报,2021,52(5):769-774. 被引量：8

二级引证文献81

1张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.
2张霞,杨勇,赵力.基于复数帧段特征的语音情感识别方法[J].电子器件,2022,45(2):479-482.
3潘涛,王胜利.支持向量机在语音情感识别中的应用[J].电子技术与软件工程,2019(6):135-135. 被引量：1
4张雪英,张婷,孙颖,张卫.基于PAD模型的级联分类情感语音识别[J].太原理工大学学报,2018,49(5):731-735. 被引量：8
5张雪英,王薇蓉,孙颖,宋春晓.面向脑电情感识别的改进多分类RVM模型研究[J].计算机工程与应用,2019,55(9):112-117. 被引量：4
6钟言久,张开源,郭亚杰,刘阳.面向智能电视设计的用户需求向功能特性转化[J].日用电器,2019(5):18-23. 被引量：2
7程艳芬,陈垚鑫,陈逸灵,杨益.嵌入注意力机制并结合层级上下文的语音情感识别[J].哈尔滨工业大学学报,2019,51(11):100-107. 被引量：9
8孙颖,胡艳香,张雪英,段淑斐.面向情感语音识别的情感维度PAD预测[J].浙江大学学报（工学版）,2019,53(10):2041-2048. 被引量：6
9叶硕,褚钰,王祎,李田港.语音识别中声学模型研究综述[J].计算机技术与发展,2020,30(3):181-186. 被引量：5
10胡艳香,孙颖,张雪英,段淑斐.基于聚类PSO-LSSVM模型的PAD维度预测[J].计算机应用研究,2020,37(4):994-998. 被引量：3

1张棪,周旭,刘书浩,唐晖.基于3G网络的P2P系统中基于模糊认知图的小区优先节点选择算法[J].电信科学,2012,28(1):63-69. 被引量：1
2罗本成.高性能脑电波ERP信号放大器的研制[J].电子产品世界,2005,12(10A):90-93. 被引量：5
3杨柳.混沌运动的特征及其在密码学中的应用研究[J].电子测试,2016,27(5):35-35. 被引量：1
4刘晶,白艳茹,许敏鹏,殷涛,何峰,周鹏,綦宏志,明东.基于Farwell范式诱发ERP的身份识别研究[J].电子测量与仪器学报,2015,29(2):221-226. 被引量：4
5专家系统、人工智能[J].电子科技文摘,2000(4):128-129.
6频带压缩、数据压缩、数据平滑[J].电子科技文摘,1999(11):66-66.
7沈丽丽,刘海鹏,王丛,岳广辉.旋转偏差对立体显示舒适度影响的ERP研究[J].天津大学学报（自然科学与工程技术版）,2017,50(4):385-390. 被引量：3
8韩海清.当明星遇上真人秀——浅析国内“明星类”真人秀节目[J].艺术科技,2013,26(6):61-62. 被引量：2
9马丽君.网络导游精灵发展的趋势及其理论认知[J].数字技术与应用,2013,31(2):209-210.
10李丽,任义.数字电视及其硬界面设计[J].包装工程,2007,28(6):105-107. 被引量：1

太原理工大学学报

2015年第6期

浏览历史

内容加载中请稍等...

语音情感识别的关键技术被引量：18

参考文献26

二级参考文献22

共引文献5

同被引文献80

引证文献18

二级引证文献81

相关作者

相关机构

相关主题

浏览历史

语音情感识别的关键技术 被引量：18

参考文献26

二级参考文献22

共引文献5

同被引文献80

引证文献18

二级引证文献81

相关作者

相关机构

相关主题

浏览历史

语音情感识别的关键技术被引量：18