面向数据增强的多种语音情感分类算法研究被引量：3

Investigation of multiple speech emotion classification algorithms based on data enhancement

下载PDF

导出

摘要目前语音情感识别存在语音样本不足、提取的特征数据量大和无关特征多使得识别率不高的问题。针对语音样本不足的情况,在预处理阶段提出了时频域的数据增强方法,对原有的数据库进行扩充;根据传统算法中提取的特征数据量大且与情感无关的特征多的现状,提取了1582维的情感特征和10组低级描述特征。分别在支持向量机、随机森林和K最邻近3种机器学习算法上做了对比实验。实验证明:支持向量机的平均识别率比较好。在所提取的10组特征组中,LogMelFreqBand特征在3种算法上的精确度分别为74.63%、64.93%和66.42%;而pcm_fftMag_mfcc特征的精确度分别为84.33%、73.13%和58.21%。 Currently,problems in speech emotion recognition,such as insufficient speech samples and numerous extracted and irrelevant features,make the recognition rate low.To solve the problem of insufficient speech samples,a timefrequency domain data enhancement method is proposed in the preprocessing stage to expand the original database.Considering the current situation where traditional algorithms extract a large amount of feature data and many are emotion-independent,1582-dimensional emotion features and 10 groups of low-level description features were extracted.Finally,a comparative experiment was performed on three machine learning algorithms:the support vector machine,random forest,and K-nearest neighbor.Experiments showed that the average recognition rate of the support vector machine was superior.Among the ten sets of features,the accuracy of LogMelFreqBand in the three algorithms was74.63%,64.93%,and 66.42%,respectively,and the accuracy of pcm_fftMag_mfcc was 84.33%,73.13%,and 58.21%,respectively.

作者李茜茜沈晓燕任福继康鑫 LI Qianqian;SHEN Xiaoyan;REN Fuji;KANG Xin(Institute of Information Science and Technology,Nantong University,Nantong 226019,China;Department of Intelligent Information Engineering,Tokushima University,Tokushima 7708501,Japan)

机构地区南通大学信息科学技术学院日本德岛大学智能信息工学部

出处《智能系统学报》 CSCD 北大核心 2021年第1期170-177,共8页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(61534003,81371663) 德岛大学研究集群项目(2003002)。

关键词语音情感识别数据增强情感特征支持向量机随机森林 K最邻近低级描述特征机器学习 speech emotion recognition data enhancement emotion feature support vector machine random forest Knearest neighbor low-level description features machine learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1吴雪,宋晓茹,高嵩,陈超波.基于数据增强的卷积神经网络火灾识别[J].科学技术与工程,2020,20(3):1113-1117. 被引量：19
2连天友,余勤.改进KNN算法对人体身份的识别[J].计算机工程与应用,2019,55(11):142-146. 被引量：4
3Hassan YOUSEFI,Alireza TAGHAVI KANI,Iradj MAHMOUDZADEH KANI,Soheil MOHAMMADIA.Wavelet-based iterative data enhancement for implementation in purification of modal frequency for extremely noisy ambient vibration tests in Shiraz-Iran[J].Frontiers of Structural and Civil Engineering,2020,14(2):446-472. 被引量：1
4戴志诚,李小年,陈增照,何秀玲.基于KNN算法的可变权值室内指纹定位算法[J].计算机工程,2019,45(6):310-314. 被引量：17

二级参考文献17

1李武军,王崇骏,张炜,陈世福.人脸识别研究综述[J].模式识别与人工智能,2006,19(1):58-66. 被引量：107
2吴玉成,陈婷婷.在滑动窗口中判决的自适应门限检测方法[J].系统仿真学报,2008,20(10):2770-2773. 被引量：20
3周艳,李海成.基于RSSI无线传感器网络空间定位算法[J].通信学报,2009,30(6):75-79. 被引量：65
4李秀娟.KNN分类算法研究[J].科技信息,2009(31):81-81. 被引量：11
5杨帆,陈茂林,吴迅,江星.基于传感器信息融合技术的森林火灾报警系统[J].华中科技大学学报（自然科学版）,2013,41(2):22-25. 被引量：28
6邹婷,王慧琴,胡燕,梁俊山,殷颖.基于小波变换和支持向量机的火灾识别算法[J].计算机工程与应用,2013,49(14):250-253. 被引量：7
7杨文璐,郭明.基于Kinect的实时人脸识别系统[J].计算机应用与软件,2014,31(5):64-67. 被引量：5
8宋健,代越,王禹和,赵梓健.基于KINECT的脸部识别技术概述[J].计算机光盘软件与应用,2014,17(12):170-171. 被引量：2
9赵东杰,汪同庆.基于深度信息的快速身份识别方法[J].计算机系统应用,2014,23(11):132-135. 被引量：2
10石柯,陈洪生,张仁同.一种基于支持向量回归的802.11无线室内定位方法[J].软件学报,2014,25(11):2636-2651. 被引量：29

共引文献36

1支余庆.利用串联谐振耐压现场检出和处理GIS缺陷[J].高电压技术,2000,26(2):78-79. 被引量：4
2王涛,沈益民,周娟.大型商业综合体地磁指纹定位并行算法[J].湖北工程学院学报,2019,39(3):42-45. 被引量：1
3项婉,单志龙,冯国君.基于对数正态模型的二次匹配指纹定位算法[J].传感技术学报,2019,32(9):1330-1338. 被引量：3
4刘虹,王烈.结合余弦相关性的卷积网络识别汉字的方法[J].计算机工程与应用,2020,56(8):130-135. 被引量：1
5柳黎,许凯华,何伍斌,徐秀.改进的红外图像行人检测和交叠率算法[J].计算机系统应用,2020,29(4):150-155. 被引量：1
6薛伟莲,赵娣,张颖超.室内定位研究综述[J].计算机与现代化,2020,0(5):80-88. 被引量：12
7黄光华,殷锋,冯九林.一种交叉验证和距离加权方法改进的KNN算法研究[J].西南民族大学学报（自然科学版）,2020,46(2):172-177. 被引量：7
8杜聪,邵建华,杨薇,王宗生,邓莲佳,沈宏杰.网格搜索法优化的支持向量机室内可见光定位[J].激光杂志,2021,42(3):104-109. 被引量：15
9陆雅诺,陈炳才.基于注意力机制的小样本啤酒花病虫害识别[J].中国农机化学报,2021,42(3):189-196. 被引量：9
10王兴,吕晶晶,王璐瑶,王晖,詹少伟.基于深度神经网络的强对流天气识别算法[J].科学技术与工程,2021,21(7):2737-2746. 被引量：13

同被引文献33

1李牧南,王良,赖华鹏.中文科技政策文本分类:增强的TextCNN视角[J].科技管理研究,2023,43(2):160-166. 被引量：5
2王超.深度学习在行业指数技术分析中的应用研究[J].管理评论,2021,33(3):75-83. 被引量：3
3李富强,万红,黄俊杰.基于MATLAB的语谱图显示与分析[J].微计算机信息,2005,21(10X):172-174. 被引量：27
4冯国明,张晓冬,刘素辉.基于CapsNet的中文文本分类研究[J].数据分析与知识发现,2018,2(12):68-76. 被引量：13
5张永安,耿喆,王燕妮.区域科技创新政策分类与政策工具挖掘——基于中关村数据的研究[J].科技进步与对策,2015,32(17):116-122. 被引量：64
6贺鸣,孙建军,成颖.基于朴素贝叶斯的文本分类研究综述[J].情报科学,2016,34(7):147-154. 被引量：70
7张一珂,张鹏远,颜永红.基于对抗训练策略的语言模型数据增强技术[J].自动化学报,2018,44(5):891-900. 被引量：19
8吴鹏,应杨,沈思.基于双向长短期记忆模型的网民负面情感分类研究[J].情报学报,2018,37(8):845-853. 被引量：36
9张海涛,王丹,徐海玲,孙思阳.基于卷积神经网络的微博舆情情感分类研究[J].情报学报,2018,37(7):695-702. 被引量：38
10白燕燕,胡晓霞.基于MATLAB语谱图的声乐研究[J].软件工程,2019,22(9):1-4. 被引量：6

引证文献3

1程敏.基于多模态深度学习的音乐情感鉴赏分类方法[J].安阳工学院学报,2023,22(5):113-117.
2李牧南,王良,赖华鹏.基于深度学习的我国科技政策属性识别[J].科研管理,2024,45(2):1-11. 被引量：1
3白燕燕,白帆,张少哲,韩宗祥.基于语谱图滤波去噪的语音增强技术研究[J].电声技术,2024,48(2):45-47.

二级引证文献1

1向小伟,申艳光,胡明昊,闫天伟,罗威,罗准辰.大模型驱动的科技政策法规问答系统研究[J].计算机科学与探索,2024,18(9):2349-2360.

智能系统学报

2021年第1期

浏览历史

内容加载中请稍等...

面向数据增强的多种语音情感分类算法研究被引量：3

参考文献4

二级参考文献17

共引文献36

同被引文献33

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向数据增强的多种语音情感分类算法研究 被引量：3

参考文献4

二级参考文献17

共引文献36

同被引文献33

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向数据增强的多种语音情感分类算法研究被引量：3