期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于启发式掩模EMD的音频突变成分检测方法 被引量:2
1
作者 李海峰 戎晓汇 +2 位作者 马琳 徐忠亮 薄洪健 《信号处理》 CSCD 北大核心 2020年第6期885-893,共9页
多数情况下,音频信号可以视为是由稳态成分和突变成分两种成分组成,稳态成分与突变成分在属性特征方面具有明显的差异,而且突变成分通常承载更重要的信息,是信号处理要分析提取的目标。为有效检测出突变成分并将这两种成分分离,需要完... 多数情况下,音频信号可以视为是由稳态成分和突变成分两种成分组成,稳态成分与突变成分在属性特征方面具有明显的差异,而且突变成分通常承载更重要的信息,是信号处理要分析提取的目标。为有效检测出突变成分并将这两种成分分离,需要完整精确地检测提取出突变成分。为此本文提出一种基于启发式掩模经验模态分解(Empirical Mode Decomposition,EMD)的音频突变成分检测方法,该检测方法中使用启发式掩模EMD分解音频信号并从中提取出各点的瞬时信息作为检测特征,同时本文提出一种窗长自适应更新策略来设定适合突变成分的长度。在IOWA的乐器音频数据集中,该检测方法能够实现以98.68%的检测精确率和87.65%的检测召回率将音频突变成分检测出来。此外该检测方法无需人为干预,并且检测出的突变成分维度一致,便于进行后续的特征提取、分类识别等处理操作。 展开更多
关键词 掩模经验模态分解 音频信号 突变成分 检测方法
下载PDF
基于CM-OMEMD和小波散射网络的语音情感识别 被引量:1
2
作者 孙聪珊 马琳 李海峰 《信号处理》 CSCD 北大核心 2023年第4期688-697,共10页
语音情感识别(Speech Emotion Recognition,SER)是人机交互的重要组成部分,具有广泛的研究和应用价值。针对当前SER中仍然存在着缺乏大规模语音情感数据集和语音情感特征的低鲁棒性而导致的语音情感识别准确率低等问题,提出了一种基于... 语音情感识别(Speech Emotion Recognition,SER)是人机交互的重要组成部分,具有广泛的研究和应用价值。针对当前SER中仍然存在着缺乏大规模语音情感数据集和语音情感特征的低鲁棒性而导致的语音情感识别准确率低等问题,提出了一种基于改进的经验模态分解方法(Empirical Mode Decomposition,EMD)和小波散射网络(Wavelet Scattering Network,WSN)的语音情感识别方法。首先,针对用于语音信号时频分析的EMD及其改进算法中存在的模态混叠问题(Mode Mixing)和噪声残余问题,提出了基于常数Q变换(Constant-Q Transform,CQT)和海洋捕食者算法(Marine Predator Algorithm,MPA)的优化掩模经验模态分解方法(Optimized Masking EMD based on CQT and MPA,CM-OMEMD)。采用CM-OMEMD算法对情感语音信号进行分解,得到固有模态函数(Intrinsic Mode Functions,IMFs),并从IMFs中提取了可以表征情感的时频特征作为第一个特征集。然后采用WSN提取了具有平移不变性和形变稳定性的散射系数特征作为第二个特征集。最后将两个特征集进行融合,采用支持向量机(Support Vector Machine,SVM)分类器进行分类。通过在含有七种情感状态的TESS数据集中的对比实验,证明了本文提出的系统的有效性。其中CM-OMEMD减小了模态混叠,提升了对情感语音信号时频分析的准确性,同时提出的SER系统显著提高了情绪识别的性能。 展开更多
关键词 语音情感识别 小波散射网络 优化掩模经验模态分解方法 模态混叠
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部