期刊文献+
共找到105,478篇文章
< 1 2 250 >
每页显示 20 50 100
基于小波散射变换和MFCC的双特征语音情感识别融合算法
1
作者 应娜 吴顺朋 +1 位作者 杨萌 邹雨鉴 《电信科学》 北大核心 2024年第5期62-72,共11页
为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PEW-BAR)。算法首... 为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PEW-BAR)。算法首先获取语音信号的小波散射特征和梅尔频率倒谱系数的相关特征;然后按尺度维度扩展小波散射特征,利用支持向量机得到情感识别的后验概率并获得排列熵,并使用排列熵对后验概率进行加权;最后采用一种偏差调整规则进一步融合MFCC的相关特征的识别结果。实验结果表明,在EMODB、RAVDESS和eNTERFACE05数据集上,与传统的基于小波散射系数的语音情感识别方法相比,该算法将ACC分别提高了2.82%、2.85%和5.92%,将UAR分别提升了3.40%、2.87%和5.80%,IEMOCAP上提高了6.89%。 展开更多
关键词 语音情感识别 小波散射变换 排列熵 mfcc 模型融合
下载PDF
基于MFCC和GMM的瓷砖空鼓率识别系统及方法
2
作者 周浩 梁军汀 卢杰 《无损检测》 CAS 2024年第3期28-32,55,共6页
针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试... 针对瓷砖因内部空鼓而引起的松动、脱落等质量问题或其他安全隐患问题,研制了一套用于瓷砖空鼓率识别的试验系统。该系统采用梅尔倒谱系数(MFCC)法提取瓷砖敲击声的特征参数,再用高斯混合模型(GMM)法对MFCC特征参数进行分类和识别。试验结果表明,采用MFCC和GMM相结合的方法,可以对瓷砖空鼓情况进行有效识别,该方法具有良好的应用前景。 展开更多
关键词 声纹识别 梅尔倒谱系数 混合高斯模型
下载PDF
基于MFCC和MDE-SVDD的滚动轴承音频信号异常检测方法
3
作者 高原 邓艾东 +2 位作者 范永胜 梁志宏 傅行军 《动力工程学报》 CAS CSCD 北大核心 2024年第2期277-283,共7页
针对传统振动传感器安装不易,而声信号分析易受环境噪声干扰的问题,提出一种基于梅尔倒谱系数(MFCC)和马氏距离加权改进支持向量数据描述(MDE-SVDD)的音频信号异常检测方法,用于滚动轴承运行状态监测。该方法从轴承运行声信号中提取MFC... 针对传统振动传感器安装不易,而声信号分析易受环境噪声干扰的问题,提出一种基于梅尔倒谱系数(MFCC)和马氏距离加权改进支持向量数据描述(MDE-SVDD)的音频信号异常检测方法,用于滚动轴承运行状态监测。该方法从轴承运行声信号中提取MFCC作为特征向量,进而使用马氏距离加权改进SVDD,以增强对噪声样本的抗干扰性,从而提高算法的检测精度,然后在实验音频信号中添加多种强度的高斯白噪声以模拟现场噪声环境,并将所提方法的测试结果与传统SVDD等异常检测方法进行比较。结果表明:在低信噪比(-5 dB)场景下,MDE-SVDD的异常检测平均准确率达到91.99%,相较于传统SVDD提升了7.73百分比。 展开更多
关键词 滚动轴承 声纹识别 梅尔倒谱系数 支持向量数据描述 异常检测
下载PDF
水声目标的MFCC特征提取与分类识别
4
作者 葛轶洲 姚泽 +1 位作者 张歆 周青 《计算机仿真》 2024年第2期13-16,33,共5页
水声目标识别技术在水下信息处理中起着非常重要的作用,从辐射噪声中提取水声目标的有效特征一直都是水声目标识别技术的难点所在。提出了一种利用水声目标辐射噪声的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)作为... 水声目标识别技术在水下信息处理中起着非常重要的作用,从辐射噪声中提取水声目标的有效特征一直都是水声目标识别技术的难点所在。提出了一种利用水声目标辐射噪声的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)作为目标特征提取的方法。通过对辐射噪声信号进行梅尔频率滤波得到目标噪声信号的MFCC特征,它模拟了人耳对不同频率的声音具有不同感知能力的听觉非线性效应,因此具有良好的识别效果。通过对实际水声目标的辐射噪声进行测试实验,提取目标噪声信号的MFCC特征向量,并运用K近邻算法对其进行分类识别,实验结果显示MFCC特征提取与分类识别算法对水声目标的识别率达到85%以上。 展开更多
关键词 水声信息对抗 特征提取 梅尔倒谱系数 分类识别
下载PDF
基于MFCC的声音检测装置及算法实现
5
作者 米月琴 王新怀 徐茵 《电子产品世界》 2024年第1期56-59,共4页
提出了一种基于梅尔频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)的声音检测装置及算法实现。通过采集声音的波形,结合特征提取和分类算法,实现对不同声音的智能判断。从嵌入式系统硬件设计、声音波形特征提取、声音分类算... 提出了一种基于梅尔频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)的声音检测装置及算法实现。通过采集声音的波形,结合特征提取和分类算法,实现对不同声音的智能判断。从嵌入式系统硬件设计、声音波形特征提取、声音分类算法等方面进行了详细的研究,并对实验结果进行了分析。结果表明,该设计方案在声音检测方面具有较高的准确性和可行性。 展开更多
关键词 mfcc 特征提取 嵌入式系统 检测装置
下载PDF
Molecular Dynamics, Diffusion Coefficients and Activation Energy of the Electrolyte (Anode) in Lithium (Li and Li+), Sodium (Na and Na+) and Potassium (K and K+)
6
作者 Alain Second Dzabana Honguelet Timothée Nsongo +1 位作者 Bitho Rodongo Earvin Loumbandzila 《Modeling and Numerical Simulation of Material Science》 2024年第1期39-57,共19页
This work is a simulation modelling with the LAMMPS calculation code of an electrode based on alkali metals (lithium, sodium and potassium) using the MEAM potential. For different multiplicities, two models were studi... This work is a simulation modelling with the LAMMPS calculation code of an electrode based on alkali metals (lithium, sodium and potassium) using the MEAM potential. For different multiplicities, two models were studied;with and without gap. In this work, we present the structural, physical and chemical properties of the lithium, sodium and potassium electrodes. For the structural properties, the cohesive energy and the mesh parameters were calculated, revealing that, whatever the chemical element selected, the compact hexagonal hcp structure is the most stable, followed by the face-centred cubic CFC structure, and finally the BCC structure. The most stable structure is lithium, with a cohesion energy of -6570 eV, and the lowest bcc-hcp transition energy of -0.553 eV/atom, followed by sodium. For physical properties, kinetic and potential energies were calculated for each of the sectioned chemical elements, with lithium achieving the highest value. Finally, for the chemical properties, we studied the diffusion coefficient and the activation energy. Only potassium followed an opposite order to the other two, with the quantities with lacunae being greater than those without lacunae, whatever the multiplicity. The order of magnitude of the diffusion coefficients is given by the relationship D<sub>Li</sub> > D<sub>Na</sub> > D<sub>k</sub> for the multiplicity 6*6*6, while for the activation energy the order is reversed. 展开更多
关键词 Molecular Dynamics Diffusion coefficients Activation Energy LITHIUM Alkali Metals MEAM Potential
下载PDF
Adaptive Random Effects/Coefficients Modeling
7
作者 George J. Knafl 《Open Journal of Statistics》 2024年第2期179-206,共28页
Adaptive fractional polynomial modeling of general correlated outcomes is formulated to address nonlinearity in means, variances/dispersions, and correlations. Means and variances/dispersions are modeled using general... Adaptive fractional polynomial modeling of general correlated outcomes is formulated to address nonlinearity in means, variances/dispersions, and correlations. Means and variances/dispersions are modeled using generalized linear models in fixed effects/coefficients. Correlations are modeled using random effects/coefficients. Nonlinearity is addressed using power transforms of primary (untransformed) predictors. Parameter estimation is based on extended linear mixed modeling generalizing both generalized estimating equations and linear mixed modeling. Models are evaluated using likelihood cross-validation (LCV) scores and are generated adaptively using a heuristic search controlled by LCV scores. Cases covered include linear, Poisson, logistic, exponential, and discrete regression of correlated continuous, count/rate, dichotomous, positive continuous, and discrete numeric outcomes treated as normally, Poisson, Bernoulli, exponentially, and discrete numerically distributed, respectively. Example analyses are also generated for these five cases to compare adaptive random effects/coefficients modeling of correlated outcomes to previously developed adaptive modeling based on directly specified covariance structures. Adaptive random effects/coefficients modeling substantially outperforms direct covariance modeling in the linear, exponential, and discrete regression example analyses. It generates equivalent results in the logistic regression example analyses and it is substantially outperformed in the Poisson regression case. Random effects/coefficients modeling of correlated outcomes can provide substantial improvements in model selection compared to directly specified covariance modeling. However, directly specified covariance modeling can generate competitive or substantially better results in some cases while usually requiring less computation time. 展开更多
关键词 Adaptive Regression Correlated Outcomes Extended Linear Mixed Modeling Fractional Polynomials Likelihood Cross-Validation Random Effects/coefficients
下载PDF
Thermomechanical Dynamics (TMD) and Bifurcation-Integration Solutions in Nonlinear Differential Equations with Time-Dependent Coefficients
8
作者 Hiroshi Uechi Lisa Uechi Schun T. Uechi 《Journal of Applied Mathematics and Physics》 2024年第5期1733-1743,共11页
The new independent solutions of the nonlinear differential equation with time-dependent coefficients (NDE-TC) are discussed, for the first time, by employing experimental device called a drinking bird whose simple ba... The new independent solutions of the nonlinear differential equation with time-dependent coefficients (NDE-TC) are discussed, for the first time, by employing experimental device called a drinking bird whose simple back-and-forth motion develops into water drinking motion. The solution to a drinking bird equation of motion manifests itself the transition from thermodynamic equilibrium to nonequilibrium irreversible states. The independent solution signifying a nonequilibrium thermal state seems to be constructed as if two independent bifurcation solutions are synthesized, and so, the solution is tentatively termed as the bifurcation-integration solution. The bifurcation-integration solution expresses the transition from mechanical and thermodynamic equilibrium to a nonequilibrium irreversible state, which is explicitly shown by the nonlinear differential equation with time-dependent coefficients (NDE-TC). The analysis established a new theoretical approach to nonequilibrium irreversible states, thermomechanical dynamics (TMD). The TMD method enables one to obtain thermodynamically consistent and time-dependent progresses of thermodynamic quantities, by employing the bifurcation-integration solutions of NDE-TC. We hope that the basic properties of bifurcation-integration solutions will be studied and investigated further in mathematics, physics, chemistry and nonlinear sciences in general. 展开更多
关键词 The Nonlinear Differential Equation with Time-Dependent coefficients The Bifurcation-Integration Solution Nonequilibrium Irreversible States Thermomechanical Dynamics (TMD)
下载PDF
改进MFCC特征和MLA模型的语音情感识别
9
作者 张晓莉 《福建电脑》 2024年第1期52-56,共5页
MFCC及其一阶差分特征表征了语音的静态和动态信息,常作为SER的情感特征。在传统的MFCC特征提取过程中,通过人工调参实现语音信噪比的平衡,容易造成过度补偿的情况。本文提出两种改进方法,分别获得EMFCC和AMFCC特征。为了获得最佳的分... MFCC及其一阶差分特征表征了语音的静态和动态信息,常作为SER的情感特征。在传统的MFCC特征提取过程中,通过人工调参实现语音信噪比的平衡,容易造成过度补偿的情况。本文提出两种改进方法,分别获得EMFCC和AMFCC特征。为了获得最佳的分类准确率,基于池化层、LSTM和注意力机制构建了MLA模型,能够有效捕捉特征中的情感信息。采用由MFCC及其一阶差分特征和两个改进MFCC特征组成的混合特征,在CASIA语料库上取得了81.79%的未加权准确率。消融实验的结果表明,与SER领域其他较为先进的识别方法进行对比,改进的MFCC特征具有较好的性能优势。 展开更多
关键词 语音情感识别 梅尔频率倒谱系数 长短时记忆 注意力机制
下载PDF
基于MFCC和随机森林的GIS动作声纹特征辨识和操作机构异常分类
10
作者 庄小亮 李乾坤 +3 位作者 秦秉东 张长虹 张柳健 张禄亮 《电机与控制应用》 2024年第3期10-20,共11页
针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用M... 针对气体绝缘金属封闭开关(GIS)设备的操作机构异常或故障而导致其开关动作时出现分合闸失败或不到位的问题,提出了一种基于梅尔频率倒谱系数(MFCC)和随机森林的GIS设备操作机构异常分类模型。首先,对采集到的声纹信号进行预处理,使用MFCC提取声纹信号的特征;然后,构建随机森林对提取的特征信息进行辨识,得到GIS动作异常的分类结果;最后,以某110 kV的GIS设备为例,采集断路器、隔离开关的储能机构和传动机构异常或故障时的声纹信号,构建了音频样本库,并对所提分类模型与多种经典模型进行了对比测试。结果表明,MFCC能够有效提取出不同工况下GIS动作的声纹信号特征,且随机森林在众多分类识别模型中表现最优,有效提高了GIS动作异常工况识别的准确率。 展开更多
关键词 GIS动作异常 操作机构 声纹特征辨识 梅尔倒谱系数 随机森林
下载PDF
基于改进MFCC算法的风力机叶片故障诊断方法
11
作者 张家安 田家辉 +2 位作者 王铁成 邓强 梁涛 《太阳能学报》 EI CAS CSCD 北大核心 2024年第1期285-290,共6页
针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率... 针对传统声信号特征处理方法无法有效提取叶片声音特征、导致叶片故障诊断准确率低的问题,提出一种基于改进梅尔频率倒谱系数(MFCC)算法的风力机叶片故障诊断方法。首先采用快速傅里叶变换(FFT)分析不同风速下叶片声音信号和风噪的频率特性,明确叶片声音信号的频率分布区域,将全频段分为三部分;然后采用粒子群优化算法(PSO)对梅尔(Mel)函数在不同频段上的敏感度进行优化,在迭代过程中将MFCC算法提取的叶片声音特征进行聚类,以轮廓系数作为适应度函数;最后基于支持向量机(SVM)构建分类器,实现风力机叶片故障的准确识别。以华北某风电场的叶片声音采集数据为算例,考察该算法在不同风速工况下的适应性,验证该方法的有效性。 展开更多
关键词 风力机叶片 声信号处理 故障诊断 特征提取 梅尔频率倒谱系数
下载PDF
基于MFCC的碳纤维复合缠绕气瓶损伤声发射信号分析
12
作者 魏莱 龙飞飞 +1 位作者 杨可鑫 李沛莹 《无损检测》 CAS 2024年第4期53-58,共6页
针对碳纤维复合缠绕(CFPR)气瓶的损伤在线监测问题,对CFRP气瓶冲击损伤过程的声发射检测进行研究。以获取到的气瓶损伤声发射信号作为研究对象,通过梅尔倒谱系数(MFCC)特征提取方法,将原始信号转换为特征系数向量,将其参数值及变化趋势... 针对碳纤维复合缠绕(CFPR)气瓶的损伤在线监测问题,对CFRP气瓶冲击损伤过程的声发射检测进行研究。以获取到的气瓶损伤声发射信号作为研究对象,通过梅尔倒谱系数(MFCC)特征提取方法,将原始信号转换为特征系数向量,将其参数值及变化趋势进行同步比较。试验结果表明,不同损伤类型梅尔倒谱系数的分布呈现出明显的规律性。该研究结果可为CFPR材料的声发射检测信号识别提供一些参考。 展开更多
关键词 碳纤维复合缠绕气瓶 声发射 冲击 梅尔频率倒谱系数
下载PDF
改进MFCC和并行混合模型的语音情感识别 被引量:4
13
作者 崔琳 崔晨露 +1 位作者 刘政伟 薛凯 《计算机科学》 CSCD 北大核心 2023年第S01期156-162,共7页
传统MFCC不仅忽略了浊音信号中基音频率的影响,还不能表征语音的动态特征,因此提出利用滑动平均滤波器滤除浊音信号的基音频率,并在提取完静态MFCC特征后再通过提取其一阶差分与二阶差分来获取动态特征。将得到的特征送入模型中进行训练... 传统MFCC不仅忽略了浊音信号中基音频率的影响,还不能表征语音的动态特征,因此提出利用滑动平均滤波器滤除浊音信号的基音频率,并在提取完静态MFCC特征后再通过提取其一阶差分与二阶差分来获取动态特征。将得到的特征送入模型中进行训练,为了构建更高效的语音情感识别模型,搭建了一种融合多头注意力机制的并行混合模型。多头注意力机制不仅可以有效防止梯度消失现象,构建更深层的网络,各个注意力头还可以执行不同的任务来提高准确率。最后进行情感特征分类,传统softmax在进行分类时类内距离可能会变大导致模型的置信度差,因此引入了中心损失函数,将两者联合来进行分类。实验结果表明,所提方法在RAVDESS数据集和EMO-DB数据集上的准确率可以分别达到98.15%和96.26%。 展开更多
关键词 语音情感识别 mfcc 多头注意力机制 滑动平均滤波器 softmax
下载PDF
一种三维度基于改进MFCC特征模型的AI克隆语音源鉴定方法 被引量:1
14
作者 王学光 诸珺文 张爱新 《计算机科学》 CSCD 北大核心 2023年第11期177-184,共8页
AI克隆语音技术的出现将对现代社会法治秩序造成致命冲击。近年来研究人员仅关注了AI合成语音与样本语音内容相同领域的研究,而对AI合成语音与样本内容不同的检材的鉴定研究却甚少,相关鉴定内容无法识别。为此,提出了一种三维度基于改进... AI克隆语音技术的出现将对现代社会法治秩序造成致命冲击。近年来研究人员仅关注了AI合成语音与样本语音内容相同领域的研究,而对AI合成语音与样本内容不同的检材的鉴定研究却甚少,相关鉴定内容无法识别。为此,提出了一种三维度基于改进MFCC特征模型对AI克隆语音源进行鉴定。首先对先前研究人员人工分析的AI克隆语音特性进行验证,总结出可识别的“共振峰F5异常活跃”与“能量、共振峰、音高曲线异常突变”的特征。其次基于AI克隆语音的特征运用二阶差分修正MFCC系数并采用“逆差逻辑推演法”将能量、共振峰、音高曲线突变特性进一步量化采样,将其定义为语音鉴定的特征向量三元组。然后以特征向量三元组为输入,运用D-S证据合成规则将三组检材与样本比对的结果融合。最后形成三维度基于改进MFCC特征参量的检材评定模型。人群随机采样实验结果表明,该AI克隆语音源鉴定方法对以同一人为克隆源所合成的AI克隆语音鉴定的平均概率为67.324%,标准差为7.32%,鉴定效果很好。 展开更多
关键词 AI克隆语音 mfcc特征 三维度语音建模 语音源鉴定
下载PDF
基于MFCC-CS-MUSIC的矿井提升机故障源精准识别方法研究 被引量:2
15
作者 李敬兆 王笑 孙杰臣 《煤炭科学技术》 CAS CSCD 北大核心 2023年第1期446-454,共9页
在煤矿生产领域中,矿井提升机作为一种辅助运输的设备,在矿井整个运输工程中承担着非常重要的作用,其安全性和稳定性直接影响着煤矿生产效率和井下工作人员生命安全。矿井提升机故障发生后,其声音信号也会随着设备运行状态而改变,因此... 在煤矿生产领域中,矿井提升机作为一种辅助运输的设备,在矿井整个运输工程中承担着非常重要的作用,其安全性和稳定性直接影响着煤矿生产效率和井下工作人员生命安全。矿井提升机故障发生后,其声音信号也会随着设备运行状态而改变,因此可以通过分析该声音的特征来检测设备是否处于不正常运行状态。鉴于此提出了基于MFCC-CS-MUSIC实现的矿井提升机故障源精准识别方法。通过采集提升机音频信号,应用MFCC(梅尔频率倒谱系数)算法提取多个通道声音信号梅尔频率倒谱系数进行故障识别;应用MUSIC(多信号分类)故障识别后的音频信号进行定位求得信号的最小化波达方向。将MUSIC算法求得的DOA(波达方向定位)值作为优化变量,以计算DOA和测量DOA之间的差异为目标函数,利用CS(布谷鸟)算法对目标函数进行寻优,从而实现对提升机故障源精准定位。试验和应用结果均表明,利用CS算法优化后MUSIC算法得到的定位坐标误差Δψ在5°以内,实际位置坐标方位角误差Δθ在4°以内。该方法实现了提升机故障准确识别和提升机故障源的精准定位,大幅缩短了排查矿井提升机故障位置的时间,显著提升了矿井提升机的工作效率。 展开更多
关键词 矿井提升机 辅助运输 故障源识别 mfcc算法 MUSIC算法 CS算法
下载PDF
基于二阶差分MFCC深度学习的声景基调声分类方法 被引量:1
16
作者 邓志勇 张万亿 刘爱利 《中国传媒大学学报(自然科学版)》 2023年第5期26-35,54,共11页
本文提出了一种可用于卷积神经网络分类技术的二阶差分MFCC特征,尝试解决声景学中基调声与非基调声二分类这一具有“人文色彩”的主观分类任务。以老北京中轴线的声景样本数据集为例,根据本文设计的网络模型结构,使用该二阶差分MFCC特... 本文提出了一种可用于卷积神经网络分类技术的二阶差分MFCC特征,尝试解决声景学中基调声与非基调声二分类这一具有“人文色彩”的主观分类任务。以老北京中轴线的声景样本数据集为例,根据本文设计的网络模型结构,使用该二阶差分MFCC特征训练的二分类器对于声景基调声的识别准确率达到80.23%,远优于单独使用RMS和Mel频谱特征,以及联合使用RMS与二阶差分MFCC特征的准确率。 展开更多
关键词 声景 基调声 卷积神经网络 二阶差分mfcc
下载PDF
基于改进MFCC融合特征及FA-PNN的驾驶员路怒情绪识别 被引量:4
17
作者 李尚卿 王晓原 +2 位作者 张杨 李浩 项徽 《计算机工程与应用》 CSCD 北大核心 2023年第2期306-313,共8页
现今关于驾驶员路怒情绪识别方法中语音特性分析相对较少,该研究以路怒情绪为研究对象,利用模拟驾驶系统建立数据集,通过分析驾驶员语音的频谱特征,将时域中短时能量及短时过零率特征参数和改进Mel频率倒谱系数(Mel frequency cepstral ... 现今关于驾驶员路怒情绪识别方法中语音特性分析相对较少,该研究以路怒情绪为研究对象,利用模拟驾驶系统建立数据集,通过分析驾驶员语音的频谱特征,将时域中短时能量及短时过零率特征参数和改进Mel频率倒谱系数(Mel frequency cepstral coefficients,MFCC)特征参数融合构成特征参数向量,利用萤火虫算法(firefly algorithm,FA)优化PNN神经网络(probabilistic neural networks)并构建识别模型,实现驾驶员路怒情绪的识别。实验结果表明,在相同神经网络下,改进MFCC融合特征提取方法相比传统MFCC特征提取方法具有更好的抗噪性。同时,FA-PNN模型的识别准确率为93.0%,相比传统PNN模型提高了11个百分点;F1-Score值为0.9328,提高了0.1047。该研究论证了语音信号处理技术对驾驶员路怒情绪识别的可行性,为汽车主动安全驾驶预警研究提供了新方法。 展开更多
关键词 路怒情绪 语音信号处理 FA-PNN 改进mfcc 特征融合
下载PDF
基于改进MFCC与IMFCC的心音分类研究
18
作者 张伟 杨宏波 +1 位作者 潘家华 王威廉 《计算机仿真》 北大核心 2023年第10期346-352,共7页
心音信号的研究有助于先天性心脏病的早期辅助诊断。提出一种对先天性心脏病心音分类的新方法:对每例心音截取2秒作为样本;用经验模态分解、多正弦窗、幂函数压缩法对MFCC与IMFCC进行改进,并用改进后的MFCC与IMFCC分别提取心音样本相应... 心音信号的研究有助于先天性心脏病的早期辅助诊断。提出一种对先天性心脏病心音分类的新方法:对每例心音截取2秒作为样本;用经验模态分解、多正弦窗、幂函数压缩法对MFCC与IMFCC进行改进,并用改进后的MFCC与IMFCC分别提取心音样本相应频率系数,并计算各自的一阶差分作为融合特征。分类模型选用两层CNN网络。对5000例样本训练测试的二分类准确率为0.921,灵敏度和特异度分别为0.898、0.944;F1和AUC分别达到了0.919与0.958。上述法有望用于先心病机器辅助诊断。 展开更多
关键词 心音 经验模态分解 梅尔频率倒谱系数 翻转梅尔频率倒谱系数 多正弦窗 幂函数压缩
下载PDF
基于MFCC特征融合的语音情感识别算法
19
作者 黄喜阳 杜庆治 +1 位作者 龙华 邵玉斌 《陕西理工大学学报(自然科学版)》 2023年第4期17-25,共9页
在目前语音情感识别中,采用单一梅尔倒谱系数(MFCC)频谱的方法不能完全体现语音中所包含的情感特性,而多特征融合容易导致维数过大。提出了一种融合MFCC及其差分频谱的双向长短时记忆网络结合卷积神经网络(Bi-LSTM-CNN)的语音情感识别... 在目前语音情感识别中,采用单一梅尔倒谱系数(MFCC)频谱的方法不能完全体现语音中所包含的情感特性,而多特征融合容易导致维数过大。提出了一种融合MFCC及其差分频谱的双向长短时记忆网络结合卷积神经网络(Bi-LSTM-CNN)的语音情感识别算法。首先提取语音信号的MFCC特征,并进行差分运算得到一阶、二阶差分特征提取频谱,再采用主成分分析法分别获取3个频谱中贡献度较高的维度组成新的频谱,达到降维目的,并将降维后的3个特征频谱从上到下依次进行堆叠,得到动、静结合的MFCC差分融合频谱。训练阶段Bi-LSTM-CNN模型从特征融合频谱中学习语音情感特性,并采用稀疏交叉熵法得到最优结果。实验结果表明在RAVDESS数据集上准确率为81.32%,在EMO-DB数据集上对情感识别的准确率为85.51%,比主流情感识别模型的准确率提高了4.85%。 展开更多
关键词 语音情感识别 主成分分析法 双向长短时记忆网络 mfcc差分融合频谱 深度学习
下载PDF
基于鲁棒主成分分析和MFCC反复结构的歌声分离方法
20
作者 熊天 张天骐 +1 位作者 闻斌 吴超 《声学技术》 CSCD 北大核心 2023年第6期794-803,共10页
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效... 针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。 展开更多
关键词 鲁棒主成分分析(RPCA) 梅尔频率倒谱系数(mfcc) 歌声伴奏分离 反复结构
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部