期刊文献+
共找到116篇文章
< 1 2 6 >
每页显示 20 50 100
基于MFCCs滤波的电话语音识别的通道补偿方法 被引量:5
1
作者 韩纪庆 高文 《计算机学报》 EI CSCD 北大核心 1998年第12期1125-1130,共6页
本文提出一种基于MFCCs滤波的通道补偿方法RMFCC.它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价.RMFCC的性能也优于CMS和二级CMS.通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证... 本文提出一种基于MFCCs滤波的通道补偿方法RMFCC.它具有性能良好和运算简单的优点,在不失精度的前题下减少了计算代价.RMFCC的性能也优于CMS和二级CMS.通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法,我们也证实了抑制非常低的调制频率是进行顽健的电话语音识别的有效途径. 展开更多
关键词 语音识别 mfccs滤波 电话语音识别 通道补偿
下载PDF
基于MFCC-IMFCC混合倒谱的托辊轴承故障诊断
2
作者 陶瀚宇 陈换过 +2 位作者 彭程程 高祥冲 杨磊 《机电工程》 CAS 北大核心 2024年第7期1215-1222,共8页
针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了... 针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了托辊轴承故障信息主要分布在中高频区域;然后,为有效保留高频信息,提取了MFCC-IMFCC,以帧级串联的方式组成了混合倒谱特征;最后,将混合倒谱特征输入到双层LSTM模型中进行了训练,建立了托辊轴承故障诊断模型。研究结果表明:针对托辊正常、滚动体故障和偏心旋转故障三种状态,LSTM结合混合倒谱特征的平均识别准确率达到96.72%,相比于单一的MFCC和IMFCC特征,准确率分别提升3.94%和7.41%,凸显了混合倒谱特征在表征托辊轴承故障信息方面的显著优势。 展开更多
关键词 托辊轴承 轴承故障声音信号 高频信息 梅尔倒谱系数 翻转梅尔倒谱系数 混合倒谱系数 长短时记忆网络
下载PDF
A Comparison of Classifiers in Performing Speaker Accent Recognition Using MFCCs
3
作者 Zichen Ma Ernest Fokoué 《Open Journal of Statistics》 2014年第4期258-266,共9页
An algorithm involving Mel-Frequency Cepstral Coefficients (MFCCs) is provided to perform signal feature extraction for the task of speaker accent recognition. Then different classifiers are compared based on the MFCC... An algorithm involving Mel-Frequency Cepstral Coefficients (MFCCs) is provided to perform signal feature extraction for the task of speaker accent recognition. Then different classifiers are compared based on the MFCC feature. For each signal, the mean vector of MFCC matrix is used as an input vector for pattern recognition. A sample of 330 signals, containing 165 US voice and 165 non-US voice, is analyzed. By comparison, k-nearest neighbors yield the highest average test accuracy, after using a cross-validation of size 500, and least time being used in the computation. 展开更多
关键词 SPEAKER ACCENT RECOGNITION mel-frequency cepstral coefficients (mfccs) DISCRIMINANT Analysis Support Vector Machines (SVMs) k-Nearest NEIGHBORS
下载PDF
基于MFCC与CNN的机械故障声音自动识别
4
作者 黄炜 罗谢飞 《电声技术》 2024年第6期129-131,共3页
针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明... 针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明,该方法在机械故障声音识别中具有较高的准确率、精确率及召回率,能够有效识别故障案例。 展开更多
关键词 机械故障 声音识别 梅尔频率倒谱系数(mfcc) 卷积神经网络(CNN)
下载PDF
基于MFCC和HMM的语音识别优化方法研究
5
作者 郭佳淇 张继通 《电声技术》 2024年第10期83-85,共3页
为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectatio... 为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30数据集进行实验验证。结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性。 展开更多
关键词 语音识别 梅尔频率倒谱系数(mfcc) 隐马尔可夫模型(HMM) 期望最大化(EM)
下载PDF
基于MFCC的语音情感识别 被引量:23
6
作者 韩一 王国胤 杨勇 《重庆邮电大学学报(自然科学版)》 2008年第5期597-602,共6页
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别... 情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中。实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性。 展开更多
关键词 mfcc 语音情感识别 情感计算
下载PDF
融合LPC与MFCC的特征参数 被引量:8
7
作者 张学锋 王芳 夏萍 《计算机工程》 CAS CSCD 北大核心 2011年第4期216-217,229,共3页
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一... 在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。 展开更多
关键词 线性预测 美尔倒谱系数 说话人识别
下载PDF
MFCC特征改进算法在语音识别中的应用 被引量:15
8
作者 俸云 景新幸 叶懋 《计算机工程与科学》 CSCD 北大核心 2009年第12期146-148,共3页
本文的目的是阐明一种Mel频率倒谱参数特征的改进算法。该算法是通过线性预测的方法从语音信号中提取出残差相位,同时将残差相位与传统的MFCC相结合,并应用到语音识别系统中。该改进算法比传统的MFCC算法具有更好的识别率。
关键词 语音识别 MEL倒谱系数 残差相位 线性预测
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
9
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 Mel频率倒谱系数(mfcc) 语音识别 特征提取
下载PDF
基于MFCC和时频图等多种特征的综合鸟声识别分类器设计 被引量:17
10
作者 徐淑正 孙忆南 +1 位作者 皇甫丽英 方玮骐 《实验室研究与探索》 CAS 北大核心 2018年第9期81-86,91,共7页
基于音节长度、梅尔频率倒谱系数(MFCC),基于线性预测编码(LPC)系数的动态时间规整(DTW)模板和结合时-频纹理特征,应用于鸟声识别的多标签分类器,通过在特征提取和分类器选择上进行优化并综合不同分类器的决策结果以改善单一分类器的性... 基于音节长度、梅尔频率倒谱系数(MFCC),基于线性预测编码(LPC)系数的动态时间规整(DTW)模板和结合时-频纹理特征,应用于鸟声识别的多标签分类器,通过在特征提取和分类器选择上进行优化并综合不同分类器的决策结果以改善单一分类器的性能。同时,系统在消除噪声和稳定性方面也做出了提高。经最终测试,本系统在多达11类的鸟声分类中可以达到92%的准确率。 展开更多
关键词 音频增强 语音信号处理 机器学习 梅尔频率倒谱系数
下载PDF
语音MFCC特征计算的改进算法 被引量:6
11
作者 章熙春 曹燕 +1 位作者 张军 韦岗 《数据采集与处理》 CSCD 北大核心 2005年第2期161-165,共5页
提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同... 提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同时还运用了加权滤波器分析(Weightedfilterbankanalysis,WFBA)技术,以提高MFCC的鲁棒性。对TIMIT连续语音数据库中DR1集的音素识别结果表明,本文提出的改进算法比传统MFCC算法具有更好的识别率。 展开更多
关键词 语音识别 弯折离散傅里叶变换(WDFT) Mel频标倒谱参数 加权滤波器分析
下载PDF
基于基音周期的语音MFCC参数提取 被引量:4
12
作者 陈迪 龚卫国 杨利平 《计算机应用》 CSCD 北大核心 2007年第5期1217-1219,共3页
提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无... 提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无关的说话人确认实验,验证了该方法能有效提高说话人确认的识别率,并能提高短时语音的稳定性。 展开更多
关键词 说话人识别 基音周期 mfcc参数 频谱距离
下载PDF
MFCC中DCT结构的设计与实现 被引量:3
13
作者 孔维功 张国杰 张效军 《计算机工程》 CAS CSCD 北大核心 2009年第5期265-267,共3页
根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实... 根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实时性要求和精度要求。 展开更多
关键词 说话人识别 美尔频率倒谱系数 离散余弦变换 分布式算法
下载PDF
基于样本熵与MFCC融合的语音情感识别 被引量:7
14
作者 屠彬彬 于凤芹 《计算机工程》 CAS CSCD 2012年第7期142-144,共3页
提出一种基于样本熵与Mel频率倒谱系数(MFCC)融合的语音情感识别方法。利用支持向量机分别对样本熵统计量与MFCC进行处理,计算其属于高兴、生气、厌烦和恐惧4种情感的概率,采用加法规则和乘法规则对情感概率进行融合,得到识别结果。仿... 提出一种基于样本熵与Mel频率倒谱系数(MFCC)融合的语音情感识别方法。利用支持向量机分别对样本熵统计量与MFCC进行处理,计算其属于高兴、生气、厌烦和恐惧4种情感的概率,采用加法规则和乘法规则对情感概率进行融合,得到识别结果。仿真实验结果表明,该方法的识别率较高。 展开更多
关键词 语音情感识别 样本熵 MEL频率倒谱系数 支持向量机
下载PDF
基于MFCC特征组合参数的说话人识别研究 被引量:3
15
作者 曾霞霞 徐戈 吴征远 《集美大学学报(自然科学版)》 CAS 2016年第4期317-320,共4页
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进... 为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。 展开更多
关键词 说话人识别 MEL频率倒谱系数 高斯混合模型 特征参数 特征向量
下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:44
16
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 MEL频率倒谱系数 Gammatone滤波器
下载PDF
结合节拍语义和MFCC声学特征的音乐流派分类 被引量:7
17
作者 庄严 于凤芹 《计算机工程与应用》 CSCD 北大核心 2015年第3期197-201,共5页
由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述... 由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述频域能量包络的MFCC声学特征与节拍特征结合,并用基于音乐流派机理分析的8阶MFCC代替常用的12阶MFCC。对8类音乐流派实验仿真结果表明,基于语义特征和声学特征结合的方法,总体分类准确率可达68.37%,同时特征维数增加对分类时间影响很小。 展开更多
关键词 音乐流派分类 节拍特征 Mel频率倒谱系数(mfcc) 小波分解 支持向量机
下载PDF
基于EMD的改进MFCC的语音情感识别 被引量:6
18
作者 屠彬彬 于凤芹 《计算机工程与应用》 CSCD 2012年第18期119-122,共4页
人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过... 人在不同情感下的语音信号其非平稳性尤为明显,传统的MFCC只能反映语音信号的静态特征,经验模态分解能够精细地刻画语音信号的非平稳特性。为提取情感语音的非平稳特征,用经验模态分解将情感语音信号分解为一系列固有模态函数分量,通过Mel滤波器后取其对数能量,进行DCT反变换后得到改进的MFCC作为情感识别的新特征,采用支持向量机对高兴、生气、厌烦和恐惧等四种语音情感识别。仿真实验结果表明:改进的MFCC识别率达到77.17%,在不同的信噪比下,识别率最大可提高3.26%。 展开更多
关键词 语音情感识别 MEL频率倒谱系数 经验模态分解 支持向量机
下载PDF
基于改进MFCC的鸟鸣声识别方法研究 被引量:11
19
作者 程龙 张华清 《中国传媒大学学报(自然科学版)》 2017年第3期41-46,共6页
鸟鸣声识别的关键就在于对鸣声信号进行合理的特征值提取。鸟鸣声信号具有非平稳性,传统的梅尔倒谱系数(MFCC)仅能反映鸣声信号的静态特性,并且算法中直接运用FFT处理非平稳信号存在局限性。本文提出了一种基于经验模态分解(EMD)改进的M... 鸟鸣声识别的关键就在于对鸣声信号进行合理的特征值提取。鸟鸣声信号具有非平稳性,传统的梅尔倒谱系数(MFCC)仅能反映鸣声信号的静态特性,并且算法中直接运用FFT处理非平稳信号存在局限性。本文提出了一种基于经验模态分解(EMD)改进的MFCC算法,通过对鸟鸣声信号进行经验模态分解,得到一系列固有模态函数分量后再进行FFT计算,频域合成后通过Mel滤波器,取其对数能量进行DCT变换,然后对结果作差分得到改进的MFCC参数,再采用高斯混合模型(GMM)进行鸟鸣声的识别。实验结果表明,改进的MFCC识别率达到70.09%,与未改进的MFCC识别率相比提高了3.42%。 展开更多
关键词 鸣声识别 梅尔倒谱系数 经验模态分解 高斯混合模型
下载PDF
结合残差相位的MFCC特征改进算法 被引量:1
20
作者 俸云 景新幸 《计算机仿真》 CSCD 北大核心 2009年第10期327-329,343,共4页
美尔频率倒谱参数(Mel frequency cepstral coefficient,MFCC)仿真了人耳的听觉特性,在语音识别实际应用中取得了比较高的识别率。为了更进一步完善系统以提高系统的识别率,提出一种将MFCC和残差相位相结合的方法进行语音识别。将传统... 美尔频率倒谱参数(Mel frequency cepstral coefficient,MFCC)仿真了人耳的听觉特性,在语音识别实际应用中取得了比较高的识别率。为了更进一步完善系统以提高系统的识别率,提出一种将MFCC和残差相位相结合的方法进行语音识别。将传统的基于MFCC的语音识别效果,与基于MFCC和残差相位相结合的语音识别效果进行比较。通过在MATLAB环境下进行仿真实验得出理想结论。利用MFCC和残差相位相结合的识别率高于MFCC的系统的识别率。所提出的改进算法更好的完善了识别系统,获得了更高的语音识别率。 展开更多
关键词 语音识别 美尔频率倒谱系数 残差相位 识别率
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部