期刊文献+
共找到779篇文章
< 1 2 39 >
每页显示 20 50 100
基于小波散射变换和MFCC的双特征语音情感识别融合算法 被引量:1
1
作者 应娜 吴顺朋 +1 位作者 杨萌 邹雨鉴 《电信科学》 北大核心 2024年第5期62-72,共11页
为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PEW-BAR)。算法首... 为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PEW-BAR)。算法首先获取语音信号的小波散射特征和梅尔频率倒谱系数的相关特征;然后按尺度维度扩展小波散射特征,利用支持向量机得到情感识别的后验概率并获得排列熵,并使用排列熵对后验概率进行加权;最后采用一种偏差调整规则进一步融合MFCC的相关特征的识别结果。实验结果表明,在EMODB、RAVDESS和eNTERFACE05数据集上,与传统的基于小波散射系数的语音情感识别方法相比,该算法将ACC分别提高了2.82%、2.85%和5.92%,将UAR分别提升了3.40%、2.87%和5.80%,IEMOCAP上提高了6.89%。 展开更多
关键词 语音情感识别 小波散射变换 排列熵 mfcc 模型融合
下载PDF
基于MFCC和MDE-SVDD的滚动轴承音频信号异常检测方法 被引量:4
2
作者 高原 邓艾东 +2 位作者 范永胜 梁志宏 傅行军 《动力工程学报》 CAS CSCD 北大核心 2024年第2期277-283,共7页
针对传统振动传感器安装不易,而声信号分析易受环境噪声干扰的问题,提出一种基于梅尔倒谱系数(MFCC)和马氏距离加权改进支持向量数据描述(MDE-SVDD)的音频信号异常检测方法,用于滚动轴承运行状态监测。该方法从轴承运行声信号中提取MFC... 针对传统振动传感器安装不易,而声信号分析易受环境噪声干扰的问题,提出一种基于梅尔倒谱系数(MFCC)和马氏距离加权改进支持向量数据描述(MDE-SVDD)的音频信号异常检测方法,用于滚动轴承运行状态监测。该方法从轴承运行声信号中提取MFCC作为特征向量,进而使用马氏距离加权改进SVDD,以增强对噪声样本的抗干扰性,从而提高算法的检测精度,然后在实验音频信号中添加多种强度的高斯白噪声以模拟现场噪声环境,并将所提方法的测试结果与传统SVDD等异常检测方法进行比较。结果表明:在低信噪比(-5 dB)场景下,MDE-SVDD的异常检测平均准确率达到91.99%,相较于传统SVDD提升了7.73百分比。 展开更多
关键词 滚动轴承 声纹识别 梅尔倒谱系数 支持向量数据描述 异常检测
下载PDF
基于改进MFCC和能量算子倒谱的语种识别
3
作者 陈思竹 龙华 邵玉斌 《计算机科学》 CSCD 北大核心 2024年第S02期367-372,共6页
针对广播语音信号低信噪比下语种识别准确率低和鲁棒性差的问题,提出了基于小波包变换改进MFCC和能量算子倒谱特征的语种识别算法。首先,采用小波包变换代替MFCC中的傅里叶变换和Mel滤波得到WMFCC特征参数。在保留人耳听觉感知特性的基... 针对广播语音信号低信噪比下语种识别准确率低和鲁棒性差的问题,提出了基于小波包变换改进MFCC和能量算子倒谱特征的语种识别算法。首先,采用小波包变换代替MFCC中的傅里叶变换和Mel滤波得到WMFCC特征参数。在保留人耳听觉感知特性的基础上提升语音信号的高频分析能力和分析精确度,克服傅里叶变换的局限性。其次,提取Teager能量算子倒谱,得到语音瞬时能量的特性,与改进的MFCC特征参数融合得到新的特征参数TWMFCC。最后,为进一步提升低信噪比语音的识别效果,提出了VMD自适应维纳滤波去噪算法。通过实验对比了所提特征与传统特征的识别效果,所提特征的平均识别准确率显著提升,带噪语音在未进行语音去噪处理的情况下较传统MFCC高13.02%,有效改善了传统特征在低信噪比下识别准确率低的问题,具有较强的抗噪性和鲁棒性。 展开更多
关键词 语种识别 mfcc 小波包变换 能量算子倒谱 GMM-UBM
下载PDF
水声目标的MFCC特征提取与分类识别 被引量:1
4
作者 葛轶洲 姚泽 +1 位作者 张歆 周青 《计算机仿真》 2024年第2期13-16,33,共5页
水声目标识别技术在水下信息处理中起着非常重要的作用,从辐射噪声中提取水声目标的有效特征一直都是水声目标识别技术的难点所在。提出了一种利用水声目标辐射噪声的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)作为... 水声目标识别技术在水下信息处理中起着非常重要的作用,从辐射噪声中提取水声目标的有效特征一直都是水声目标识别技术的难点所在。提出了一种利用水声目标辐射噪声的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)作为目标特征提取的方法。通过对辐射噪声信号进行梅尔频率滤波得到目标噪声信号的MFCC特征,它模拟了人耳对不同频率的声音具有不同感知能力的听觉非线性效应,因此具有良好的识别效果。通过对实际水声目标的辐射噪声进行测试实验,提取目标噪声信号的MFCC特征向量,并运用K近邻算法对其进行分类识别,实验结果显示MFCC特征提取与分类识别算法对水声目标的识别率达到85%以上。 展开更多
关键词 水声信息对抗 特征提取 梅尔倒谱系数 分类识别
下载PDF
Automatic Speaker Recognition Using Mel-Frequency Cepstral Coefficients Through Machine Learning 被引量:1
5
作者 U˘gur Ayvaz Hüseyin Gürüler +3 位作者 Faheem Khan Naveed Ahmed Taegkeun Whangbo Abdusalomov Akmalbek Bobomirzaevich 《Computers, Materials & Continua》 SCIE EI 2022年第6期5511-5521,共11页
Automatic speaker recognition(ASR)systems are the field of Human-machine interaction and scientists have been using feature extraction and feature matching methods to analyze and synthesize these signals.One of the mo... Automatic speaker recognition(ASR)systems are the field of Human-machine interaction and scientists have been using feature extraction and feature matching methods to analyze and synthesize these signals.One of the most commonly used methods for feature extraction is Mel Frequency Cepstral Coefficients(MFCCs).Recent researches show that MFCCs are successful in processing the voice signal with high accuracies.MFCCs represents a sequence of voice signal-specific features.This experimental analysis is proposed to distinguish Turkish speakers by extracting the MFCCs from the speech recordings.Since the human perception of sound is not linear,after the filterbank step in theMFCC method,we converted the obtained log filterbanks into decibel(dB)features-based spectrograms without applying the Discrete Cosine Transform(DCT).A new dataset was created with converted spectrogram into a 2-D array.Several learning algorithms were implementedwith a 10-fold cross-validationmethod to detect the speaker.The highest accuracy of 90.2%was achieved using Multi-layer Perceptron(MLP)with tanh activation function.The most important output of this study is the inclusion of human voice as a new feature set. 展开更多
关键词 Automatic speaker recognition human voice recognition spatial pattern recognition mfccs SPECTROGRAM machine learning artificial intelligence
下载PDF
基于改进的MFCC与CNN心音信号识别方法的研究 被引量:1
6
作者 王佳佳 熊飞龙 《计算机测量与控制》 2024年第12期201-207,215,共8页
心音分类在心血管疾病的早期检测中起着至关重要的作用,特别是对小型初级卫生保健诊所、缺少专业人员陪护的家庭等检测;为提高心音信号数据类别间的可辨别性,提出了一种改进MFCC方法提取数据特征,并与PCA算法组合,作为样本输入CNN模型... 心音分类在心血管疾病的早期检测中起着至关重要的作用,特别是对小型初级卫生保健诊所、缺少专业人员陪护的家庭等检测;为提高心音信号数据类别间的可辨别性,提出了一种改进MFCC方法提取数据特征,并与PCA算法组合,作为样本输入CNN模型进行分类;对心音信号数据集进行降噪与下采样,减少数据量及噪声影响,利用改进的MFCC对其进行特征提取,并利用PCA算法进而抽取相关特征;为验证不同特征数据集以及不同滤波算法在提取心音数据特征数据集方面对分类过程及分类结果所产生的影响,将其分别输入CNN模型进行训练;经实验验证,改进的MFCC特征+PCA算法与传统的MFCC相比较,可提高训练模型的训练速度,同时也可提高识别率。 展开更多
关键词 心音分类 mfcc 滤波 PCA CNN
下载PDF
基于MFCC的声音检测装置及算法实现
7
作者 米月琴 王新怀 徐茵 《电子产品世界》 2024年第1期56-59,共4页
提出了一种基于梅尔频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)的声音检测装置及算法实现。通过采集声音的波形,结合特征提取和分类算法,实现对不同声音的智能判断。从嵌入式系统硬件设计、声音波形特征提取、声音分类算... 提出了一种基于梅尔频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)的声音检测装置及算法实现。通过采集声音的波形,结合特征提取和分类算法,实现对不同声音的智能判断。从嵌入式系统硬件设计、声音波形特征提取、声音分类算法等方面进行了详细的研究,并对实验结果进行了分析。结果表明,该设计方案在声音检测方面具有较高的准确性和可行性。 展开更多
关键词 mfcc 特征提取 嵌入式系统 检测装置
下载PDF
基于优化VMD融合MFCC特征的海缆裸露状态识别
8
作者 张春强 韩超 +1 位作者 杨伟森 李会 《海洋技术学报》 2024年第5期92-101,共10页
针对分布式光纤传感信号噪声强、识别难的问题,本文提出一种基于优化变分模态分解(Variational Mode Decomposition,VMD)融合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)特征的海缆裸露状态识别方法,用于识别海上风机... 针对分布式光纤传感信号噪声强、识别难的问题,本文提出一种基于优化变分模态分解(Variational Mode Decomposition,VMD)融合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)特征的海缆裸露状态识别方法,用于识别海上风机海底电缆接入端浅埋和裸露两种状态。首先,利用参数优化的VMD对光纤振动信号进行分解,并利用相关系数法筛选本征模态分量(Intrinsic Mode Function,IMF);其次,融合梅尔频率倒谱系数、原始振动信号和所选IMF的时域和频域特征,以及IMF的能量和熵特征构建高维特征集,利用补偿距离评估技术(Compensation Distance Evaluation Technique,CDET)进行降维;最后,设计长短时记忆网络(Long Short Term Memory Network,LSTM)结构,将训练集输入网络进行训练,测试集验证网络的有效性,实现海缆裸露状态识别。通过现场采集的海缆振动数据进行验证,测试准确率达到100%,结果表明该方法能够准确识别和预测海缆裸露状态。 展开更多
关键词 VMD mfcc CDET LSTM 海缆裸露识别
下载PDF
改进MFCC特征和MLA模型的语音情感识别 被引量:4
9
作者 张晓莉 《福建电脑》 2024年第1期52-56,共5页
MFCC及其一阶差分特征表征了语音的静态和动态信息,常作为SER的情感特征。在传统的MFCC特征提取过程中,通过人工调参实现语音信噪比的平衡,容易造成过度补偿的情况。本文提出两种改进方法,分别获得EMFCC和AMFCC特征。为了获得最佳的分... MFCC及其一阶差分特征表征了语音的静态和动态信息,常作为SER的情感特征。在传统的MFCC特征提取过程中,通过人工调参实现语音信噪比的平衡,容易造成过度补偿的情况。本文提出两种改进方法,分别获得EMFCC和AMFCC特征。为了获得最佳的分类准确率,基于池化层、LSTM和注意力机制构建了MLA模型,能够有效捕捉特征中的情感信息。采用由MFCC及其一阶差分特征和两个改进MFCC特征组成的混合特征,在CASIA语料库上取得了81.79%的未加权准确率。消融实验的结果表明,与SER领域其他较为先进的识别方法进行对比,改进的MFCC特征具有较好的性能优势。 展开更多
关键词 语音情感识别 梅尔频率倒谱系数 长短时记忆 注意力机制
下载PDF
基于MFCC与CNN的机械故障声音自动识别
10
作者 黄炜 罗谢飞 《电声技术》 2024年第6期129-131,共3页
针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明... 针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明,该方法在机械故障声音识别中具有较高的准确率、精确率及召回率,能够有效识别故障案例。 展开更多
关键词 机械故障 声音识别 梅尔频率倒谱系数(mfcc) 卷积神经网络(CNN)
下载PDF
基于MFCC和HMM的语音识别优化方法研究
11
作者 郭佳淇 张继通 《电声技术》 2024年第10期83-85,共3页
为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectatio... 为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30数据集进行实验验证。结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性。 展开更多
关键词 语音识别 梅尔频率倒谱系数(mfcc) 隐马尔可夫模型(HMM) 期望最大化(EM)
下载PDF
基于MFCC-IMFCC混合倒谱的托辊轴承故障诊断
12
作者 陶瀚宇 陈换过 +2 位作者 彭程程 高祥冲 杨磊 《机电工程》 CAS 北大核心 2024年第7期1215-1222,共8页
针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了... 针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了托辊轴承故障信息主要分布在中高频区域;然后,为有效保留高频信息,提取了MFCC-IMFCC,以帧级串联的方式组成了混合倒谱特征;最后,将混合倒谱特征输入到双层LSTM模型中进行了训练,建立了托辊轴承故障诊断模型。研究结果表明:针对托辊正常、滚动体故障和偏心旋转故障三种状态,LSTM结合混合倒谱特征的平均识别准确率达到96.72%,相比于单一的MFCC和IMFCC特征,准确率分别提升3.94%和7.41%,凸显了混合倒谱特征在表征托辊轴承故障信息方面的显著优势。 展开更多
关键词 托辊轴承 轴承故障声音信号 高频信息 梅尔倒谱系数 翻转梅尔倒谱系数 混合倒谱系数 长短时记忆网络
下载PDF
基于语音特征与MFCC谱图融合模型的抑郁症检测
13
作者 林靖宇 郑宜荣 郑贤伟 《计算机应用文摘》 2024年第19期129-130,134,共3页
据《2022年国民抑郁症蓝皮书》显示,我国的抑郁症患者人数接近1亿。为更好地实现抑郁症辅助检测,文章首先利用MFPH端点检测方法分离了语音信号的有声段、无声段,其次提取了停顿时长、停顿次数、短时过零率等语音特征及MFCC特征谱图。对... 据《2022年国民抑郁症蓝皮书》显示,我国的抑郁症患者人数接近1亿。为更好地实现抑郁症辅助检测,文章首先利用MFPH端点检测方法分离了语音信号的有声段、无声段,其次提取了停顿时长、停顿次数、短时过零率等语音特征及MFCC特征谱图。对比分析发现,基于语音特征与MFCC特征谱图的融合模型在测试集上的准确率可以达到76.4%。 展开更多
关键词 抑郁症 MFPH端点检测 语音特征 mfcc
下载PDF
说话人识别中MFCC参数提取的改进 被引量:29
14
作者 胡政权 曾毓敏 +1 位作者 宗原 李梦超 《计算机工程与应用》 CSCD 2014年第7期217-220,共4页
在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表... 在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表明基于此改进提取的MFCC参数,可以明显提高说话人识别系统的识别率,尤其在低信噪比的环境下,效果明显。 展开更多
关键词 mfcc参数 频谱重建 说话人识别
下载PDF
基于改进LPCC和MFCC的汉语耳语音识别 被引量:17
15
作者 荣薇 陶智 +1 位作者 顾济华 赵鹤鸣 《计算机工程与应用》 CSCD 北大核心 2007年第30期213-216,共4页
以提高汉语耳语的识别率为目的,提出了将MFCC、LPCC及它们各自的动态参数等多种特征有效结合进行耳语识别的方法。实验结果说明了LPCC、MFCC结合动态参数可作为汉语耳语音识别的特征参数,且它们的结合提高了系统的识别率,在小字库内得... 以提高汉语耳语的识别率为目的,提出了将MFCC、LPCC及它们各自的动态参数等多种特征有效结合进行耳语识别的方法。实验结果说明了LPCC、MFCC结合动态参数可作为汉语耳语音识别的特征参数,且它们的结合提高了系统的识别率,在小字库内得出的识别率为94.5%。 展开更多
关键词 耳语音 语音识别 LPCC参数 mfcc参数
下载PDF
基于MFCC的语音情感特征提取研究 被引量:29
16
作者 李虹 徐小力 +2 位作者 吴国新 丁春艳 赵学梅 《电子测量与仪器学报》 CSCD 北大核心 2017年第3期448-453,共6页
为了研究"世界记忆遗产"东巴经典古籍的音频分类,以通过语音情感特征提取的方法分类鉴别东巴音频类别,并实现对东巴经典语音的情感状态识别,同时提高人机交互性能,提出采用Mel频率倒谱系数(MFCC)实现语音情感特征的提取。通... 为了研究"世界记忆遗产"东巴经典古籍的音频分类,以通过语音情感特征提取的方法分类鉴别东巴音频类别,并实现对东巴经典语音的情感状态识别,同时提高人机交互性能,提出采用Mel频率倒谱系数(MFCC)实现语音情感特征的提取。通过引入MFCC的一阶差分、二阶差分描述语音特征的动态特征,并整合短时能量特征,最终形成MFCC和短时能量相叠加的语音信号特征参数,达到提取反映语音情感特征的目的。实验验证表明,该语音信号特征提取方法能够更明显地区分出包含在语音中的情感信息,为语音情感特征的识别研究及东巴古籍音频分类鉴别提供理论基础。 展开更多
关键词 东巴古籍 语音情感特征 特征参数 mfcc 短时能量
下载PDF
基于MFCC与神经网络的小蠹声音种类自动鉴别 被引量:9
17
作者 罗茜 王鸿斌 +1 位作者 张真 孔祥波 《北京林业大学学报》 CAS CSCD 北大核心 2011年第5期81-85,共5页
昆虫发出的各种声音具有种间特异性,是非常可靠的分类依据。利用这一特性,本实验旨在探索一种对昆虫自动分类的新方法。本实验录制了红脂大小蠹、云南切梢小蠹、短毛切梢小蠹和华山松大小蠹4种小蠹虫的胁迫声,利用Adobe Adition2.0对每... 昆虫发出的各种声音具有种间特异性,是非常可靠的分类依据。利用这一特性,本实验旨在探索一种对昆虫自动分类的新方法。本实验录制了红脂大小蠹、云南切梢小蠹、短毛切梢小蠹和华山松大小蠹4种小蠹虫的胁迫声,利用Adobe Adition2.0对每个声音文件进行降噪,再将其截取成只含有一个脉冲组的声音片段。在MATLAB环境下对这些声音片段进行端点监测并提取12维的MFCC(Mel频率倒谱系数),然后将此特征参数输入BP神经网络进行训练和检测。设置训练样本数为20、40、60、80、100,4种小蠹检测样本数分别为54、95、54、50,结果显示识别率随着训练样本数的增加而提高,在训练样本量为100时的最高识别率达到98.14%,平均识别率为93.29%,收到了较好的效果。为了验证小蠹种类数对识别率的影响,本实验对4种小蠹进行了两两比较,结果显示总体上高于4种一起识别的结果。 展开更多
关键词 小蠹 声音 识别 神经网络 mfcc
下载PDF
高阶MFCC的话者识别性能及其噪声鲁棒性 被引量:14
18
作者 李霄寒 戴蓓倩 +1 位作者 方绍武 刘鸣 《信号处理》 CSCD 2001年第2期124-129,共6页
在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量。本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系... 在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量。本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系数在干净环境下对于话者识别而言具有与低阶MFCC系数相当的识别性能,并且当环境信噪比恶劣时,高阶的MFCC系数表现出比低阶MFCC系数更强的噪声鲁棒性。基于这个结果,本文将高阶系数的取值范围进一步向低阶拓展,只滤除最易受噪声影响的几个系数,并与Delta参数相结合形成新的特征矢量。实验证明,这种经过适当选取的MFCC系数同时具有良好的话者识别性能和噪声鲁棒性。 展开更多
关键词 高阶mfcc 话者识别 噪声鲁棒性 语音信号处理
下载PDF
基于修正MFCC参数汉语耳语音的话者识别 被引量:23
19
作者 林玮 杨莉莉 徐柏龄 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第1期54-62,共9页
耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提... 耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率. 展开更多
关键词 耳语音 话者识别 mfcc参数 隐马尔可夫模型
下载PDF
噪声鲁棒性说话人识别语音高频加权MFCC提取 被引量:15
20
作者 陈迪 龚卫国 李波 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第3期668-672,共5页
本文提出了一种可提高噪声环境下的说话人确认识别率的语音MFCC参数高频加权方法。由于Mel频率与线性频率成对数关系,频谱能量在高频部分分辨率逐减,而语音经过基音同步可变窗长加窗后的语音会在一定程度上避免语音信号的谐波泄露,从而... 本文提出了一种可提高噪声环境下的说话人确认识别率的语音MFCC参数高频加权方法。由于Mel频率与线性频率成对数关系,频谱能量在高频部分分辨率逐减,而语音经过基音同步可变窗长加窗后的语音会在一定程度上避免语音信号的谐波泄露,从而保留更多高次谐波信息。将语音频谱能量高频部分进行加权,则可使语音增强,提高语音鲁棒性。该方法被用于基音同步预处理MFCC参数提取中,并进行了说话人确认实验。实验结果表明,即使在信噪比较低的情况下,该方法都会在一定程度上提高多种噪声环境下的说话人确认识别率。 展开更多
关键词 高频加权 说话人确认 基音同步 鲁棒性 mfcc
下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部