期刊文献+
共找到304篇文章
< 1 2 16 >
每页显示 20 50 100
基于MFCC-IMFCC混合倒谱的托辊轴承故障诊断
1
作者 陶瀚宇 陈换过 +2 位作者 彭程程 高祥冲 杨磊 《机电工程》 CAS 北大核心 2024年第7期1215-1222,共8页
针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了... 针对梅尔倒谱系数(MFCC)对托辊轴承高频特征提取能力不足的问题,提出了一种基于梅尔倒谱系数和翻转梅尔倒谱系数(MFCC-IMFCC)的混合倒谱以及长短时记忆(LSTM)网络的托辊轴承故障诊断方法。首先,分析了三种状态下的托辊声音信号,明确了托辊轴承故障信息主要分布在中高频区域;然后,为有效保留高频信息,提取了MFCC-IMFCC,以帧级串联的方式组成了混合倒谱特征;最后,将混合倒谱特征输入到双层LSTM模型中进行了训练,建立了托辊轴承故障诊断模型。研究结果表明:针对托辊正常、滚动体故障和偏心旋转故障三种状态,LSTM结合混合倒谱特征的平均识别准确率达到96.72%,相比于单一的MFCC和IMFCC特征,准确率分别提升3.94%和7.41%,凸显了混合倒谱特征在表征托辊轴承故障信息方面的显著优势。 展开更多
关键词 托辊轴承 轴承故障声音信号 高频信息 梅尔倒谱系数 翻转梅尔倒谱系数 混合倒谱系数 长短时记忆网络
下载PDF
基于MFCC与CNN的机械故障声音自动识别
2
作者 黄炜 罗谢飞 《电声技术》 2024年第6期129-131,共3页
针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明... 针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明,该方法在机械故障声音识别中具有较高的准确率、精确率及召回率,能够有效识别故障案例。 展开更多
关键词 机械故障 声音识别 梅尔频率倒谱系数(mfcc) 卷积神经网络(CNN)
下载PDF
基于改进MFCC和RNN的变压器放电故障诊断方法
3
作者 赵晋级 戴云飞 《山东电力高等专科学校学报》 2024年第4期1-4,8,共5页
通过监测、分析变压器运行时的声音能够诊断运行状态、识别故障类型。变压器运行时的声音信号经过去噪预处理后,通过双树复小波变换,时域数据转换为频域数据,提取出改进的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)并... 通过监测、分析变压器运行时的声音能够诊断运行状态、识别故障类型。变压器运行时的声音信号经过去噪预处理后,通过双树复小波变换,时域数据转换为频域数据,提取出改进的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)并输入到循环神经网络(recurrent neural network,RNN)故障识别模型,挖掘出各特征之间的关系。实验结果表明,基于改进MFCC和RNN的变压器放电故障诊断方法,故障识别准确率达到98.88%,在捕捉变压器异响特征方面敏感而有效。 展开更多
关键词 故障诊断 变压器 梅尔频率倒谱系数 循环神经网络
下载PDF
语音信号特征提取中Mel倒谱系MFCC的改进算法 被引量:29
4
作者 张震 王化清 《计算机工程与应用》 CSCD 北大核心 2008年第22期54-55,58,共3页
从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传... 从说话人的语音信号中提取说话人的个性特征是声纹识别的关键。主要介绍语音信号特征提取方法中的Mel倒谱系数(Mel-Frequence Cepstral Coefficients,MFCC)的特点及其改进算法(3Q+1),分析给出了较详细的计算过程并通过实验比较了其和传统算法在语音识别系统中的差别。 展开更多
关键词 语音识别 特征提取 mfcc
下载PDF
基于改进MFCC与IMFCC的心音分类研究
5
作者 张伟 杨宏波 +1 位作者 潘家华 王威廉 《计算机仿真》 北大核心 2023年第10期346-352,共7页
心音信号的研究有助于先天性心脏病的早期辅助诊断。提出一种对先天性心脏病心音分类的新方法:对每例心音截取2秒作为样本;用经验模态分解、多正弦窗、幂函数压缩法对MFCC与IMFCC进行改进,并用改进后的MFCC与IMFCC分别提取心音样本相应... 心音信号的研究有助于先天性心脏病的早期辅助诊断。提出一种对先天性心脏病心音分类的新方法:对每例心音截取2秒作为样本;用经验模态分解、多正弦窗、幂函数压缩法对MFCC与IMFCC进行改进,并用改进后的MFCC与IMFCC分别提取心音样本相应频率系数,并计算各自的一阶差分作为融合特征。分类模型选用两层CNN网络。对5000例样本训练测试的二分类准确率为0.921,灵敏度和特异度分别为0.898、0.944;F1和AUC分别达到了0.919与0.958。上述法有望用于先心病机器辅助诊断。 展开更多
关键词 心音 经验模态分解 梅尔频率倒谱系数 翻转梅尔频率倒谱系数 多正弦窗 幂函数压缩
下载PDF
基于ITD-MFCC与卷积神经网络的核电电气设备异音检测技术 被引量:1
6
作者 杨磊 权伟 +3 位作者 李亮 王镜淇 高帆 于轩 《噪声与振动控制》 CSCD 北大核心 2023年第4期122-128,207,共8页
针对核电设备小样本异音数据集无法训练出高效预测模型难题,提出一种基于ITD-MFCC和卷积神经网络的电气设备异音检测方法。首先,利用固有时间尺度分解(Intrinsic Time-scale Decomposition,ITD)强化信号特征,增强特征辨识度;然后,利用... 针对核电设备小样本异音数据集无法训练出高效预测模型难题,提出一种基于ITD-MFCC和卷积神经网络的电气设备异音检测方法。首先,利用固有时间尺度分解(Intrinsic Time-scale Decomposition,ITD)强化信号特征,增强特征辨识度;然后,利用梅尔频率倒谱系数(Mel-frequency Cepstral Coefficients,MFCC)提取与人耳听觉特性关联的时频特征,进一步增强异音特征辨识度;最后,融合所提取特征指标,并利用卷积神经网络对融合特征进行训练,建立异响与数据特征映射关系,实现异音检测。试验结果表明:所设计的模型在小样本数据中准确率达到97.63%,相比于现有的支持向量机(Support Vector Machine,SVM)和BP神经网络模型准确率分别提升10.43%和12.86%。 展开更多
关键词 声学 异音检测 固有时间尺度分解 梅尔倒谱系数 卷积神经网络
下载PDF
基于改进MFCC融合特征及FA-PNN的驾驶员路怒情绪识别 被引量:5
7
作者 李尚卿 王晓原 +2 位作者 张杨 李浩 项徽 《计算机工程与应用》 CSCD 北大核心 2023年第2期306-313,共8页
现今关于驾驶员路怒情绪识别方法中语音特性分析相对较少,该研究以路怒情绪为研究对象,利用模拟驾驶系统建立数据集,通过分析驾驶员语音的频谱特征,将时域中短时能量及短时过零率特征参数和改进Mel频率倒谱系数(Mel frequency cepstral ... 现今关于驾驶员路怒情绪识别方法中语音特性分析相对较少,该研究以路怒情绪为研究对象,利用模拟驾驶系统建立数据集,通过分析驾驶员语音的频谱特征,将时域中短时能量及短时过零率特征参数和改进Mel频率倒谱系数(Mel frequency cepstral coefficients,MFCC)特征参数融合构成特征参数向量,利用萤火虫算法(firefly algorithm,FA)优化PNN神经网络(probabilistic neural networks)并构建识别模型,实现驾驶员路怒情绪的识别。实验结果表明,在相同神经网络下,改进MFCC融合特征提取方法相比传统MFCC特征提取方法具有更好的抗噪性。同时,FA-PNN模型的识别准确率为93.0%,相比传统PNN模型提高了11个百分点;F1-Score值为0.9328,提高了0.1047。该研究论证了语音信号处理技术对驾驶员路怒情绪识别的可行性,为汽车主动安全驾驶预警研究提供了新方法。 展开更多
关键词 路怒情绪 语音信号处理 FA-PNN 改进mfcc 特征融合
下载PDF
基于MFCC声音特征信号提取的托辊故障诊断
8
作者 郭洁 井庆贺 +3 位作者 闫寿庆 王鑫 谢苗 吴意兵 《中国安全科学学报》 CAS CSCD 北大核心 2023年第S02期116-121,共6页
为监测托辊健康运行状态,通过现场试验的方式提取了托辊正常音频信号与故障音频信号。针对提取的音频信号中包含有大量噪声的问题,提出一种改进的小波阈值去噪方法,该方法有效滤除了音频信号中的噪声,为信号的后期特征提取奠定了基础。... 为监测托辊健康运行状态,通过现场试验的方式提取了托辊正常音频信号与故障音频信号。针对提取的音频信号中包含有大量噪声的问题,提出一种改进的小波阈值去噪方法,该方法有效滤除了音频信号中的噪声,为信号的后期特征提取奠定了基础。为进一步研究正常音频信号与故障音频信号的特性差异性,利用梅尔倒谱系数(MFCC)特征提取法,得出了能明显观测到托辊正常状态与故障状态差异性的梅尔倒谱系数特征表征图。结果表明:故障音频信号时域图与频谱图比正常音频信号波动更加剧烈;托辊正常音频信号的梅尔倒谱系数特性表征图比故障音频信号的起始幅值高,且幅值下降更迟缓。 展开更多
关键词 托辊故障 故障音频 小波阈值去噪 滤波器 梅尔倒谱系数(mfcc)
下载PDF
基于鲁棒主成分分析和MFCC反复结构的歌声分离方法
9
作者 熊天 张天骐 +1 位作者 闻斌 吴超 《声学技术》 CSCD 北大核心 2023年第6期794-803,共10页
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效... 针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。 展开更多
关键词 鲁棒主成分分析(RPCA) 梅尔频率倒谱系数(mfcc) 歌声伴奏分离 反复结构
下载PDF
基于MFCC和CNN的变压器声学特征提取及故障识别 被引量:4
10
作者 宋诚 夏翔 +2 位作者 王鑫一 杨文星 姚平 《电工电气》 2023年第6期49-54,共6页
在变压器故障诊断中,为解决使用传统分类器方法存在的泛化能力弱、识别率不高等问题,提出了一种基于梅尔频率倒谱系数(MFCC)和卷积神经网络(CNN)的变压器声学特征提取及故障识别方法。利用数字麦克风采集变压器在不同工作状态下的声音信... 在变压器故障诊断中,为解决使用传统分类器方法存在的泛化能力弱、识别率不高等问题,提出了一种基于梅尔频率倒谱系数(MFCC)和卷积神经网络(CNN)的变压器声学特征提取及故障识别方法。利用数字麦克风采集变压器在不同工作状态下的声音信号,经预处理后计算其MFCC特征作为静态特征,并进一步处理得到ΔMFCC特征以及ΔΔMFCC特征作为动态特征;引入卷积神经网络模型作为分类器,分别使用静态特征与三者的融合特征作为数据集进行了训练;对两个模型的训练结果进行了分析,并在其他配电室对系统进行了验证实验。实验结果表明,该方法能够有效地根据变压器工作声音识别变压器的正常工作状态、过载状态以及放电故障,且动态特征的引入能够在一定程度上提高模型的识别效果。 展开更多
关键词 变压器 声音信号 故障诊断 梅尔频率倒谱系数 卷积神经网络 动态特征
下载PDF
基于特征融合和B-SVM的鸟鸣声识别算法 被引量:1
11
作者 陈晓 曾昭优 《声学技术》 CSCD 北大核心 2024年第1期119-126,共8页
为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。... 为了实现在野外通过低成本嵌入式系统识别鸟类,提出了基于特征融合和B-SVM的鸟鸣声识别方法。对鸟鸣声信号提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、短时能量和短时过零率组成特征参数,通过线性判别算法对特征参数进行特征融合。利用黑寡妇算法通过测试集对支持向量机模型的核参数和损失值进行优化得到B-SVM模型。利用Xeno-canto鸟鸣声数据集对本文算法进行了测试,结果表明该方法的识别准确率为93.23%。算法维度参数的大小和融合特征维度的高低是影响算法识别效果的重要因素。在相同条件下,文中所提的基于特征融合和B-SVM模型的鸟鸣声识别算法相较于其他特征参数和模型,识别的准确率更高,为野外鸟类识别提供了参考。 展开更多
关键词 鸟鸣声识别 梅尔频率倒谱系数 线性判别算法 黑寡妇优化算法 支持向量机
下载PDF
基于MFCC的空中交通管制语音指令的特征提取研究
12
作者 王兴林 《电声技术》 2023年第6期68-72,共5页
随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义... 随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义。文章介绍空中交通管制指令的基本要求,详细分析语音信号特征提取的各个环节,通过梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取语音信号的特征,再使用高斯混合模型(Gaussian Mixture Model,GMM)进行训练和分类,从而实现语音信号的识别,具有一定的实际运用价值。 展开更多
关键词 语音信号 特征提取 梅尔频率倒谱系数(mfcc) 高斯混合模型(GMM) 模型训练
下载PDF
试验环境水下声信号的特征提取方法
13
作者 王红滨 王永乐 +1 位作者 何鸣 薛垚 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第3期489-495,共7页
水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用... 水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用梅尔频谱倒谱系数及线性预测系数处理,两者运用特征加权组合方法得到新的特征矩阵;再应用映射插值算法对特征矩阵进行处理,获得适应神经网络输入的三通道矩阵。本文选取的网络模型为残差神经网络。利用实验室所录制的对河口水库数据集测试表明,本文提出的特征提取方法普遍优于仅利用梅尔频谱倒谱系数或线性预测系数的特征处理方法。利用单频矩形脉冲信号对环境进行深度5分类,准确率平均提升2%。利用线性调频信号对环境进行深度5分类,准确率平均提升2.03%。本文提出的特征提取方法对线性调频信号在深度分类任务下处理的结果要优于单频矩形脉冲信号处理的结果。 展开更多
关键词 环境反演 特征提取 梅尔频谱倒谱系数 线性预测系数 特征加权组合方法 残差神经网络 神经网络 水下声信号
下载PDF
基于声信号的离心泵故障诊断研究
14
作者 陈剑 姜涛 陈品 《电子测量与仪器学报》 CSCD 北大核心 2024年第5期169-177,共9页
各种原因使得工业现场设备状态监测的首选测量信号是声信号时,提出一种基于声信号的设备状态监测方法显得尤为必要。以某型离心泵为依据对象,对现场采集的声信号提取梅尔倒谱系数(MFCC)作为信号的初始特征,然后计算这些MFCC初始特征的... 各种原因使得工业现场设备状态监测的首选测量信号是声信号时,提出一种基于声信号的设备状态监测方法显得尤为必要。以某型离心泵为依据对象,对现场采集的声信号提取梅尔倒谱系数(MFCC)作为信号的初始特征,然后计算这些MFCC初始特征的散布熵(DE)值,并通过主成分分析法(PCA)对矩阵进行降维,从而构造特征矩阵。利用蝙蝠优化算法(BA)对支持向量机(SVM)的惩罚系数与核函数参数进行优化,对离心泵的多种故障工况开展诊断,并与多种诊断方法进行比较。实验结果表明,经过BA优化后的模型在诊断准确率上提高了21.7%;在该模型的基础上利用DE对MFCC提取的信号进行深度挖掘,使模型诊断的准确率提高2.05%。 展开更多
关键词 离心泵故障诊断 声信号 梅尔倒谱散布熵 蝙蝠优化算法 支持向量机
下载PDF
基于多尺度时序感知网络的课堂语音情感识别方法
15
作者 周菊香 刘金生 +2 位作者 甘健侯 吴迪 李子杰 《计算机应用》 CSCD 北大核心 2024年第5期1636-1643,共8页
语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂... 语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂学习状态,从而达到精准施教的目的。针对课堂语音情感识别任务,首先,收集中小学的课堂实录教学视频,提取音频并进行人工切分和标注,构建了包含6类情感的中小学教学语音情感语料库;其次,基于时序卷积网络(TCN)和交叉门控机制(cross-gated mechanism)设计了双路时序卷积通道,以提取多尺度交叉融合特征;最后,采用动态权重融合策略调整不同尺度特征的贡献度,减少非重要特征对识别结果的干扰,进一步增强模型的表征和学习能力。实验结果表明,所提方法在多个公共数据集上优于TIM-Net(Temporal-aware bI-direction Multi-scaleNetwork)、GM-TCNet(Gated Multi-scale Temporal Convolutional Network)和CTL-MTNet(CapsNet and Transfer Learning-based Mixed Task Net)等先进模型,在真实课堂语音情感识别任务上未加权平均召回率(UAR)和加权平均召回率(WAR)分别达90.58%和90.45%。 展开更多
关键词 语音情感识别 课堂语音 时序卷积网络 交叉门控卷积 梅尔频率倒谱系数
下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
16
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 mel倒谱系数 个性信息 mel倒谱系数 频谱分布 语音信号
下载PDF
基于脉搏波频域梅尔频率倒谱系数特征的高血压危险分层预测模型
17
作者 齐晨浩 杨晶东 +2 位作者 邱泽浩 尧明慧 燕海霞 《海军军医大学学报》 CAS CSCD 北大核心 2024年第10期1226-1240,共15页
目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transf... 目的 为改进基于人工智能技术高血压时域脉搏波分类模型精度低、泛化性能差的问题,提出一种基于融合注意力机制的频域脉搏波预测模型。方法 首先将时域脉搏波转换为频域梅尔频率倒谱系数特征,增强脉搏波区分度,采用时间卷积网络与Transformer 结构提取脉搏波深层特征,并将自注意力机制与选择性内核注意力进行决策融合,提取脉搏波关联特征,并采用Floodings正则化方法间接控制训练损失,防止过拟合发生。针对上海中医药大学附属龙华医院及上海市中西医结合医院提供的527例临床脉诊数据,进行5折交叉验证实验。此外,采用梯度提升决策树算法统计脉搏波频域特征的贡献率排名,分析影响模型分类精度的关键因素,为中医临床辅助诊断提供参考价值。结果 本研究提出的模型分类评估指标准确度、F1值、精确率、召回率和AUC值分别为0.939 6、0.924 9、0.940 9、0.929 5和0.993 4。脉搏波的静态特征、一阶差分和二阶差分系数的贡献率相对均衡,说明高血压危险程度不仅与脉搏波的静态特征相关,也应当考虑脉搏波的动态特征。结论 与典型脉搏波分类模型相比,本研究提出的模型具有较高的分类精度和泛化性能。 展开更多
关键词 高血压 危险分层 梅尔频率倒谱系数 时间卷积网络 TRANSFORMER
下载PDF
基于MFCC的语音情感识别 被引量:23
18
作者 韩一 王国胤 杨勇 《重庆邮电大学学报(自然科学版)》 2008年第5期597-602,共6页
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别... 情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中。实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性。 展开更多
关键词 mfcc 语音情感识别 情感计算
下载PDF
融合LPC与MFCC的特征参数 被引量:8
19
作者 张学锋 王芳 夏萍 《计算机工程》 CAS CSCD 北大核心 2011年第4期216-217,229,共3页
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一... 在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。 展开更多
关键词 线性预测 美尔倒谱系数 说话人识别
下载PDF
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
20
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测倒谱系数 美尔倒谱系数 矢量量化 动态时间规整
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部