为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC);为更加全面表征转辙机声信...为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC);为更加全面表征转辙机声信号的特点,对MFCC进行改进得到多尺度MFCC特征;引入卷积神经网络(convolutional neural network,CNN)构建转辙机声信号识别模型,并采用五折交叉验证法获得两种特征的识别准确率。将S700K型转辙机在4种状态下运行时采集的真实声音信号进行训练和测试。结果表明:多尺度MFCC特征可使转辙机声音状态识别准确率至少提高7.5%。并且在低信噪比(signal-to-noise ratio,SNR)下,多尺度MFCC特征也有更好的表现,其准确率相较传统MFCC可提升35%。展开更多
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line...重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。展开更多
现阶段,汽车异响的诊断主要依赖有经验的工程师进行主观评判,存在不准确、易错判、易漏判的问题。针对汽车敲击异响实测信号进行统计分析得到梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC),并以此作为表征异响来源的特征向量...现阶段,汽车异响的诊断主要依赖有经验的工程师进行主观评判,存在不准确、易错判、易漏判的问题。针对汽车敲击异响实测信号进行统计分析得到梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC),并以此作为表征异响来源的特征向量,基于最大似然估计法构建其联合概率分布高斯混合模型(Gaussian mixture model,GMM),从而针对未知实测异响信号可利用该GMM模型进行似然判别。指出了说话人识别技术与敲击异响识别的不同之处即Mel三角滤波器个数和离散余弦变换输出系数个数的选取方式,并对方法的可行性进行分析,最后试验加以验证。结果显示此方法的识别率达100%,拒绝率达100%以上,为汽车异响的客观评价方法打下基础。展开更多
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效...针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。展开更多
为了提高广播语言类节目的播出安全,提出一种基于梅尔频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)的算法,对两段音频信号进行相似度比对。通过对音频频谱特征提取得到均值特征参数,再计算两者的特征参数矩阵的欧式距...为了提高广播语言类节目的播出安全,提出一种基于梅尔频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)的算法,对两段音频信号进行相似度比对。通过对音频频谱特征提取得到均值特征参数,再计算两者的特征参数矩阵的欧式距离,根据欧氏距离的大小判定两段音频的相似度来完成对比任务。实践证明,该方法对于语言类音频比对具有较高的准确性。展开更多
文摘重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。
文摘针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。
文摘为了提高广播语言类节目的播出安全,提出一种基于梅尔频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)的算法,对两段音频信号进行相似度比对。通过对音频频谱特征提取得到均值特征参数,再计算两者的特征参数矩阵的欧式距离,根据欧氏距离的大小判定两段音频的相似度来完成对比任务。实践证明,该方法对于语言类音频比对具有较高的准确性。