期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
梅尔频率倒谱耦合神经网络的焊接缺陷检测
1
作者 金晖 金传伟 +2 位作者 刘俊勇 刘利民 刘念 《计算机工程与设计》 北大核心 2016年第7期1911-1915,共5页
当前焊接图像缺陷检测技术因依赖焊接几何特征缺陷,对微小缺陷中黑暗边缘的噪声较为敏感,导致其定位精度不佳,为此提出一种梅尔频率倒谱耦合神经网络特征匹配的焊接缺陷检测算法。利用DCT(discrete cosine transform)与Zigzag机制,将焊... 当前焊接图像缺陷检测技术因依赖焊接几何特征缺陷,对微小缺陷中黑暗边缘的噪声较为敏感,导致其定位精度不佳,为此提出一种梅尔频率倒谱耦合神经网络特征匹配的焊接缺陷检测算法。利用DCT(discrete cosine transform)与Zigzag机制,将焊接图像排列成1D信号数组;将1D信号分割为多个帧,构造窗口函数,增强相邻帧之间的连续性,引入倒谱技术,查询1D信号的稳定特性,提取其梅尔频率倒谱系数;定义两个正交多项式,建立多项式系数计算模型,提取多项式系数。基于神经网络训练,对提取特征与数据库特征进行匹配,完成缺陷检测。实验结果表明,与当前焊接缺陷检测技术相比,该算法的定位精度高达90%,鲁棒性更强,不受噪声影响。 展开更多
关键词 焊接图像 缺陷检测 梅尔频率 神经网络 窗口函数 多项式系数
下载PDF
基于敲击声MFSC特征CNN模型的古建筑木材物理力学性能评估 被引量:1
2
作者 柯栋方 辛振波 +1 位作者 张厚江 彭林 《北京林业大学学报》 CAS CSCD 北大核心 2023年第2期149-160,共12页
【目的】我国有大量的木结构古建筑,在现场对古建筑木构件正常木材的物理力学性能给予方便的检测评估,是古建筑木结构日常保护、修缮和安全评估的刚性需求。本研究对敲击声信号引入机器学习算法处理,力图将便捷的敲击方式应用于古建筑... 【目的】我国有大量的木结构古建筑,在现场对古建筑木构件正常木材的物理力学性能给予方便的检测评估,是古建筑木结构日常保护、修缮和安全评估的刚性需求。本研究对敲击声信号引入机器学习算法处理,力图将便捷的敲击方式应用于古建筑木材物理力学性能的无损检测。【方法】以北京某皇家古建筑拆修下来的4段落叶松旧木构件为原材料,加工无疵试件,首先探究木试件尺寸、密度对敲击声信号的影响,试验测定木试件的密度、抗弯强度、抗弯弹性模量、顺纹抗压强度等物理力学性能参数;然后对试验采集的敲击声信号进行梅尔频率谱系数(MFSC)特征提取,以敲击声MFSC特征为输入、试件物理力学性能为输出,构建古建筑木材物理力学性能卷积神经网络(CNN)评估模型。【结果】试件尺寸对敲击声信号没有影响,密度较高试件的敲击声信号的主峰频率较高;失活层对模型性能有较为明显的影响,失活层失活率为0.2时的拟合效果最佳;所建立的模型对古建筑木材物理力学性能的评估效果良好,密度、抗弯强度、抗弯弹性模量、顺纹抗压强度评估值与真实值之间的决定系数分别达到0.873、0.819、0.746、0.860。【结论】本研究构建的基于敲击声MFSC特征CNN模型,对古建筑木材物理力学性能进行检测评估是可行的。 展开更多
关键词 古建筑木构件 物理力学性能 敲击声 梅尔频率系数(mfsc) 卷积神经网络(CNN)
下载PDF
基于LSTM模型的音乐推荐系统研究
3
作者 范凯燕 胡彦红 《电声技术》 2024年第9期136-138,共3页
随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音... 随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音乐推荐系统,并通过MATLAB平台进行测试。结果表明,该推荐系统表现良好。 展开更多
关键词 音乐推荐 梅尔频率系数(MFCC) 长短期记忆(LSTM) 内容推荐
下载PDF
基于MFCC与CNN的机械故障声音自动识别
4
作者 黄炜 罗谢飞 《电声技术》 2024年第6期129-131,共3页
针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明... 针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明,该方法在机械故障声音识别中具有较高的准确率、精确率及召回率,能够有效识别故障案例。 展开更多
关键词 机械故障 声音识别 梅尔频率系数(MFCC) 卷积神经网络(CNN)
下载PDF
基于MFCC和HMM的语音识别优化方法研究
5
作者 郭佳淇 张继通 《电声技术》 2024年第10期83-85,共3页
为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectatio... 为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30数据集进行实验验证。结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性。 展开更多
关键词 语音识别 梅尔频率系数(MFCC) 隐马尔可夫模型(HMM) 期望最大化(EM)
下载PDF
基于用户语音情感分析的景区反馈评估方法
6
作者 胡辉 《电声技术》 2024年第10期95-97,共3页
提出一种基于用户语音情感分析的景区反馈评估方法。首先,构建一个面向景区评估的情感分析框架,采用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取语音特征。其次,利用长短期记忆(Long Short-Term Memory,LSTM)网络... 提出一种基于用户语音情感分析的景区反馈评估方法。首先,构建一个面向景区评估的情感分析框架,采用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取语音特征。其次,利用长短期记忆(Long Short-Term Memory,LSTM)网络对提取的特征进行情感极性分类,将情感分为积极、消极、中性。最后,在交互式情感二元动作捕捉(Interactive Emotional Dyadic Motion Capture,IEMOCAP)数据集上进行实验。实验结果显示,本方法在精确率、召回率、准确率等指标上均表现出色,特别是在中性情感分类中达到了较高的识别性能。 展开更多
关键词 语音情感分析 景区评估 梅尔频率系数(MFCC) 长短期记忆(LSTM)网络
下载PDF
基于GMM模型和LPC-MFCC联合特征的声道谱转换研究 被引量:8
7
作者 曾歆 张雄伟 +2 位作者 孙蒙 苗晓孔 姚琨 《声学技术》 CSCD 北大核心 2020年第4期451-455,共5页
声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略... 声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略了不同声道特征参数之间可能存在的互补性。针对这一问题,研究了不同声道特征参数之间进行联合建模的方法,引入了一种由线性预测系数(LinearPredictionCoefficient,LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)联合构成的LPC-MFCC特征参数,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC联合特征参数的语音转换方法。为验证文中方法的有效性,仿真实验选取了基于GMM和LPC的语音转换方法进行对比,对多组实验数据进行主观和客观测试,结果表明,文中提出的语音转换方法可以获得相似度更高的转换语音。 展开更多
关键词 语音转换 声道转换 高斯混合模型 联合建模 线性预测系数-梅尔频率系数
下载PDF
基于鲁棒主成分分析和MFCC反复结构的歌声分离方法
8
作者 熊天 张天骐 +1 位作者 闻斌 吴超 《声学技术》 CSCD 北大核心 2023年第6期794-803,共10页
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效... 针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。 展开更多
关键词 鲁棒主成分分析(RPCA) 梅尔频率系数(MFCC) 歌声伴奏分离 反复结构
下载PDF
基于神经网络的视觉语音识别系统
9
作者 张晋宁 《电声技术》 2023年第11期101-104,共4页
视觉语音识别(Audio-Visual Speech Recognition,AVSR)系统结合音频和视觉信息,提供可靠的语音识别功能。为了提高AVSR系统在低信噪比(Signal-to-Noise Ratio,SNR)环境下的识别准确率,提出一种基于循环神经网络(Recurrent Neural Networ... 视觉语音识别(Audio-Visual Speech Recognition,AVSR)系统结合音频和视觉信息,提供可靠的语音识别功能。为了提高AVSR系统在低信噪比(Signal-to-Noise Ratio,SNR)环境下的识别准确率,提出一种基于循环神经网络(Recurrent Neural Network,RNN)的AVSR系统。该系统由音频特征提取模块、视觉特征提取模块以及音频和视觉特征联合模块3部分组成。特征联合模块利用RNN将基于梅尔频率倒谱系数的音频特征与OpenCV库中的Haar级联检测提取的视觉信息相结合,以提高系统识别率。实验结果表明,在低信噪比条件下,所提系统的正确识别率保持在89%左右。 展开更多
关键词 视觉语音识别 循环神经网络(RNN) 梅尔频率系数(MFCC) 信噪比(SNR)
下载PDF
基于MFCC的空中交通管制语音指令的特征提取研究
10
作者 王兴林 《电声技术》 2023年第6期68-72,共5页
随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义... 随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义。文章介绍空中交通管制指令的基本要求,详细分析语音信号特征提取的各个环节,通过梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取语音信号的特征,再使用高斯混合模型(Gaussian Mixture Model,GMM)进行训练和分类,从而实现语音信号的识别,具有一定的实际运用价值。 展开更多
关键词 语音信号 特征提取 梅尔频率系数(MFCC) 高斯混合模型(GMM) 模型训练
下载PDF
法庭语音比对中话者自身变化性建模方法研究 被引量:2
11
作者 王华朋 姜囡 +1 位作者 刘恩 晁亚东 《计算机工程与应用》 CSCD 北大核心 2019年第8期110-115,214,共7页
针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人... 针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人员语音样本比较时的得分模型,以获得能反映说话人自身变化性的统计模型。基于目前最新的法庭证据评估的似然比证据强度评估体系,使用MFCC(Mel Frequency Cepstral Coefficients)和GFCC(Gammatone Frequency Cepstral Coefficients)特征对该方法的有效性进行了验证,并对上述特征进行了特征级和决策级融合。实验结果表明:该方法在纯净语音环境和噪声环境下都具有很高的识别率和稳定性,并且特征级融合能进一步提高识别系统的性能。 展开更多
关键词 似然比 证据强度 建模 梅尔频率系数(MFCC) 伽马通频率系数(GFCC)
下载PDF
自适应模糊聚类LBG矢量量化算法 被引量:1
12
作者 孙燕 《计算机工程与应用》 CSCD 2014年第23期203-205,共3页
采用模糊聚类C均值聚类确定型心改进LBG算法,实现语音参数MFCC码本的矢量量化,实验结果表明,该算法有着与单一LBG算法相近的量化误差,自适应确定码本大小码,码本尺寸显著降低,减小码本的存储量。
关键词 LBG算法 自适应 梅尔频率系数(MFCC) 模糊聚类 矢量量化
下载PDF
多类型语音特征进化选择算法
13
作者 张小恒 谢文宾 李勇明 《计算机工程与应用》 CSCD 北大核心 2016年第14期150-155,219,共7页
基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式... 基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法(FSF-Wr GAF),该算法提取了四种类型的语音特征参数,通过链式智能体遗传算法和GMM-UBM进行封装式动态特征选择,获取高精度的识别准确率。采用了多种指标完成该算法的性能测试。实验结果表明,该算法具体实现过程简便,改进效果明显,较同类算法在多项指标(识别率,EER,DET曲线)上都有显著提高。 展开更多
关键词 说话人识别 多类型语音特征 链式智能体遗传算法 伽马通滤波器倒系数(GFCC) 梅尔频率系数(MFCC) 线性预测倒系数(LPCC)
下载PDF
用于说话人识别的MFCC的改进算法 被引量:8
14
作者 张伟伟 杨鼎才 《电子测量技术》 2009年第8期118-121,共4页
在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于... 在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于平滑幅度谱包络的MFCC的改进参数,该参数不直接对语音短时幅度谱进行提取,而是先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,以降低基音频率对其的影响。 展开更多
关键词 说话人识别 梅尔系数(MFCC) 基音频率
下载PDF
无线网络中基于能量有效性的吞吐量跨层控制协议 被引量:3
15
作者 王心霖 许成谦 《电子测量技术》 2010年第5期54-57,共4页
针对无线网络中ARQ协议的传输能耗,建立了每比特有效数据的等效能耗数学模型和设定了以链路最低能耗为能量有效性的优化目标。并依据传输能耗的研究结论将数据链路层的子包传输机制与物理层的自适应调制编码技术(AMC)相结合,提出了一种... 针对无线网络中ARQ协议的传输能耗,建立了每比特有效数据的等效能耗数学模型和设定了以链路最低能耗为能量有效性的优化目标。并依据传输能耗的研究结论将数据链路层的子包传输机制与物理层的自适应调制编码技术(AMC)相结合,提出了一种基于能量有效性的吞吐量跨层控制协议。该协议以最大化系统吞吐量为目的,并实现了AMC和子包机制的能量有效性控制。仿真结果显示该协议可以使系统吞吐量的性能达到整体最佳和使数据传输能耗达到能量有效性的目标。 展开更多
关键词 说话人识别 梅尔系数(MFCC) 基音频率
下载PDF
基于余弦相似度的动态语音特征提取算法 被引量:11
16
作者 艾佳琪 左毅 +3 位作者 刘君霞 贺培超 李铁山 陈俊龙 《计算机应用研究》 CSCD 北大核心 2020年第S02期147-149,共3页
为进一步研究语音特征提取方法,分析了基于逆离散余弦变换倒谱系数(IDCT CC)的语音特征,利用频域语音信号间的余弦相似度(cosine similarity)特性将IDCT CC进行层次聚类,得到14维频域语音特征向量(feature vector),称之为C-vector。实验... 为进一步研究语音特征提取方法,分析了基于逆离散余弦变换倒谱系数(IDCT CC)的语音特征,利用频域语音信号间的余弦相似度(cosine similarity)特性将IDCT CC进行层次聚类,得到14维频域语音特征向量(feature vector),称之为C-vector。实验中,建立基于高斯混合模型(Gaussian mixture model,GMM)的说话人识别模型对C-vector进行识别精度和时间的讨论,并与经典的梅尔频率倒谱系数和等频域倒谱系数(histogram of DCT cepstrum coefficients,HDCC)进行对比实验。通过具体的实验结果比较,提出的C-vector在识别精度方面比MFCC和HDCC分别高出7%和5%。而且,C-vector在多人语音集下表现出的识别能力更为优异。 展开更多
关键词 说话人识别 语音特征 梅尔频率系数(Mel-frequency cepstral coefficients MFCC) 逆离散余弦变换倒系数(inrerse discrete cosine tromsform cepstrwm coefficient IDCT CC) 余弦相似度 层次聚类分析
下载PDF
基于集成学习的铁路隧道空洞敲击检查声音识别 被引量:4
17
作者 高磊 刘振奎 +2 位作者 张昊宇 魏晓悦 张奎 《振动与冲击》 EI CSCD 北大核心 2022年第14期58-63,83,共7页
隧道衬砌空洞敲击检查方法是目前铁路隧道中应用最多的检查方法,但其空洞识别和数据的记录均靠人工完成。为实现铁路隧道空洞敲击检查声音智能识别,将采集到的隧道敲击检查音频文件进行预处理,选取645个声音样本,提取24维梅尔频率倒谱系... 隧道衬砌空洞敲击检查方法是目前铁路隧道中应用最多的检查方法,但其空洞识别和数据的记录均靠人工完成。为实现铁路隧道空洞敲击检查声音智能识别,将采集到的隧道敲击检查音频文件进行预处理,选取645个声音样本,提取24维梅尔频率倒谱系数(Mel frequency cepstrum coefficients,MFCC)作为声音样本的声学特征参数,通过集成算法(梯度提升决策树GBDT)训练样本声学特征,建立隧道空洞敲击检查声音分类模型,最后将该模型应用于实际铁路隧道空洞敲击检查声音识别分类。实例研究表明:与优化的支持向量机(cross-validation-support vector machine,CV-SVM)模型和改进径向基神经网络(particle swarm optimization algorithm-radial basis function neural network,PSO-RBF)模型相比,GBDT集成算法模型具有更高的准确率和更少的运算时间,在面对异常数据时具有更强的稳定性,能够准确地根据铁路隧道空洞敲击检查声音诊断衬砌后是否存在空洞。 展开更多
关键词 铁路隧道 声音识别 梅尔频率系数(MFCC) 梯度提升决策树 支持向量机(SVM) 改进RBF神经网络
下载PDF
基于声纹识别的旋翼飞行器检测系统 被引量:2
18
作者 雷丁 田橪 +1 位作者 王柳彬 欧静兰 《电子世界》 2017年第12期167-167,共1页
随着声纹识别及其相关电子技术的飞速发展,基于声纹识别的各种技术正逐步应用于各个领域。本文介绍了检测旋翼飞行器声音信号的基本原理,以及用数字信号处理器实现对旋翼飞行器的检测和预警方法,阐述了声纹识别在DSP平台下的实现。本系... 随着声纹识别及其相关电子技术的飞速发展,基于声纹识别的各种技术正逐步应用于各个领域。本文介绍了检测旋翼飞行器声音信号的基本原理,以及用数字信号处理器实现对旋翼飞行器的检测和预警方法,阐述了声纹识别在DSP平台下的实现。本系统以梅尔频率倒谱系数(MFCC)为特征参数,采用动态时间规整(DTW)算法实现声音参数特征匹配,实现对于直径范围为40~60cm的旋翼飞行器的短距离检测和预警,并用MATLAB软件进行了系统仿真,进而把检测技术应用到DSP硬件系统中,给出了实验结果和误差分析。 展开更多
关键词 DSP 声纹识别 梅尔频率系数(MFCC) 动态时间规整(DTW)算法
下载PDF
基于音频技术的白羽肉鸡咳嗽识别算法研究 被引量:17
19
作者 秦伏亮 沈明霞 +3 位作者 刘龙申 孙玉文 郑荷花 陆鹏宇 《南京农业大学学报》 CAS CSCD 北大核心 2020年第2期372-378,共7页
[目的]咳嗽是肉鸡呼吸道发病初期的主要症状,为实现肉鸡呼吸道疾病非接触式监测,本研究提出一种肉鸡咳嗽声识别算法。[方法]利用网络拾音器采集白羽肉鸡咳嗽及其他声音数据,选用最小均方误差(MMSE)谱减法对其进行滤波去噪;经预处理后人... [目的]咳嗽是肉鸡呼吸道发病初期的主要症状,为实现肉鸡呼吸道疾病非接触式监测,本研究提出一种肉鸡咳嗽声识别算法。[方法]利用网络拾音器采集白羽肉鸡咳嗽及其他声音数据,选用最小均方误差(MMSE)谱减法对其进行滤波去噪;经预处理后人工截取肉鸡咳嗽样本与噪声样本;提取样本基于小波变换的梅尔频率倒谱系数(WMFCC)特征,构建高斯混合模型-隐马尔科夫模型(GMM-HMM)识别算法,训练并调整优化咳嗽识别模型。[结果]试验表明,在隐状态数为3,高斯元个数为3时,该模型在测试集上达到最优识别效果,正确率为98.7%。将算法识别结果与人工分类结果比较,肉鸡咳嗽识别算法的平均准确率为95%。[结论]本文提出的肉鸡咳嗽算法模型能较好地检测肉鸡咳嗽,为肉鸡呼吸道疾病的早期自动预警提供技术支持。 展开更多
关键词 白羽肉鸡 咳嗽识别 最小均方误差(MMSE)减法 基于小波变换的梅尔频率系数(WMFCC) 机器学习
下载PDF
基于MFCC特征和GWO-SVM的托辊故障诊断 被引量:4
20
作者 贺志军 李军霞 +2 位作者 张伟 樊文瑞 李振华 《机床与液压》 北大核心 2022年第15期188-193,共6页
针对目前带式输送机托辊故障诊断方法存在接触式测量、准确率低、井下大范围检测困难等问题,提出了一种基于MFCC特征和参数优化SVM的托辊故障诊断方法。利用变分模态分解(VMD)将采集到的托辊声音信号分解为若干本征模态分量(IMF),并基... 针对目前带式输送机托辊故障诊断方法存在接触式测量、准确率低、井下大范围检测困难等问题,提出了一种基于MFCC特征和参数优化SVM的托辊故障诊断方法。利用变分模态分解(VMD)将采集到的托辊声音信号分解为若干本征模态分量(IMF),并基于包络熵和峭度组成的复合指标优选IMF分量;提取所选分量的梅尔倒频谱系数(MFCC)作为特征,利用灰狼优化算法(GWO)优化SVM参数;将样本特征向量输入GWO-SVM中进行故障分类。结果表明:对于正常托辊、托辊内圈故障、托辊外圈故障、托辊卡死4种工况,该方法故障识别平均准确率在95%以上。与单一指标相比,复合指标提取的IMF分量故障特性代表性更好;与其他优化算法相比,该方法的识别准确率更高,分类速度更快。 展开更多
关键词 声音信号 梅尔频率系数(MFCC) 托辊 灰狼算法 故障诊断
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部