【目的】为解决群养环境下生猪音频难以分离与识别的问题,提出基于欠定盲源分离与E C A-EfficientNetV2的生猪状态音频识别方法。【方法】以仿真群养环境下4类生猪音频信号作为观测信号,将信号稀疏表示后,通过层次聚类估计出信号混合矩...【目的】为解决群养环境下生猪音频难以分离与识别的问题,提出基于欠定盲源分离与E C A-EfficientNetV2的生猪状态音频识别方法。【方法】以仿真群养环境下4类生猪音频信号作为观测信号,将信号稀疏表示后,通过层次聚类估计出信号混合矩阵,并利用lp范数重构算法求解lp范数最小值以完成生猪音频信号重构。将重构信号转化为声谱图,分为进食声、咆哮声、哼叫声和发情声4类,利用ECA-EfficientNetV2网络模型识别音频,获取生猪状态。【结果】混合矩阵估计的归一化均方误差最低为3.266×10^(−4),分离重构的音频信噪比在3.254~4.267 dB之间。声谱图经ECA-EfficientNetV2识别检测,准确率高达98.35%;与经典卷积神经网络ResNet50和VGG16对比,准确率分别提升2.88和1.81个百分点;与原EfficientNetV2相比,准确率降低0.52个百分点,但模型参数量减少33.56%,浮点运算量(FLOPs)降低1.86 G,推理时间减少9.40 ms。【结论】基于盲源分离及改进EfficientNetV2的方法,轻量且高效地实现了分离与识别群养生猪音频信号。展开更多
针对在生猪音频识别中单一特征参数无法充分地表征猪声信息的问题,提出了基于梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与伽马通倒谱系数(Gammatone Frequency Cepstral Coefficient,GF-CC)的生猪音频融合特征生成方法。...针对在生猪音频识别中单一特征参数无法充分地表征猪声信息的问题,提出了基于梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与伽马通倒谱系数(Gammatone Frequency Cepstral Coefficient,GF-CC)的生猪音频融合特征生成方法。首先,以5种猪声为研究对象,利用功率谱减法和双门限端点检测法对猪声样本进行预处理。其次,提取MFCC、GFCC和它们的一阶差分参数,将MFCC+∆MFCC、GFCC+∆GFCC直接叠加得到高维的融合特征,为了降低高维特征的冗余度,利用增减分量法对其进行降维,最后将降维后的融合特征输入至Bi-LSTM网络模型进行分类识别。实验结果表明,相对于传统的单一特征MFCC、GFCC在识别率上分别提升了14.33%和18.63%,且在不同噪声环境下,融合特征具有比其他特征更好的鲁棒性和识别性能。展开更多
文摘针对在生猪音频识别中单一特征参数无法充分地表征猪声信息的问题,提出了基于梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与伽马通倒谱系数(Gammatone Frequency Cepstral Coefficient,GF-CC)的生猪音频融合特征生成方法。首先,以5种猪声为研究对象,利用功率谱减法和双门限端点检测法对猪声样本进行预处理。其次,提取MFCC、GFCC和它们的一阶差分参数,将MFCC+∆MFCC、GFCC+∆GFCC直接叠加得到高维的融合特征,为了降低高维特征的冗余度,利用增减分量法对其进行降维,最后将降维后的融合特征输入至Bi-LSTM网络模型进行分类识别。实验结果表明,相对于传统的单一特征MFCC、GFCC在识别率上分别提升了14.33%和18.63%,且在不同噪声环境下,融合特征具有比其他特征更好的鲁棒性和识别性能。