针对在生猪音频识别中单一特征参数无法充分地表征猪声信息的问题,提出了基于梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与伽马通倒谱系数(Gammatone Frequency Cepstral Coefficient,GF-CC)的生猪音频融合特征生成方法。...针对在生猪音频识别中单一特征参数无法充分地表征猪声信息的问题,提出了基于梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与伽马通倒谱系数(Gammatone Frequency Cepstral Coefficient,GF-CC)的生猪音频融合特征生成方法。首先,以5种猪声为研究对象,利用功率谱减法和双门限端点检测法对猪声样本进行预处理。其次,提取MFCC、GFCC和它们的一阶差分参数,将MFCC+∆MFCC、GFCC+∆GFCC直接叠加得到高维的融合特征,为了降低高维特征的冗余度,利用增减分量法对其进行降维,最后将降维后的融合特征输入至Bi-LSTM网络模型进行分类识别。实验结果表明,相对于传统的单一特征MFCC、GFCC在识别率上分别提升了14.33%和18.63%,且在不同噪声环境下,融合特征具有比其他特征更好的鲁棒性和识别性能。展开更多
文摘针对在生猪音频识别中单一特征参数无法充分地表征猪声信息的问题,提出了基于梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与伽马通倒谱系数(Gammatone Frequency Cepstral Coefficient,GF-CC)的生猪音频融合特征生成方法。首先,以5种猪声为研究对象,利用功率谱减法和双门限端点检测法对猪声样本进行预处理。其次,提取MFCC、GFCC和它们的一阶差分参数,将MFCC+∆MFCC、GFCC+∆GFCC直接叠加得到高维的融合特征,为了降低高维特征的冗余度,利用增减分量法对其进行降维,最后将降维后的融合特征输入至Bi-LSTM网络模型进行分类识别。实验结果表明,相对于传统的单一特征MFCC、GFCC在识别率上分别提升了14.33%和18.63%,且在不同噪声环境下,融合特征具有比其他特征更好的鲁棒性和识别性能。