期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多级残差网络的环境声音分类方法 被引量:4
1
作者 曾金芳 李友明 +2 位作者 杨恢先 张钰 胡雅欣 《数据采集与处理》 CSCD 北大核心 2021年第5期960-968,共9页
为了对环境声音进行更好的识别和分类,提出了基于多级残差网络(Multilevel residual network,Mul-EnvResNet)的环境声音分类方法。对声音事件进行时标和基频压扩之后,提取其梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC... 为了对环境声音进行更好的识别和分类,提出了基于多级残差网络(Multilevel residual network,Mul-EnvResNet)的环境声音分类方法。对声音事件进行时标和基频压扩之后,提取其梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs),以及它们的差分作为特征参数送入MulEnvResNet对声音事件进行分类。实验数据集采用ESC-50,将Mul-EnvResNet模型与端到端的卷积神经网络(EnvNet)、基于注意力机制的循环神经网络(Attention based convolutional recurrent neural network,ACRNN),以及受限卷积玻尔兹曼机的无监督滤波器组模型(Convolutional restricted Boltzmann machine,ConvRBM)进行对比实验。实验结果表明,Mul-EnvResNet取得了89.32%的最佳分类准确率,相较上述3种模型在分类准确率上分别有18.32%、3.22%、2.82%的提升,相较于其他的声音分类方法也均有明显的优势。 展开更多
关键词 环境声音分类 多级残差网络 时标压扩 基频
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部