期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Squeeze-Excitation的音频场景分类研究 被引量:1
1
作者 乔高杰 廖闻剑 《电子设计工程》 2021年第19期179-183,188,共6页
目前音频场景分类任务中主要使用对数梅尔谱图作为特征,大多数研究人员选择对每个通道的特征信息进行处理,鲜有研究考虑特征通道间信息的问题。文中将图像分类中有着较好效果的Squeeze-Excitation(SE)模块引入到音频场景分类任务中,以... 目前音频场景分类任务中主要使用对数梅尔谱图作为特征,大多数研究人员选择对每个通道的特征信息进行处理,鲜有研究考虑特征通道间信息的问题。文中将图像分类中有着较好效果的Squeeze-Excitation(SE)模块引入到音频场景分类任务中,以解决未考虑特征通道信息的问题。在基础的CNN网络结构中添加SE模块可以较好地考虑特征通道间的信息,进而提高网络的表达能力,同时还探究了SE模块添加的位置与数量对音频场景分类效果的影响。实验结果证明,添加SE模块能够提高场景分类的准确率,相比于基线系统分类准确率提高了1.1%;只有当SE模块添加在特征通道数比较多的卷积块之后才能够达到比较好的效果,而增加SE模块的数量相较于基线系统分类准确率提高不明显,为0.3%。 展开更多
关键词 音频场景分类 Squeeze-Excitation dcase2019 卷积神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部