-
题名基于多维神经网络深度特征融合的鸟鸣识别算法
被引量:2
- 1
-
-
作者
吉训生
江昆
谢捷
-
机构
江南大学物联网工程学院“物联网应用技术”教育部工程中心
轻工业先进过程控制重点实验室(教育部)
江苏省先进食品制造装备与技术重点实验室
江南大学物联网工程学院
-
出处
《信号处理》
CSCD
北大核心
2022年第4期844-853,共10页
-
基金
国家自然科学基金(61902154)
中央大学基础研究基金(JUSRP11924)
+1 种基金
江苏省自然科学基金(BK2019043526)
江苏省重点研发项目-现代农业(BE2018334)。
-
文摘
为了进一步提高夜间迁徙鸟鸣监测的准确率,提出一种基于多维神经网络深度特征融合的鸟鸣识别算法。首先,提取鸟鸣对数尺度的梅尔谱图作为VGG Style模型的训练特征,增强时频谱图的能量分布,通过Mix up数据混合生成虚拟数据以减少模型的过拟合。之后,将预训练的VGG Style作为特征提取器对每一段鸟鸣提取深度特征。鉴于不同维度模型的互补性,该文提出分别使用1维CNN-LSTM、2维VGG Style与3维DenseNet121模型作为特征提取器生成高级特征。对于1维CNN-LSTM,使用小波分解作为池化方法,分别对鸟鸣时、频域进行9层小波分解,生成多层LBP特征以获取更丰富的时频信息。最后,对CNN-LSTM与DenseNet121的全连接层进行优化,减少模型参数,提高实时性。实验结果表明,通过融合多维神经网络的深度特征,使用浅层分类器在含有43种鸟类的CLO-43SD数据集中,获得了93.89%的平衡准确率,相较于最新的Mel-VGG与Subnet-CNN融合模型,平衡准确率提高了7.58%。
-
关键词
鸟鸣识别
1维CNN-LSTM
2维VGG
Style
3维DenseNet121
深度特征融合
-
Keywords
bird sound classification
1D CNN-LSTM
2D VGG Style
3D DenseNet121
deep feature fusion
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-