基于多维神经网络深度特征融合的鸟鸣识别算法被引量：1

Deep Feature Fusion of Multi-Dimensional Neural Network for Bird Call Recognition

下载PDF

导出

摘要为了进一步提高夜间迁徙鸟鸣监测的准确率,提出一种基于多维神经网络深度特征融合的鸟鸣识别算法。首先,提取鸟鸣对数尺度的梅尔谱图作为VGG Style模型的训练特征,增强时频谱图的能量分布,通过Mix up数据混合生成虚拟数据以减少模型的过拟合。之后,将预训练的VGG Style作为特征提取器对每一段鸟鸣提取深度特征。鉴于不同维度模型的互补性,该文提出分别使用1维CNN-LSTM、2维VGG Style与3维DenseNet121模型作为特征提取器生成高级特征。对于1维CNN-LSTM,使用小波分解作为池化方法,分别对鸟鸣时、频域进行9层小波分解,生成多层LBP特征以获取更丰富的时频信息。最后,对CNN-LSTM与DenseNet121的全连接层进行优化,减少模型参数,提高实时性。实验结果表明,通过融合多维神经网络的深度特征,使用浅层分类器在含有43种鸟类的CLO-43SD数据集中,获得了93.89%的平衡准确率,相较于最新的Mel-VGG与Subnet-CNN融合模型,平衡准确率提高了7.58%。 In order to improve the accuracy of bird sound monitoring during night migration,this paper proposed a deep feature fusion system of multi-dimensional neural network for bird sound classification.Firstly,we proposed an improved VGG Style model,which used log-scaled Mel spectrogram as training feature to enhance the energy distribution of spectrogram,and generate virtual data by mix up to reduce model over-fitting.Then,the pre-trained VGG Style was used to generate deep features for each bird sound.In view of the complementarity of different dimensional models,1D CNN-LSTM,2D VGG Style and 3D Dense Net121 were employed as feature extractors to generate advanced features.For 1D CNN-LSTM,in order to obtain richer time-frequency information,the wavelet decomposition was used as pooling method to extract multi-level LBP features from time domain and frequency domain respectively as training input.Meanwhile,the fully connected layer of CNN-LSTM and Dense Net121 were optimized to reduce model parameters and improve real-time performance.Finally,the deep features of three models were fused and fed to K-nearest neighbor for classification,which got the balanced-accuracy of 93.89%for a public dataset CLO-43SD of 5428 flight calls spanning 43 species and exceeded the latest fusion of Mel-VGG and Subnet-CNN by 7.58%.

作者吉训生江昆谢捷 JI Xunsheng;JIANG Kun;XIE Jie(School of Internet of Things Engineering,Jiangnan University,Wuxi,Jiangsu 214122,China;Key Laboratory of Advanced Process Control for Light Industry(Ministry of Education),Jiangnan University,Wuxi,Jiangsu 214122,China;Jiangsu Key Laboratory of Advanced Food Manufacturing Equipment and Technology,Jiangnan University,Wuxi,Jiangsu 214122,China)

机构地区江南大学物联网工程学院“物联网应用技术”教育部工程中心轻工业先进过程控制重点实验室(教育部) 江苏省先进食品制造装备与技术重点实验室江南大学物联网工程学院

出处《信号处理》 CSCD 北大核心 2022年第4期844-853,共10页 Journal of Signal Processing

基金国家自然科学基金(61902154) 中央大学基础研究基金(JUSRP11924) 江苏省自然科学基金(BK2019043526) 江苏省重点研发项目-现代农业(BE2018334)。

关键词鸟鸣识别 1维CNN-LSTM 2维VGG Style 3维DenseNet121 深度特征融合 bird sound classification 1D CNN-LSTM 2D VGG Style 3D DenseNet121 deep feature fusion

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1袁非牛,李钢,夏雪,章琳,周宇.采用聚合Gabor核和局部二元模式的烟雾识别方法[J].小型微型计算机系统,2019,40(4):827-833. 被引量：5
2李钢,袁非牛,夏雪,章琳,雷帮军.改进局部三值模式的烟雾识别和纹理分类[J].计算机科学与探索,2020,14(7):1221-1231. 被引量：2
3谢志华.DCT结合特征选择的红外人脸识别[J].计算机科学与探索,2014,8(5):614-621. 被引量：1

二级参考文献16

1张玉华,王欣.基于二维最大边缘准则和DCT的人脸识别方法[J].光电子．激光,2009,20(10):1361-1364. 被引量：1
2华顺刚,周羽,刘婷.基于PCA+LDA的热红外成像人脸识别[J].模式识别与人工智能,2008,21(2):160-164. 被引量：25
3李波,姚春莲,李炜,郑锦.利用相邻帧和背景信息的运动对象检测[J].电子学报,2008,36(11):2154-2159. 被引量：14
4尹洪涛,付平,沙学军.基于DCT和线性判别分析的人脸识别[J].电子学报,2009,37(10):2211-2214. 被引量：39
5谢志华,伍世虔,方志军.基于血流图的小波域分块DCT+FLD红外人脸识别方法[J].计算机科学,2009,36(12):290-293. 被引量：3
6谢永林.LDA算法及其在人脸识别中的应用[J].计算机工程与应用,2010,46(19):189-192. 被引量：29
7罗胜,Jiang Yuzheng.视频检测烟雾的研究现状[J].中国图象图形学报,2013,18(10):1225-1236. 被引量：26
8何大超,娄小平,唐辉.基于动态特性的实时视频烟雾检测[J].计算机应用与软件,2014,31(2):201-204. 被引量：7
9袁非牛,夏雪,李钢,章琳,史劲亭.面向烟雾识别与纹理分类的Gabor网络[J].中国图象图形学报,2019,24(2):269-281. 被引量：19
10潘朝峰,杨树森,陈宁.基于图像熵的火灾烟雾识别[J].江苏科技大学学报（自然科学版）,2015,29(1):52-57. 被引量：2

共引文献5

1程广涛,巩家昌,赵洪伟.基于膨胀卷积和稠密连接的烟雾识别方法[J].计算机工程,2020,46(4):253-259. 被引量：3
2李钢,袁非牛,夏雪,章琳,雷帮军.改进局部三值模式的烟雾识别和纹理分类[J].计算机科学与探索,2020,14(7):1221-1231. 被引量：2
3张天琪,杨伟东,张姣姣,彭凯.视频车辆黑烟检测算法研究进展[J].中国图象图形学报,2021,26(2):316-333. 被引量：2
4徐守坤,符心宇,封晓晨,王雨生,石林.基于多特征与DCNN的红外SF_(6)泄漏检测方法研究[J].计算机应用与软件,2021,38(6):134-142. 被引量：1
5张政,何慧.一种改进的DETR输电线通道山火烟雾检测方法[J].小型微型计算机系统,2024,45(3):670-675.

同被引文献1

1李怀城,杨道武,温治芳,王亚楠,陈爱斌.基于Inception-CSA深度学习模型的鸟鸣分类[J].华中农业大学学报,2023,42(3):97-104. 被引量：1

引证文献1

1蔡建民,何培宇,杨智鹏,李露莹,赵启军,潘帆.基于深度特征融合的鸟鸣识别方法及其可解释性分析[J].生物多样性,2023,31(7):138-147. 被引量：1

二级引证文献1

1李柏灿,张军国,张长春,王丽凤,徐基良,刘利.基于TC-YOLO模型的北京珍稀鸟类识别方法[J].生物多样性,2024,32(5):123-137.

1雷蕾,郑嘉.泰勒幂法则对中国人口死亡率的检验[J].中央民族大学学报（自然科学版）,2018,27(2):83-89. 被引量：1
2谭喜莹.对抗感冒“狂补”维C得不偿失[J].自我保健,2022(5):70-70.
3徐帅,刘鲁涛.P-Net框架下的小样本雷达信号识别算法[J].哈尔滨工程大学学报,2022,43(5):739-744. 被引量：1
4任文璐.华北制药在美维C反垄断案的法律问题研究[J].中国价格监管与反垄断,2022(6):37-40.
5张瑞娟,朱亚珠.复合处理对水蜜桃保鲜效果的研究[J].农产品加工,2022(10):26-30. 被引量：3
6李佳哲,胡咏梅.我国高校教师薪酬满意度测量工具的编制与质量评估[J].现代教育管理,2022(2):102-110. 被引量：5
7施蔚青,刘洪兵,何四平.基于视频图像的着装规范性识别研究[J].机械设计与制造工程,2022,51(5):121-124.
8胖大夫信箱[J].当代老年,2022(6):40-40.
9瞿伟哲.基于Matlab的模拟通信调制信号仿真分析[J].计算机与网络,2022,48(9):52-55.
10陶洋,黎春燕,梁志芳,杨皓诚.基于对抗学习的电子鼻传感器漂移补偿算法[J].传感器与微系统,2022,41(6):109-113. 被引量：2

信号处理

2022年第4期

浏览历史

内容加载中请稍等...

基于多维神经网络深度特征融合的鸟鸣识别算法被引量：1

参考文献3

二级参考文献16

共引文献5

同被引文献1

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多维神经网络深度特征融合的鸟鸣识别算法 被引量：1

参考文献3

二级参考文献16

共引文献5

同被引文献1

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多维神经网络深度特征融合的鸟鸣识别算法被引量：1